Fugu-MT 論文翻訳(概要): MTSQL-R1: Towards Long-Horizon Multi-Turn Text-to-SQL via Agentic Training

論文の概要: MTSQL-R1: Towards Long-Horizon Multi-Turn Text-to-SQL via Agentic Training

arxiv url: http://arxiv.org/abs/2510.12831v1
Date: Sun, 12 Oct 2025 16:12:05 GMT
ステータス: 翻訳完了
システム内更新日: 2025-10-16 20:13:28.342063
Title: MTSQL-R1: Towards Long-Horizon Multi-Turn Text-to-SQL via Agentic Training
Title（参考訳）: MTSQL-R1:エージェントトレーニングによる長距離マルチTurnテキストからSQLへ
Authors: Taicheng Guo, Hai Wang, ChaoChun Liu, Mohsen Golalikhani, Xin Chen, Xiangliang Zhang, Chandan K. Reddy,
Abstract要約: 本稿では,マルチターンテキスト・トゥ・ザ・ガイドのためのエージェント・トレーニング・フレームワークMT-R1を提案する。我々は,エージェントが (i) 実行フィードバックのためのデータベースと (ii) 検証のための永続的な対話メモリと相互作用するマルコフ決定プロセス (MDP) としてタスクをキャストした。実験により、MT-R1は強いベースラインを一貫して上回り、会話の意味解析における環境駆動型検証とメモリ誘導型洗練の重要性を強調した。
参考スコア（独自算出の注目度）: 31.290164208264745
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multi-turn Text-to-SQL aims to translate a user's conversational utterances into executable SQL while preserving dialogue coherence and grounding to the target schema. However, most existing systems only regard this task as a simple text translation task and follow a short-horizon paradigm, generating a query per turn without execution, explicit verification, and refinement, which leads to non-executable or incoherent outputs. We present MTSQL-R1, an agentic training framework for long-horizon multi-turn Text-to-SQL. We cast the task as a Markov Decision Process (MDP) in which an agent interacts with (i) a database for execution feedback and (ii) a persistent dialogue memory for coherence verification, performing an iterative propose to execute -> verify -> refine cycle until all checks pass. Experiments on COSQL and SPARC demonstrate that MTSQL-R1 consistently outperforms strong baselines, highlighting the importance of environment-driven verification and memory-guided refinement for conversational semantic parsing. Full recipes (including code, trained models, logs, reasoning trajectories, etc.) will be released after the internal review to contribute to community research.
Abstract（参考訳）: Multi-turn Text-to-SQLは、対話コヒーレンスを保持し、ターゲットスキーマに接地しながら、ユーザの会話的発話を実行可能なSQLに変換することを目的としている。しかし、既存のほとんどのシステムは、このタスクを単純なテキスト翻訳タスクとみなし、短い水平パラダイムに従って、実行せずに1ターンにクエリを生成し、明示的な検証と改善を行い、実行不可能または一貫性のない出力をもたらす。 MTSQL-R1は,長期マルチターンテキスト・トゥ・SQLのためのエージェント・トレーニング・フレームワークである。我々は、エージェントが対話するマルコフ決定プロセス(MDP)としてタスクをキャストした。 (i)実行フィードバックのためのデータベース i) コヒーレンス検証のための永続的な対話メモリで、すべてのチェックが通過するまで、実行 -> 検証 -> 精製サイクルを反復的に提案する。 COSQLとSPARCの実験では、MTSQL-R1は強いベースラインを一貫して上回り、環境駆動型検証の重要性と、対話型セマンティック解析におけるメモリガイダンスの洗練を強調している。コード、トレーニングされたモデル、ログ、推論トラジェクトリなどを含む完全なレシピは、コミュニティ調査に貢献するために内部レビュー後にリリースされる。

関連論文リスト

Monte Carlo Tree Search with Reasoning Path Refinement for Small Language Models in Conversational Text-to-NoSQL [20.156191782890797]
本稿では,自然言語質問,データベース,対話履歴を問う問合せを生成するConversational Text-to-Noタスクを提案する。そこで我々は,クエリ固有の推論機能を備えた小さな言語モデルを実現するフレームワークであるStage-MCTSを提案する。提案手法は最先端の大規模推論モデルより優れ,実行値の一致精度を最大7.93%向上させる。
論文参考訳（メタデータ） (2026-02-13T03:35:38Z)
SQL-Trail: Multi-Turn Reinforcement Learning with Interleaved Feedback for Text-to-SQL [20.49395306069103]
テキスト・ツー・ワン・ジェネレーションのためのマルチターン強化学習(RL)エージェント・フレームワークを提案する。 1ショットでクエリを生成するのではなく、SQL-Trailはデータベース環境と対話し、実行フィードバックを使用して予測を反復的に洗練する。提案手法は, エージェントの相互作用深度を問合せ難易度に合わせるための適応的なターン予算配分機構と, sqlの正しさと効率的な探索を両立させる複合報酬パネルの2つを主眼とする。
論文参考訳（メタデータ） (2026-01-25T05:16:52Z)
Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文参考訳（メタデータ） (2025-11-26T13:52:50Z)
MARS-SQL: A multi-agent reinforcement learning framework for Text-to-SQL [22.59453421744114]
基本的タスク分解と対話型強化学習(RL)を組み合わせた新しいマルチエージェントフレームワークMARS-を紹介する。実験の結果、MARS-はBIRDセットで77.84%、スパイダーテストセットで89.84%の最先端の実行精度を達成した。
論文参考訳（メタデータ） (2025-11-02T16:55:30Z)
HI-SQL: Optimizing Text-to-SQL Systems through Dynamic Hint Integration [1.3927943269211591]
テキスト・ツー・ジェネレーションは自然言語とデータベースのギャップを埋め、ユーザーは専門知識を必要とせずにデータをクエリできる。履歴クエリログを利用した新しいヒント生成機構を組み込んだパイプラインHI-theを提案する。先行クエリを解析することにより、マルチテーブルおよびネストされた操作の複雑さを扱うことに焦点を当てたコンテキストヒントを生成する。提案手法は,LCM生成クエリのクエリ精度を大幅に向上し,呼び出しやレイテンシの面で効率性を確保した。
論文参考訳（メタデータ） (2025-06-11T12:07:55Z)
Sparks of Tabular Reasoning via Text2SQL Reinforcement Learning [0.12289361708127876]
この研究は、Text-to-the-taskを、大規模言語モデル(LLM)にデータの推論と操作を教えるための経路として再構成した。本稿では,テーブルフィールドをトラバースし,フィルタし,集約する方法をモデルに教える2段階フレームワークを提案する。提案手法は,BIRD や CRT-QA などの推論集約型データセットに対して,理論的に有意な向上を実現している。
論文参考訳（メタデータ） (2025-04-23T19:02:04Z)
SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。 Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。 emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文参考訳（メタデータ） (2023-11-06T05:24:06Z)
SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文参考訳（メタデータ） (2023-05-26T21:39:05Z)
MIGA: A Unified Multi-task Generation Framework for Conversational Text-to-SQL [48.34333725045152]
ほとんどの最先端の対話型テキスト生成手法は、T5のような事前訓練された言語モデル(PLM)と互換性がない。 PLMの対話型テキスト処理能力を活用した2段階統合MultI-task frAmeme(MIGA)を提案する。
論文参考訳（メタデータ） (2022-12-19T07:14:32Z)
STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing [64.80483736666123]
文脈依存型テキスト・ツー・パースのための新しい事前学習フレームワークSTARを提案する。さらに,STARを事前学習するための大規模コンテキスト依存型テキスト対話コーパスを構築した。大規模な実験により、STARは2つの下流ベンチマークで新しい最先端のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (2022-10-21T11:30:07Z)
A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文参考訳（メタデータ） (2022-08-29T14:24:13Z)
Pay More Attention to History: A Context Modeling Strategy for Conversational Text-to-SQL [8.038535788630542]
会話型テキスト・ツー・ドメインの最も難解な問題の1つは、マルチターンクエリのセマンティクスをモデル化することである。本稿では,各ターンの追加による意味変化の明示的モデル化とコンテキスト全体の要約により,より優れた性能が得られることを示す。
論文参考訳（メタデータ） (2021-12-16T09:41:04Z)
Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。 BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文参考訳（メタデータ） (2020-12-23T12:33:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。