論文の概要: TRUST-SQL: Tool-Integrated Multi-Turn Reinforcement Learning for Text-to-SQL over Unknown Schemas
- arxiv url: http://arxiv.org/abs/2603.16448v1
- Date: Tue, 17 Mar 2026 12:30:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.274121
- Title: TRUST-SQL: Tool-Integrated Multi-Turn Reinforcement Learning for Text-to-SQL over Unknown Schemas
- Title(参考訳): TRUST-SQL:未知のスキーマ上でのテキストからSQLへのツール統合型マルチスレッド強化学習
- Authors: Ai Jian, Xiaoyun Zhang, Wanrou Du, Jingqing Ruan, Jiangbo Pei, Weipeng Zhang, Ke Zeng, Xunliang Cai,
- Abstract要約: 我々はTRUST(Truthful Reasoning with Unknown via Tools)を提案する。
我々は,このタスクを,自律エージェントが構造化された4相プロトコルを用いて検証された推論を行う部分観測可能なマルコフ決定プロセスとして定式化する。
トークンレベルマスキングの利点を適用することで、この戦略は、調査報酬を実行結果から分離し、クレジットの割り当てを解決する。
- 参考スコア(独自算出の注目度): 22.65474240295148
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-SQL parsing has achieved remarkable progress under the Full Schema Assumption. However, this premise fails in real-world enterprise environments where databases contain hundreds of tables with massive noisy metadata. Rather than injecting the full schema upfront, an agent must actively identify and verify only the relevant subset, giving rise to the Unknown Schema scenario we study in this work. To address this, we propose TRUST-SQL (Truthful Reasoning with Unknown Schema via Tools). We formulate the task as a Partially Observable Markov Decision Process where our autonomous agent employs a structured four-phase protocol to ground reasoning in verified metadata. Crucially, this protocol provides a structural boundary for our novel Dual-Track GRPO strategy. By applying token-level masked advantages, this strategy isolates exploration rewards from execution outcomes to resolve credit assignment, yielding a 9.9% relative improvement over standard GRPO. Extensive experiments across five benchmarks demonstrate that TRUST-SQL achieves an average absolute improvement of 30.6% and 16.6% for the 4B and 8B variants respectively over their base models. Remarkably, despite operating entirely without pre-loaded metadata, our framework consistently matches or surpasses strong baselines that rely on schema prefilling.
- Abstract(参考訳): テキストからSQLへのパースは、Full Schema Assumptionの下で驚くべき進歩を遂げた。
しかし、この前提は、データベースが巨大なノイズのあるメタデータを持つ数百のテーブルを含む実際のエンタープライズ環境では失敗する。
完全なスキーマを前もって注入するのではなく、エージェントは関連するサブセットのみを積極的に識別し、検証しなければなりません。
そこで我々はTRUST-SQL (Truthful Reasoning with Unknown Schema via Tools)を提案する。
我々は,このタスクを,我々の自律エージェントが構造化された4相プロトコルを用いて検証されたメタデータの推論を行う部分観測可能なマルコフ決定プロセスとして定式化する。
重要なことは、このプロトコルは我々の新しいDual-Track GRPO戦略の構造的境界を提供する。
トークンレベルのマスクによる利点を適用することで、この戦略は、標準的なGRPOよりも9.9%の相対的な改善をもたらすクレジット割り当てを解決するために、実行結果から探索報酬を分離する。
5つのベンチマークにわたる大規模な実験により、TRUST-SQLはベースモデルに対してそれぞれ4Bと8Bの変種に対して30.6%と16.6%の平均的な絶対的な改善を達成することが示された。
注目すべきは、完全にプリロードされたメタデータなしで動作しているにもかかわらず、我々のフレームワークは、スキーマのプリフィルに依存する強力なベースラインと一貫して一致または超えています。
関連論文リスト
- APEX-SQL: Talking to the data via Agentic Exploration for Text-to-SQL [39.76924093980244]
APEX-動詞化は、パラダイムを受動的翻訳からエージェント探索に移行するフレームワークである。
提案フレームワークでは,実データにおける基底モデル推論に仮説検証ループを用いる。
論文 参考訳(メタデータ) (2026-02-11T07:50:47Z) - LLM-Based SQL Generation: Prompting, Self-Refinement, and Adaptive Weighted Majority Voting [7.590911146338215]
アンサンブル投票(SSEV)を用いたシングルエージェント自己精製法を提案する。
私たちは、エンタープライズデータベースと現実のText-to-Actタスクの複雑さの増加に対処するために、SSEVパイプラインからの洞察に基づいています。
ReCAPAgent-5.5%は、計画、外部知識検索、批評、行動生成、自己修正、スキーマリンク、結果検証のための特殊エージェントを統合している。
論文 参考訳(メタデータ) (2026-01-25T18:38:58Z) - Boundary-Aware NL2SQL: Integrating Reliability through Hybrid Reward and Data Synthesis [23.501567675008264]
BAR- Mutation(Boundary-Aware Reliable NL2)は,信頼性と境界認識を直接生成プロセスに組み込む統合トレーニングフレームワークである。
我々は、解釈可能性を確保するために知識集合推論合成を用いる。
論文 参考訳(メタデータ) (2026-01-15T11:55:01Z) - Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。
ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文 参考訳(メタデータ) (2025-11-26T13:52:50Z) - RAISE: Reasoning Agent for Interactive SQL Exploration [47.77323087050061]
本稿では,スキーマリンク,クエリ生成,反復的改善を1つのエンドツーエンドコンポーネントに統一する新しいフレームワークを提案する。
本手法は、不慣れなデータベースを扱う際に、人間がどう答えるかをエミュレートする。
論文 参考訳(メタデータ) (2025-06-02T03:07:08Z) - RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - MAG-SQL: Multi-Agent Generative Approach with Soft Schema Linking and Iterative Sub-SQL Refinement for Text-to-SQL [15.824894030016187]
近年,テキスト・トゥ・コンテクスト・タスクにおいて,インコンテキスト・ラーニングに基づく手法が顕著な成功を収めている。
これらのモデルのパフォーマンスと、複雑なデータベーススキーマを持つデータセット上でのヒューマンパフォーマンスとの間には、依然として大きなギャップがあります。
本フレームワークでは,データベース内の列の選択にテーブルの要約を含むエンティティベースの手法を用い,それらの複雑な質問を分解するために,新たな目標条件分解手法を導入する。
論文 参考訳(メタデータ) (2024-08-15T04:57:55Z) - MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [47.120862170230566]
最近のText-to-Yourselfメソッドは通常、"巨大な"データベース上での大幅なパフォーマンス劣化に悩まされる。
我々は,新しいテキスト・ツー・ユー・セルフ LLM ベースのマルチエージェント協調フレームワーク MAC を紹介する。
我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。
次に、Code 7Bを活用することで、オープンソースの命令フォローモデルであるsql-Llamaを微調整し、GPT-4のように全てのタスクを達成します。
論文 参考訳(メタデータ) (2023-12-18T14:40:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。