論文の概要: MARS-SQL: A multi-agent reinforcement learning framework for Text-to-SQL
- arxiv url: http://arxiv.org/abs/2511.01008v1
- Date: Sun, 02 Nov 2025 16:55:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.024386
- Title: MARS-SQL: A multi-agent reinforcement learning framework for Text-to-SQL
- Title(参考訳): MARS-SQL: Text-to-SQLのためのマルチエージェント強化学習フレームワーク
- Authors: Haolin Yang, Jipeng Zhang, Zhitao He, Yi R. Fung,
- Abstract要約: 基本的タスク分解と対話型強化学習(RL)を組み合わせた新しいマルチエージェントフレームワークMARS-を紹介する。
実験の結果、MARS-はBIRDセットで77.84%、スパイダーテストセットで89.84%の最先端の実行精度を達成した。
- 参考スコア(独自算出の注目度): 22.59453421744114
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Translating natural language to SQL remains difficult for complex queries. Such queries often need environmental interaction and self-correction. To address this, we introduce MARS-SQL, a novel multi-agent framework that combines principled task decomposition and interactive reinforcement learning (RL). Our system comprises three specialized agents: a Grounding Agent for schema linking, a Generation Agent for query generation, and a Validation Agent for final selection. The core of our framework is the Generation agent, which is trained via a multi-turn RL policy. Adopting a ReAct-style Think-Act-Observe loop, the agent iteratively generates thoughts, executes SQL actions against a live database, and revises its strategy based on execution feedback, enabling dynamic, stateful reasoning and self-correction. At inference time, we generate multiple interaction trajectories to explore diverse reasoning paths. The Validation agent, then selects the optimal trajectory by modeling verification as a next-token prediction task and choosing the solution with the highest generation probability. This structured workflow pipelines specialized agents. It combines interactive RL for generation with generative modeling for verification. The approach proves highly effective for robust and accurate SQL generation. Experiments show that MARS-SQL achieves state-of-the-art Execution Accuracy of 77.84% on the BIRD dev set and 89.75% on the Spider test set. Our code is available at https://github.com/YangHaolin0526/MARS-SQL.
- Abstract(参考訳): 自然言語をSQLに翻訳するのは、複雑なクエリでは難しい。
このようなクエリは環境相互作用と自己補正を必要とすることが多い。
そこで本研究では,タスク分解と対話型強化学習(RL)を組み合わせた新しいマルチエージェントフレームワークMARS-SQLを紹介する。
本システムは,スキーマリンクのためのグラウンドティングエージェント,クエリ生成のためのジェネレーションエージェント,最終選択のためのバリデーションエージェントの3つの特殊エージェントから構成される。
我々のフレームワークの中核はジェネレーションエージェントであり、マルチターンRLポリシーでトレーニングされています。
ReActスタイルのThink-Act-Observeループを採用すると、エージェントは思考を反復的に生成し、ライブデータベースに対してSQLアクションを実行し、実行フィードバックに基づいて戦略を改訂し、動的でステートフルな推論と自己修正を可能にする。
推論時には、多様な推論経路を探索するために、複数の相互作用軌跡を生成する。
次に、バリデーションエージェントは、検証を次トーケン予測タスクとしてモデル化し、最も生成確率の高い解を選択することにより、最適軌道を選択する。
この構造化ワークフローパイプラインは特殊エージェントである。
生成のための対話的RLと、検証のための生成的モデリングを組み合わせる。
このアプローチは、堅牢で正確なSQL生成に非常に効果的である。
実験の結果、MARS-SQLはBIRD開発セットで77.84%、スパイダーテストセットで89.75%の最先端の実行精度を達成した。
私たちのコードはhttps://github.com/YangHaolin0526/MARS-SQLで利用可能です。
関連論文リスト
- From Queries to Insights: Agentic LLM Pipelines for Spatio-Temporal Text-to-SQL [8.496933324334167]
本研究では,MistralをベースとしたRellama-sqlcoder-8bによるオーケストレーションにより,簡単なテキストからActまでのベースライン(Rellama-sqlcoder-8b)を提案する。
ニューヨークと東京のチェックインで35の自然言語クエリを評価し,空間的・時間的マルチデータセット推論について検討した。
このエージェントは、データセット 91.4% 対 28.6% よりもかなり精度が高く、地図によるユーザビリティを高め、自然言語の要約を構造化する。
論文 参考訳(メタデータ) (2025-10-29T22:18:57Z) - MTSQL-R1: Towards Long-Horizon Multi-Turn Text-to-SQL via Agentic Training [31.290164208264745]
本稿では,マルチターンテキスト・トゥ・ザ・ガイドのためのエージェント・トレーニング・フレームワークMT-R1を提案する。
我々は,エージェントが (i) 実行フィードバックのためのデータベースと (ii) 検証のための永続的な対話メモリと相互作用するマルコフ決定プロセス (MDP) としてタスクをキャストした。
実験により、MT-R1は強いベースラインを一貫して上回り、会話の意味解析における環境駆動型検証とメモリ誘導型洗練の重要性を強調した。
論文 参考訳(メタデータ) (2025-10-12T16:12:05Z) - AGENTIQL: An Agent-Inspired Multi-Expert Framework for Text-to-SQL Generation [0.509780930114934]
AgentIQLはエージェントにインスパイアされたフレームワークで、質問分解のための推論エージェント、サブクエリ生成のためのコーディングエージェント、列選択のための洗練ステップを組み合わせたものだ。
我々は、Planner&Executorのマージ戦略を用いて、14Bモデルで最大86.07%のEXを達成し、Spiderベンチマークで AgentIQLを評価した。
正確性を超えて、AgentIQLは、中間的推論ステップを公開することによって透明性を高め、セマンティック解析に対する堅牢でスケーラブルで解釈可能なアプローチを提供する。
論文 参考訳(メタデータ) (2025-10-12T15:35:05Z) - Agentic-R1: Distilled Dual-Strategy Reasoning [58.73951532294446]
現在のロングチェーン・オブ・ソート(ロングCoT)モデルは数学的推論において優れているが、遅くてエラーを起こしやすい自然言語トレースに依存している。
複数の教師の補完的推論戦略を統合された学生モデルに蒸留する微調整フレームワークであるDualDistillを導入する。
本手法は,計算集約型ベンチマークと標準ベンチマークの両方を含むタスクの精度を向上する。
論文 参考訳(メタデータ) (2025-07-08T06:35:16Z) - RAISE: Reasoning Agent for Interactive SQL Exploration [47.77323087050061]
本稿では,スキーマリンク,クエリ生成,反復的改善を1つのエンドツーエンドコンポーネントに統一する新しいフレームワークを提案する。
本手法は、不慣れなデータベースを扱う際に、人間がどう答えるかをエミュレートする。
論文 参考訳(メタデータ) (2025-06-02T03:07:08Z) - Cooperative SQL Generation for Segmented Databases By Using Multi-functional LLM Agents [48.25853644159186]
多機能エージェント(CSMA)に基づく協調sql生成フレームワークを提案する。
人間のチームワークにおけるコラボレーションに触発されて、CSMAは3つのステージから構成される。
スパイダーとバードのベックマークの実験では、CSMAは最先端技術に匹敵する高いパフォーマンスを達成している。
論文 参考訳(メタデータ) (2024-12-08T08:16:19Z) - MALT: Improving Reasoning with Multi-Agent LLM Training [67.76186488361685]
MALT(Multi-Agent LLM Training)は、推論プロセスを生成、検証、改善ステップに分割する、新しいポストトレーニング戦略である。
MATH、GSM8K、CSQAでは、MALTは、それぞれ15.66%、7.42%、9.40%の相対的な改善で同じベースラインLLMを上回っている。
論文 参考訳(メタデータ) (2024-12-02T19:30:36Z) - MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [47.120862170230566]
最近のText-to-Yourselfメソッドは通常、"巨大な"データベース上での大幅なパフォーマンス劣化に悩まされる。
我々は,新しいテキスト・ツー・ユー・セルフ LLM ベースのマルチエージェント協調フレームワーク MAC を紹介する。
我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。
次に、Code 7Bを活用することで、オープンソースの命令フォローモデルであるsql-Llamaを微調整し、GPT-4のように全てのタスクを達成します。
論文 参考訳(メタデータ) (2023-12-18T14:40:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。