論文の概要: FlexSQL: Flexible Exploration and Execution Make Better Text-to-SQL Agents
- arxiv url: http://arxiv.org/abs/2605.02815v1
- Date: Mon, 04 May 2026 16:51:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.419333
- Title: FlexSQL: Flexible Exploration and Execution Make Better Text-to-SQL Agents
- Title(参考訳): FlexSQL: 柔軟な探索と実行により、テキストからSQLへのエージェントが改善される
- Authors: Quang Hieu Pham, Yang He, Ping Nie, Canwen Xu, Davood Rafiei, Yuepeng Wang, Xi Ye, Jocelyn Qiaochu Chen,
- Abstract要約: 私たちはFlex Codeを紹介します。Flex Codeは、柔軟性のあるデータベースインタラクションを基本設計するテキスト・ツー・エージェントです。
この手法はSpider2-Snowに対して10%以上の相対的な改善をもたらす。
- 参考スコア(独自算出の注目度): 36.84900072417659
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-SQL over large analytical databases requires navigating complex schemas, resolving ambiguous queries, and grounding decisions in actual data. Most current systems follow a fixed pipeline where schema elements are retrieved once upfront and the database is only revisited for post-hoc repair, limiting recovery from early mistakes. We present FlexSQL, a text-to-SQL agent whose core design principle is flexible database interaction: the agent can explore schema structure, inspect data values, and run verification queries at any point during reasoning. FlexSQL generates diverse execution plans to cover multiple query interpretations, implements each plan in either SQL or Python depending on the task, and uses a two-tiered repair mechanism that can backtrack from code-level errors to plan-level revisions. On Spider2-Snow, using gpt-oss-120b, FlexSQL achieves a 65.4\% score, outperforming strong open-source baselines that use stronger, larger models such as gpt-o3 and DeepSeek-R1. When integrated into a general-purpose coding agent (as skills in Claude Code), our approach yields over 10\% relative improvement on Spider2-Snow. Further analysis shows that flexible exploration and flexible execution jointly contribute to the effectiveness of our approach, highlighting flexibility as a key design principle. Our code is available at: https://github.com/StringNLPLAB/FlexSQL
- Abstract(参考訳): 大規模な分析データベース上のテキストからSQLは、複雑なスキーマをナビゲートし、あいまいなクエリを解決し、実際のデータで決定を下す必要がある。
現在のほとんどのシステムは固定パイプラインに従っており、スキーマ要素は一度前もって検索され、データベースは保留後の修復のためにのみ更新され、初期のミスからの回復が制限される。
エージェントはスキーマ構造を探索し、データ値を検査し、推論中の任意の時点で検証クエリを実行できます。
FlexSQLは、複数のクエリ解釈をカバーするさまざまな実行プランを生成し、タスクに応じてSQLまたはPythonで各プランを実装し、コードレベルのエラーからプランレベルのリビジョンまで追跡可能な2段階の修復メカニズムを使用している。
Spider2-Snowでは、gpt-oss-120bを使用して、FlexSQLは65.4\%のスコアを獲得し、gpt-o3やDeepSeek-R1のようなより強力なモデルを使用する強力なオープンソースベースラインを上回っている。
汎用コーディングエージェント(Claude Codeのスキルとして)に統合されると、我々のアプローチはSpider2-Snowに対して10倍以上の相対的な改善をもたらす。
さらなる分析により、フレキシブルな探索とフレキシブルな実行が、我々のアプローチの有効性に共同で寄与することを示し、フレキシブルを重要な設計原則として強調する。
私たちのコードは、https://github.com/StringNLPLAB/FlexSQLで利用可能です。
関連論文リスト
- X-SQL: Expert Schema Linking and Understanding of Text-to-SQL with Multi-LLMs [0.0]
データベーススキーマ情報は、Text-to-Adminタスクにおいて重要な、あるいは支配的な役割を果たす。
本稿では,既存のオープンソースのText-to-Admin手法と比較して,リンク結果に優れたX-Supervised Finetuning(SFT)を提案する。
さらに,抽象情報とユーザの自然言語問題とのギャップを埋めることによる理解に焦点を当てたX成分を提案する。
論文 参考訳(メタデータ) (2025-09-07T02:51:43Z) - ReFoRCE: A Text-to-SQL Agent with Self-Refinement, Consensus Enforcement, and Column Exploration [32.83579488224367]
ReFoRCEは、スパイダー2.0のリーダーボードのトップのテキスト・トゥ・信頼のエージェントです。
ReFoRCEは35.83のスパイダー2.0-Snowと36.56のスコアで最先端の結果を得た。
論文 参考訳(メタデータ) (2025-02-02T05:25:03Z) - Spider 2.0: Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows [64.94146689665628]
Spider 2.0は、エンタープライズレベルのデータベースのユースケースから派生した、現実のテキストからsqlの問題に対する評価フレームワークである。
Spider 2.0のデータベースは、実際のデータアプリケーションからソースされ、1,000以上の列を含み、BigQueryやSnowflakeなどのローカルまたはクラウドデータベースシステムに格納されることが多い。
Spider 2.0の問題解決には、データベースメタデータ、方言文書、さらにはプロジェクトレベルの理解と検索が頻繁に必要であることを示す。
論文 参考訳(メタデータ) (2024-11-12T12:52:17Z) - MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [47.120862170230566]
最近のText-to-Yourselfメソッドは通常、"巨大な"データベース上での大幅なパフォーマンス劣化に悩まされる。
我々は,新しいテキスト・ツー・ユー・セルフ LLM ベースのマルチエージェント協調フレームワーク MAC を紹介する。
我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。
次に、Code 7Bを活用することで、オープンソースの命令フォローモデルであるsql-Llamaを微調整し、GPT-4のように全てのタスクを達成します。
論文 参考訳(メタデータ) (2023-12-18T14:40:20Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。