論文の概要: Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation
- arxiv url: http://arxiv.org/abs/2511.21402v1
- Date: Wed, 26 Nov 2025 13:52:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:59.125614
- Title: Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation
- Title(参考訳): 二重状態推論としてのテキストからSQL:適応的コンテキストと進行的生成の統合
- Authors: Zhifeng Hao, Qibin Song, Ruichu Cai, Boyan Xu,
- Abstract要約: DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。
ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
- 参考スコア(独自算出の注目度): 54.53145282349042
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent divide-and-conquer reasoning approaches, particularly those based on Chain-of-Thought (CoT), have substantially improved the Text-to-SQL capabilities of Large Language Models (LLMs). However, when applied to complex enterprise databases, such methods struggle to maintain coherent reasoning due to limited context capacity, unreliable schema linking, and weak grounding in database semantics. To overcome these issues, we introduce DSR-SQL, a \textbf{D}ual-\textbf{S}tate \textbf{R}easoning framework that models Text-to-SQL as an interaction between an adaptive context state and a progressive generation state. The first constructs a compact, semantically faithful environment by refining large schemas and selecting relevant structures, while the second formalizes SQL synthesis as feedback-guided state transitions, enabling the model to self-correct and align with user intent. Without any post-training or in-context examples, DSR-SQL achieves competitive performance, reaching 35.28\% execution accuracy on Spider 2.0-Snow and 68.32\% on BIRD development set. Our implementation will be open-sourced at: https://github.com/DMIRLAB-Group/DSR-SQL.
- Abstract(参考訳): 最近の分断・対数推論アプローチ、特にChain-of-Thought(CoT)に基づくものは、Large Language Models(LLMs)のText-to-SQL機能を大幅に改善した。
しかし、複雑なエンタープライズデータベースに適用する場合、そのような手法はコンテキストキャパシティの制限、信頼性の低いスキーマリンク、データベースセマンティクスの弱点による一貫性のある推論を維持するのに苦労する。
これらの問題を克服するために、適応的コンテキスト状態とプログレッシブ生成状態の間の相互作用としてテキストからSQLをモデル化するDSR-SQL、つまり、textbf{D}ual-\textbf{S}tate \textbf{R}easoningフレームワークを導入する。
ひとつは、大きなスキーマを精細化し、関連する構造を選択することで、コンパクトでセマンティックに忠実な環境を構築し、もうひとつは、SQL合成をフィードバック誘導状態遷移として形式化し、モデルの自己修正とユーザ意図の整合を可能にする。
ポストトレーニングやインコンテキストの例がなければ、DSR-SQLは競合性能を達成し、Spider 2.0-Snowでは35.28\%、BIRD開発では68.32\%に達する。
私たちの実装は、https://github.com/DMIRLAB-Group/DSR-SQLでオープンソース化されます。
関連論文リスト
- CRED-SQL: Enhancing Real-world Large Scale Database Text-to-SQL Parsing through Cluster Retrieval and Execution Description [15.080310729603466]
CRED-は大規模データベース向けに設計されたフレームワークで、クラスタ検索と実行記述を統合している。
自然言語質問(NLQ)と対応するsqlクエリのギャップを埋める。
CRED-は最新のgit-the-art(SOTA)パフォーマンスを実現し、その有効性とスケーラビリティを検証する。
論文 参考訳(メタデータ) (2025-08-18T09:43:07Z) - ReFoRCE: A Text-to-SQL Agent with Self-Refinement, Consensus Enforcement, and Column Exploration [32.83579488224367]
ReFoRCEは、スパイダー2.0のリーダーボードのトップのテキスト・トゥ・信頼のエージェントです。
ReFoRCEは35.83のスパイダー2.0-Snowと36.56のスコアで最先端の結果を得た。
論文 参考訳(メタデータ) (2025-02-02T05:25:03Z) - RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic
Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。
BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。
本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文 参考訳(メタデータ) (2020-12-23T12:33:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。