論文の概要: DecoSearch: Complexity-Aware Routing and Plan-Level Repair for Text-to-SQL
- arxiv url: http://arxiv.org/abs/2606.17821v1
- Date: Tue, 16 Jun 2026 11:48:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.40906
- Title: DecoSearch: Complexity-Aware Routing and Plan-Level Repair for Text-to-SQL
- Title(参考訳): DecoSearch: テキストからSQLへの複雑なルーティングと計画レベルの修正
- Authors: Esteban Schafir, Xu Zheng, Hojat Allah Salehi, Zhuomin Chen, Mo Sha, Wei Cheng, Dongsheng Luo,
- Abstract要約: DecoSearchはトレーニング不要のフレームワークで、各クエリを適切な推論レベルにルーティングする。
BIRDは70.53%、Spiderは88.31%、DeepSeekのバックボーンは88.31%である。
- 参考スコア(独自算出の注目度): 21.568773170643084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) have demonstrated remarkable capabilities in translating natural language to SQL, yet existing methods still falter on complex queries requiring multi-step, data-aware reasoning. We introduce DecoSearch, a training-free framework that addresses this by routing each query to the appropriate level of reasoning effort. A lightweight Schema Selector first prunes the full database schema to the relevant tables and columns. An LLM Judger then decides whether the question requires decomposition: straightforward questions follow a direct generation path and complex ones are escalated to a Directed Acyclic Graph (DAG) of atomic sub-questions, each solved by a targeted SQL generation step. A RAG component grounds the decomposer with semantically similar training examples, and a Topology Refiner restructures the reasoning plan when execution failures signal a flawed decomposition rather than a fixable SQL error. DecoSearch achieves 70.53% execution accuracy on BIRD and 88.31% on Spider with a DeepSeek backbone, surpassing all training-free baselines while consuming an order of magnitude fewer tokens than competing methods. It also functions as a model-agnostic wrapper, consistently improving fine-tuned SQL generation backbones without any modification to the pipeline.
- Abstract(参考訳): 大きな言語モデル(LLM)は、自然言語をSQLに翻訳する際、目覚ましい機能を示しているが、既存のメソッドは、マルチステップのデータ認識推論を必要とする複雑なクエリをいまだに苦しめている。
DecoSearchはトレーニング不要のフレームワークで、各クエリを適切な推論レベルにルーティングすることで、この問題に対処します。
軽量なスキーマセレクタは、まず、関連するテーブルと列に完全なデータベーススキーマをプルークする。
単純な質問は直接生成パスに従い、複雑な質問は、ターゲットのSQL生成ステップによってそれぞれ解決される、原子サブクェリの直接非巡回グラフ(DAG)にエスカレーションされる。
RAGコンポーネントは、セマンティックに類似したトレーニング例でデコンパイラをグラウンドし、Topology Refinerは、実行障害が修正可能なSQLエラーではなく、欠陥のある分解を通知するときに、推論計画を再構築する。
DecoSearchはBIRDで70.53%、DepSeekバックボーンで88.31%の実行精度を達成し、トレーニング不要のベースラインを全て上回り、競合する方法よりも桁違いに少ないトークンを消費している。
また、モデルに依存しないラッパーとして機能し、パイプラインを変更することなく、微調整のSQL生成バックボーンを一貫して改善する。
関連論文リスト
- LEAF-SQL: Level-wise Exploration with Adaptive Fine-graining for Text-to-SQL Skeleton Prediction [4.626100354811136]
LEAF-は、スケルトン予測を粗い木探索プロセスとして再構成する新しいフレームワークである。
提案手法は71.6個の実行精度を達成し,検索法と骨格法を比較検討した。
論文 参考訳(メタデータ) (2026-05-10T03:43:29Z) - ASTRA: Adaptive Semantic Tree Reasoning Architecture for Complex Table Question Answering [55.55968342644846]
テーブルのシリアライゼーションは、複雑なテーブル質問応答において、LLM(Large Language Models)にとって重要なボトルネックであり続けている。
既存のシリアライゼーションメソッドは明示的な階層をキャプチャできず、スキーマの柔軟性が欠如している。
本稿では,AdaSTRとDuTRの2つの主要モジュールを含むASTRA(Adaptive Semantic Tree Reasoning Architecture)を提案する。
複雑なテーブルベンチマーク実験により,本手法がSOTA(State-of-the-art)性能を実現することを示す。
論文 参考訳(メタデータ) (2026-04-10T06:09:41Z) - Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes [5.276278723196607]
Agentic DAG-Orchestrated Transformer (A.DOT) Plannerはマルチモーダル・マルチホップ質問応答のためのフレームワークである。
A.DOTは、ユーザNLクエリを構造化および非構造化の両方にまたがる有向非巡回グラフ(DAG)実行計画にコンパイルする。
System Decomposes query into parallelizable sub-queries, includess schema-aware reasoning, and applied both structure and semantic validation。
論文 参考訳(メタデータ) (2026-03-15T05:34:16Z) - SQuARE: Structured Query & Adaptive Retrieval Engine For Tabular Formats [0.0]
SQuAREはシートレベルの複雑なルーティングを備えたハイブリッド検索フレームワークである。
ヘッダの深さとマージ密度に基づいて連続的なスコアを計算する。
SQuAREは、検索精度とエンドツーエンドの回答精度の両方において、シングルストラテジーベースラインとChatGPT-4oを一貫して上回る。
論文 参考訳(メタデータ) (2025-12-03T22:11:45Z) - Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - SQL-of-Thought: Multi-agentic Text-to-SQL with Guided Error Correction [13.793886767052905]
In-context Learning と chain-of- Thought は、テキスト・トゥ・コンテクスト・システムのための堅牢なソリューションを開発するために利用することができる。
本稿では,Text2タスクをスキーマリンク,サブプロブレム識別,クエリプラン生成,ガイド付き修正ループに分解するマルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-30T18:27:12Z) - UNJOIN: Enhancing Multi-Table Text-to-SQL Generation via Schema Simplification [50.59009084277447]
論理生成からスキーマ要素の検索を分離するフレームワークUNJOINを紹介する。
最初の段階では、各列をテーブル名でプレフィックスすることで、データベース内のすべてのテーブルの列名を単一のテーブル表現にマージします。
第2段階では、クエリは、この単純化されたスキーマに基づいて生成され、JOIN、UNION、リレーショナルロジックを再構築することで、元のスキーマにマップされる。
論文 参考訳(メタデータ) (2025-05-23T17:28:43Z) - RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - Improving One-stage Visual Grounding by Recursive Sub-query Construction [102.47477888060801]
長いクエリと複雑なクエリのグラウンド化における現在の制限に対処することで、ワンステージの視覚的グラウンド化を改善する。
我々は,新しい1段階法により,最先端の1段階ベースラインに対して5.0%,4.5%,7.5%,12.8%の絶対改善が得られたことを示す。
論文 参考訳(メタデータ) (2020-08-03T17:43:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。