論文の概要: Reliable Answers for Recurring Questions: Boosting Text-to-SQL Accuracy with Template Constrained Decoding
- arxiv url: http://arxiv.org/abs/2604.28028v1
- Date: Thu, 30 Apr 2026 15:44:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.173665
- Title: Reliable Answers for Recurring Questions: Boosting Text-to-SQL Accuracy with Template Constrained Decoding
- Title(参考訳): Recurring Questions: テンプレート制約付きデコードによるテキストからSQLへの精度向上
- Authors: Smit Jivani, Sarvam Maheshwari, Sunita Sarawagi,
- Abstract要約: 大規模言語モデル(LLM)はテキスト・ツー・ジェネレーションに革命をもたらした。
本稿では,ラベル付きワークロードにおけるクエリパターンの繰り返しを利用したTeCoDを提案する。
我々は、TeCoDが、コンテキスト内学習(ICL)よりも最大36%高い実行精度と、マッチしたクエリの2.2倍のレイテンシが得られることを示す。
- 参考スコア(独自算出の注目度): 19.55574267306257
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have revolutionized Text-to-SQL generation, allowing users to query structured data using natural language with growing ease. Yet, real-world deployment remains challenging, especially in complex or unseen schemas, due to inconsistent accuracy and the risk of generating invalid SQL. We introduce Template Constrained Decoding (TeCoD), a system that addresses these limitations by harnessing the recurrence of query patterns in labeled workloads. TeCoD converts historical NL-SQL pairs into reusable templates and introduces a robust template selection module that uses a fine-tuned natural language inference model to match or reject queries efficiently. Once the template is selected, TeCoD enforces it during SQL generation through grammar-constrained decoding, implemented via a novel partitioned strategy that ensures both syntactic validity and efficiency. Together, these components yield up to 36% higher execution accuracy than in-context learning (ICL) and 2.2x lower latency on matched queries.
- Abstract(参考訳): 大規模言語モデル(LLM)は、テキストからSQL生成に革命をもたらした。
しかし、現実のデプロイメントは、特に複雑なスキーマや見えないスキーマでは、一貫性のない正確さと、無効なSQLを生成するリスクのため、依然として困難である。
我々は、ラベル付きワークロードにおけるクエリパターンの繰り返しを活用することにより、これらの制限に対処するテンプレート制約デコーディング(TeCoD)を導入する。
TeCoDは、過去のNL-SQLペアを再利用可能なテンプレートに変換し、クエリを効率的にマッチングまたは拒否するために、微調整された自然言語推論モデルを使用する堅牢なテンプレート選択モジュールを導入している。
テンプレートが選択されると、TeCoDは文法制約付きデコードを通じてSQL生成中にそれを強制する。
これらのコンポーネントは、一致したクエリの2.2倍のレイテンシで、インコンテキスト学習(ICL)よりも最大で36%高い実行精度が得られる。
関連論文リスト
- ErrorLLM: Modeling SQL Errors for Text-to-SQL Refinement [57.98138819417949]
テキスト・ツー・クエリを明示的にモデル化するフレームワークであるErrorLLMを提案する。
ErrorLLMは、バックボーンの初期生成よりも大幅に改善されていることを示す。
ErrorLLMは、精錬効率を維持しつつ、高い検出F1スコアで両面に対処する。
論文 参考訳(メタデータ) (2026-03-04T05:27:20Z) - RingSQL: Generating Synthetic Data with Schema-Independent Templates for Text-to-SQL Reasoning Models [1.0062127381149395]
Ringは、スキーマに依存しないクエリテンプレートとLLMベースの自然言語質問のパラフレーズを組み合わせたハイブリッドデータ生成フレームワークである。
我々は、Ringによってトレーニングされたモデルが、他の合成データでトレーニングされたモデルと比較して、6つのテキスト間ベンチマークの平均精度+2.3%に達することを発見した。
論文 参考訳(メタデータ) (2026-01-09T00:46:53Z) - Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。
ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文 参考訳(メタデータ) (2025-11-26T13:52:50Z) - RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - TrustSQL: Benchmarking Text-to-SQL Reliability with Penalty-Based Scoring [11.78795632771211]
本稿では,任意の入力質問を正しく処理するモデルとして,テキスト・ツー・信頼性を評価するための新しいベンチマークを提案する。
2つのモデリング手法を用いて,新たなペナルティに基づく評価基準を用いた既存手法の評価を行った。
論文 参考訳(メタデータ) (2024-03-23T16:12:52Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。