論文の概要: Track-SQL: Enhancing Generative Language Models with Dual-Extractive Modules for Schema and Context Tracking in Multi-turn Text-to-SQL
- arxiv url: http://arxiv.org/abs/2603.05996v1
- Date: Fri, 06 Mar 2026 07:57:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:45.293469
- Title: Track-SQL: Enhancing Generative Language Models with Dual-Extractive Modules for Schema and Context Tracking in Multi-turn Text-to-SQL
- Title(参考訳): Track-SQL: マルチターンテキストからSQLへのスキーマとコンテキストトラッキングのためのデュアル抽出モジュールによる生成言語モデルの強化
- Authors: Bingfeng Chen, Shaobin Shi, Yongqi Luo, Boyan Xu, Ruichu Cai, Zhifeng Hao,
- Abstract要約: 生成言語モデルの性能は、マルチターンテキストソースと同程度に拡張されない。
マルチターンテキスト・ソースにおけるスキーマとコンテキスト変化を追跡するために設計された二重抽出モジュールを用いた生成言語モデルを強化するトラック-を提案する。
Track-は、データセットでそれぞれ7.1%と9.55%のマルチターンインタラクションの実行精度を大幅に改善する。
- 参考スコア(独自算出の注目度): 50.84251174559123
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative language models have shown significant potential in single-turn Text-to-SQL. However, their performance does not extend equivalently to multi-turn Text-to-SQL. This is primarily due to generative language models' inadequacy in handling the complexities of context information and dynamic schema linking in multi-turn interactions. In this paper, we propose a framework named Track-SQL, which enhances generative language models with dual-extractive modules designed to track schema and contextual changes in multi-turn Text-to-SQL. Specifically, Track-SQL incorporates a \emph{Semantic-enhanced Schema Extractor} and a \emph{Schema-aware Context Extractor}. Experimental results demonstrate that Track-SQL achieves state-of-the-art performance on the SparC and CoSQL datasets. Furthermore, detailed ablation studies reveal that Track-SQL significantly improves execution accuracy in multi-turn interactions by 7.1\% and 9.55\% on these datasets, respectively. Our implementation will be open-sourced at https://github.com/DMIRLAB-Group/Track-SQL.
- Abstract(参考訳): 生成言語モデルは、単一ターンのText-to-SQLにおいて大きな可能性を示している。
しかし、その性能はマルチターンのText-to-SQLと同等に拡張されていない。
これは主に、生成言語モデルがコンテキスト情報の複雑さやマルチターン相互作用における動的スキーマリンクを扱うのに不十分であるためである。
本稿では,マルチターンテキスト・トゥ・SQLのスキーマとコンテキスト変化を追跡するために,二重抽出モジュールを用いた生成言語モデルの拡張を目的としたTrack-SQLというフレームワークを提案する。
具体的には、Track-SQL には \emph{Semantic-enhanced Schema Extractor} と \emph{Schema-aware Context Extractor} が組み込まれている。
実験結果から、Track-SQLはSparCとCoSQLデータセット上で最先端のパフォーマンスを達成することが示された。
さらに、詳細なアブレーション研究により、トラックSQLは、これらのデータセット上で、それぞれ7.1\%と9.55\%のマルチターンインタラクションの実行精度を著しく改善することが明らかとなった。
私たちの実装はhttps://github.com/DMIRLAB-Group/Track-SQLでオープンソース化されます。
関連論文リスト
- SQaLe: A Large Text-to-SQL Corpus Grounded in Real Schemas [2.905751301655124]
テキスト・ツー・ハブ・モデルを開発する上でのボトルネックは、十分なスキーマとクエリの複雑さ、ドメインカバレッジ、タスクの多様性を備えた大規模なデータセットが不足していることだ。
実世界のスキーマコレクションであるPileから拡張された135,875のリレーショナルデータベーススキーマ上に構築された,大規模半合成のテキスト・ツー・ハグデータセットであるSQaLeを紹介した。
SQaLeは実行の妥当性を維持しながら、現実的なスキーマサイズ、多様なクエリパターン、自然言語の曖昧さをキャプチャする。
論文 参考訳(メタデータ) (2025-12-16T09:15:10Z) - Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。
ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文 参考訳(メタデータ) (2025-11-26T13:52:50Z) - LitE-SQL: A Lightweight and Efficient Text-to-SQL Framework with Vector-based Schema Linking and Execution-Guided Self-Correction [5.123751486259634]
2つのコンポーネントを持つ軽量で効率的なフレームワークLitE-を紹介します。
BIRDでは、LitE-は72.10%の実行精度を達成し、Spiderでは88.45%に達し、Retrieverと同等または優れたパフォーマンスを示している。
以上の結果から,高品質のテキスト・トゥ・コレクション・ジェネレーションは軽量モデルで実現可能であり,プライバシに敏感かつリソース制約のある設定に実用的なソリューションを提供することがわかった。
論文 参考訳(メタデータ) (2025-10-10T05:27:47Z) - X-SQL: Expert Schema Linking and Understanding of Text-to-SQL with Multi-LLMs [0.0]
データベーススキーマ情報は、Text-to-Adminタスクにおいて重要な、あるいは支配的な役割を果たす。
本稿では,既存のオープンソースのText-to-Admin手法と比較して,リンク結果に優れたX-Supervised Finetuning(SFT)を提案する。
さらに,抽象情報とユーザの自然言語問題とのギャップを埋めることによる理解に焦点を当てたX成分を提案する。
論文 参考訳(メタデータ) (2025-09-07T02:51:43Z) - RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。
Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。
emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文 参考訳(メタデータ) (2023-11-06T05:24:06Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UniSAr: A Unified Structure-Aware Autoregressive Language Model for
Text-to-SQL [48.21638676148253]
We present UniSAr (Unified Structure-Aware Autoregressive Language Model), which is benefit of using a off-the-shelf language model。
具体的には、UniSArは既存の自己回帰モデルを拡張して、3つの非侵襲的拡張を組み込んで構造認識する。
論文 参考訳(メタデータ) (2022-03-15T11:02:55Z) - Tracking Interaction States for Multi-Turn Text-to-SQL Semantic Parsing [44.0348697408427]
マルチターンテキスト・ツー・セマンティクスのタスクは、自然言語発話を対話からsqlクエリに変換することを目的としている。
グラフ関係ネットワークと非線形層は、2つの状態の表現をそれぞれ更新するように設計されている。
提案手法の有効性を示すため,coデータセットに挑戦する実験を行った。
論文 参考訳(メタデータ) (2020-12-09T11:59:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。