論文の概要: X-SQL: Expert Schema Linking and Understanding of Text-to-SQL with Multi-LLMs
- arxiv url: http://arxiv.org/abs/2509.05899v1
- Date: Sun, 07 Sep 2025 02:51:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.77026
- Title: X-SQL: Expert Schema Linking and Understanding of Text-to-SQL with Multi-LLMs
- Title(参考訳): X-SQL: マルチLLMによるテキスト間SQLのエキスパートスキーマリンクと理解
- Authors: Dazhi Peng,
- Abstract要約: データベーススキーマ情報は、Text-to-Adminタスクにおいて重要な、あるいは支配的な役割を果たす。
本稿では,既存のオープンソースのText-to-Admin手法と比較して,リンク結果に優れたX-Supervised Finetuning(SFT)を提案する。
さらに,抽象情報とユーザの自然言語問題とのギャップを埋めることによる理解に焦点を当てたX成分を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: With Large Language Models' (LLMs) emergent abilities on code generation tasks, Text-to-SQL has become one of the most popular downstream applications. Despite the strong results of multiple recent LLM-based Text-to-SQL frameworks, the research community often overlooks the importance of database schema information for generating high-quality SQL queries. We find that such schema information plays a significant or even dominant role in the Text-to-SQL task. To tackle this challenge, we propose a novel database schema expert with two components. We first introduce X-Linking, an LLM Supervised Finetuning (SFT)-based method that achieves superior Schema Linking results compared to existing open-source Text-to-SQL methods. In addition, we innovatively propose an X-Admin component that focuses on Schema Understanding by bridging the gap between abstract schema information and the user's natural language question. Aside from better learning with schema information, we experiment with Multi-LLMs for different components within the system to further boost its performance. By incorporating these techniques into our end-to-end framework, X-SQL, we have achieved Execution Accuracies of 84.9% on the Spider-Dev dataset and 82.5% on the Spider-Test dataset. This outstanding performance establishes X-SQL as the leading Text-to-SQL framework based on open-source models.
- Abstract(参考訳): コード生成タスクにおけるLLM(Large Language Models)の創発的な能力によって、Text-to-SQLは、最も人気のあるダウンストリームアプリケーションのひとつになった。
最近の複数のLLMベースのText-to-SQLフレームワークの強い結果にもかかわらず、研究コミュニティは、高品質なSQLクエリを生成するためのデータベーススキーマ情報の重要性をしばしば見落としている。
このようなスキーマ情報は、Text-to-SQLタスクにおいて重要な、あるいは支配的な役割を果たす。
この課題に対処するために,2つのコンポーネントを持つ新しいデータベーススキーマエキスパートを提案する。
我々はまず,LLM Supervised Finetuning (SFT) ベースのX-Linkingを導入する。
さらに,抽象スキーマ情報とユーザの自然言語問題とのギャップを埋めることで,スキーマ理解に焦点を当てたX-Adminコンポーネントを革新的に提案する。
スキーマ情報による学習の改善に加えて,システム内のさまざまなコンポーネントに対するマルチLLMを実験して,パフォーマンスをさらに向上する。
これらのテクニックをエンドツーエンドのフレームワークであるX-SQLに組み込むことで、Spider-Devデータセットで84.9%、Spider-Testデータセットで82.5%の精度を達成した。
この卓越したパフォーマンスは、X-SQLをオープンソースモデルに基づく主要なText-to-SQLフレームワークとして確立している。
関連論文リスト
- RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - SQLfuse: Enhancing Text-to-SQL Performance through Comprehensive LLM Synergy [24.919119901664843]
本稿では,オープンソースのLarge Language Models(LLM)を,クエリの精度とユーザビリティを高めるための一連のツールに統合する,堅牢なシステムを提案する。
Ant GroupによるSpider Leaderboardとデプロイメントのリードパフォーマンスによって実証された。
論文 参考訳(メタデータ) (2024-07-19T06:01:57Z) - RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL [48.516004807486745]
文脈内学習を伴う大規模言語モデル(LLM)は、テキスト・ツー・タスクの性能を大幅に改善した。
In-context prompt Engineering のための新しい検索ベースフレームワーク RB- を提案する。
実験により,我々のモデルは,公開データセットのBIRDとSpiderの競合ベースラインよりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2024-07-11T08:19:58Z) - Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation [76.76046657162306]
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
論文 参考訳(メタデータ) (2023-08-29T14:59:54Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。