論文の概要: Pi-SQL: Enhancing Text-to-SQL with Fine-Grained Guidance from Pivot Programming Languages
- arxiv url: http://arxiv.org/abs/2506.00912v2
- Date: Tue, 03 Jun 2025 02:29:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:33.787452
- Title: Pi-SQL: Enhancing Text-to-SQL with Fine-Grained Guidance from Pivot Programming Languages
- Title(参考訳): Pi-SQL: Pivotプログラミング言語からの詳細なガイダンスによるテキストからSQLへの拡張
- Authors: Yongdong chi, Hanqing Wang, Zonghan Yang, Jian Yang, Xiao Yan, Yun Chen, Guanhua Chen,
- Abstract要約: Pi-は、コードブロックやコメントの詳細なステップバイステップガイドラインを提供するPythonプログラムを生成する。
FinalsqlプログラムはリファレンスPythonプログラムのクエリ結果と一致し、異なる戦略によって生成される候補から選択することで、より優れた実行速度を達成する。
- 参考スコア(独自算出の注目度): 31.271423783849787
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-to-SQL transforms the user queries from natural language to executable SQL programs, enabling non-experts to interact with complex databases. Existing prompt-based methods craft meticulous text guidelines and examples to facilitate SQL generation, but their accuracy is hindered by the large semantic gap between the texts and the low-resource SQL programs. In this work, we propose Pi-SQL, which incorporates the high-resource Python program as a pivot to bridge between the natural language query and SQL program. In particular, Pi-SQL first generates Python programs that provide fine-grained step-by-step guidelines in their code blocks or comments, and then produces an SQL program following the guidance of each Python program. The final SQL program matches the reference Python program's query results and, through selection from candidates generated by different strategies, achieves superior execution speed, with a reward-based valid efficiency score up to 4.55 higher than the best-performing baseline. Extensive experiments demonstrate the effectiveness of Pi-SQL, which improves the execution accuracy of the best-performing baseline by up to 3.20.
- Abstract(参考訳): Text-to-SQLは、ユーザクエリを自然言語から実行可能なSQLプログラムに変換する。
既存のプロンプトベースのメソッドは、SQL生成を促進するために巧妙なテキストガイドラインと例を作成しているが、その正確さは、テキストと低リソースのSQLプログラムの間の大きな意味的ギャップによって妨げられている。
本研究では,ハイリソースなPythonプログラムを,自然言語クエリとSQLプログラムの橋渡しの要点として組み込んだPi-SQLを提案する。
特に、Pi-SQLはまず、コードブロックやコメントで詳細なステップバイステップガイドラインを提供するPythonプログラムを生成し、その後、各Pythonプログラムのガイダンスに従ってSQLプログラムを生成する。
最終的なSQLプログラムは、リファレンスPythonプログラムのクエリ結果と一致し、異なる戦略によって生成される候補の選択によって、報酬ベースの有効効率スコアが最高のパフォーマンスのベースラインよりも4.55高い、より優れた実行速度を達成する。
大規模な実験では、最高性能のベースラインの実行精度を最大3.20向上させるPi-SQLの有効性が示されている。
関連論文リスト
- SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。
Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。
emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文 参考訳(メタデータ) (2023-11-06T05:24:06Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Can LLM Already Serve as A Database Interface? A BIg Bench for
Large-Scale Database Grounded Text-to-SQLs [89.68522473384522]
テキストから効率のよいタスクをベースとした大規模データベースのための大規模なベンチマークであるBirdを紹介します。
データベースの値に重点を置いていると、汚いデータベースコンテンツに対する新たな課題が浮き彫りになる。
最も効果的なテキストから効率のよいモデルであるChatGPTでさえ、実行精度はわずか40.08%である。
論文 参考訳(メタデータ) (2023-05-04T19:02:29Z) - Speech-to-SQL: Towards Speech-driven SQL Query Generation From Natural
Language Question [18.40290951253122]
音声による入力は、スマートフォンやタブレットの人気により、大きな勢いを増している。
本稿では,構造化データデータベースを問合せするための,より効率的な音声インタフェースの設計について検討する。
我々は,人間の音声を直接クエリーに変換するために,SpeechNetという新しいエンドツーエンドニューラルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-01-04T15:38:36Z) - "What Do You Mean by That?" A Parser-Independent Interactive Approach
for Enhancing Text-to-SQL [49.85635994436742]
ループ内に人間を包含し,複数質問を用いてユーザと対話する,新規非依存型対話型アプローチ(PIIA)を提案する。
PIIAは、シミュレーションと人的評価の両方を用いて、限られたインタラクションターンでテキストとドメインのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-11-09T02:14:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。