論文の概要: Prompt Tuning for Natural Language to SQL with Embedding Fine-Tuning and RAG
- arxiv url: http://arxiv.org/abs/2511.08245v1
- Date: Wed, 12 Nov 2025 01:48:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.717192
- Title: Prompt Tuning for Natural Language to SQL with Embedding Fine-Tuning and RAG
- Title(参考訳): ファインチューニングとRAGを組み込んだ自然言語からSQLへのプロンプトチューニング
- Authors: Jisoo Jang, Tien-Cuong Bui, Yunjun Choi, Wen-Syan Li,
- Abstract要約: 本稿では,エラーの型を診断し,原因を同定するエラー訂正機構を統合する新しいフレームワークを提案する。
既存のベースラインよりも12%の精度向上を実現しています。
- 参考スコア(独自算出の注目度): 1.988259704465628
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces an Error Correction through Prompt Tuning for NL-to-SQL, leveraging the latest advancements in generative pre-training-based LLMs and RAG. Our work addresses the crucial need for efficient and accurate translation of natural language queries into SQL expressions in various settings with the growing use of natural language interfaces. We explore the evolution of NLIDBs from early rule-based systems to advanced neural network-driven approaches. Drawing inspiration from the medical diagnostic process, we propose a novel framework integrating an error correction mechanism that diagnoses error types, identifies their causes, provides fixing instructions, and applies these corrections to SQL queries. This approach is further enriched by embedding fine-tuning and RAG, which harnesses external knowledge bases for improved accuracy and transparency. Through comprehensive experiments, we demonstrate that our framework achieves a significant 12 percent accuracy improvement over existing baselines, highlighting its potential to revolutionize data access and handling in contemporary data-driven environments.
- Abstract(参考訳): 本稿では,NL-to-SQLのためのPrompt Tuningによる誤り訂正手法を提案する。
我々の研究は、自然言語インタフェースの利用の増加に伴い、様々な環境で自然言語クエリをSQL表現に効率的かつ正確に翻訳する必要性に対処する。
我々は、初期のルールベースシステムから高度なニューラルネットワーク駆動アプローチへのNLIDBの進化について検討する。
医療診断プロセスからインスピレーションを得て,エラータイプを診断し,原因を特定し,修正手順を提供し,これらの修正をSQLクエリに適用する新しいフレームワークを提案する。
このアプローチは、精度と透明性を向上させるために外部知識ベースを活用する微調整とRAGを組み込むことによってさらに強化される。
包括的な実験を通じて、我々のフレームワークは既存のベースラインよりも12%の精度向上を実現し、現代のデータ駆動環境におけるデータアクセスと処理に革命をもたらす可能性を強調した。
関連論文リスト
- MTIR-SQL: Multi-turn Tool-Integrated Reasoning Reinforcement Learning for Text-to-SQL [46.37961458768655]
大規模言語モデル (LLM) は、テキストから認識するタスクにますます使われている。
既存のメソッドは、リアルタイムエラー訂正を制限する静的な実行フィードバックに依存している。
本稿では, MTIR-IDERを提案する。
論文 参考訳(メタデータ) (2025-10-29T13:34:27Z) - Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting [92.57796055887995]
本稿では,言語モデルエージェントの強化学習から後視体験のリプレイに適応するプロンプトフレームワークECHOを紹介する。
ECHOは失敗した試みで達成できた代替目標のために最適化された軌道を生成する。
我々は、テキストベースのナビゲーションと計画ベンチマークであるXMiniGridのステートフルバージョンと、協調的な情報収集企業シミュレーションであるPeopleJoinQAについて、ECHOを評価した。
論文 参考訳(メタデータ) (2025-10-11T18:11:09Z) - End-to-End Text-to-SQL with Dataset Selection: Leveraging LLMs for Adaptive Query Generation [6.5390580456423555]
従来のアプローチでは、直接変換タスクとしてテキストからクエリをモデル化する。
大規模言語モデル(LLM)の最近の進歩は翻訳精度を大幅に改善した。
本稿では,ユーザの意図するデータベースを識別する3段階のエンドツーエンドテキスト・ツー・エンド・フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-08T15:16:36Z) - RAISE: Reasoning Agent for Interactive SQL Exploration [47.77323087050061]
本稿では,スキーマリンク,クエリ生成,反復的改善を1つのエンドツーエンドコンポーネントに統一する新しいフレームワークを提案する。
本手法は、不慣れなデータベースを扱う際に、人間がどう答えるかをエミュレートする。
論文 参考訳(メタデータ) (2025-06-02T03:07:08Z) - Failing Forward: Improving Generative Error Correction for ASR with Synthetic Data and Retrieval Augmentation [73.9145653659403]
生成誤差補正モデルは、トレーニング中に発生する特定の種類のエラーを超えて一般化することが困難であることを示す。
DARAGは、ドメイン内(ID)およびOODシナリオにおけるASRのためのGCCを改善するために設計された新しいアプローチである。
私たちのアプローチはシンプルでスケーラブルで、ドメインと言語に依存しません。
論文 参考訳(メタデータ) (2024-10-17T04:00:29Z) - DFIN-SQL: Integrating Focused Schema with DIN-SQL for Superior Accuracy
in Large-Scale Databases [0.0]
本稿では,DIN-composed (Decomposed-In-Context) の革新的な拡張であるDFINを紹介する。
DFINは、不正確な主要なソースであるスキーマリンクエラーに対処することで、テキストからコンポジションへの変換を強化する。
実世界の挑戦的なベンチマークであるBIRDデータセットの評価では、DFINは効率だけでなく精度も向上し、51.69のスコアが得られた。
論文 参考訳(メタデータ) (2024-03-01T07:14:45Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - SUN: Exploring Intrinsic Uncertainties in Text-to-SQL Parsers [61.48159785138462]
本稿では,ニューラルネットワークに基づくアプローチ(SUN)における本質的な不確かさを探索することにより,テキストから依存への変換性能を向上させることを目的とする。
5つのベンチマークデータセットの大規模な実験により、我々の手法は競合より大幅に優れ、新しい最先端の結果が得られた。
論文 参考訳(メタデータ) (2022-09-14T06:27:51Z) - SDA: Improving Text Generation with Self Data Augmentation [88.24594090105899]
自動データ拡張のための自己模倣学習フェーズを組み込むことにより,標準最大確率推定(MLE)パラダイムを改善することを提案する。
既存の文レベルの拡張戦略とは異なり,本手法はより汎用的で,任意のMLEベースの訓練手順に容易に適応できる。
論文 参考訳(メタデータ) (2021-01-02T01:15:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。