論文の概要: LLM-Based SQL Generation: Prompting, Self-Refinement, and Adaptive Weighted Majority Voting
- arxiv url: http://arxiv.org/abs/2601.17942v1
- Date: Sun, 25 Jan 2026 18:38:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.553129
- Title: LLM-Based SQL Generation: Prompting, Self-Refinement, and Adaptive Weighted Majority Voting
- Title(参考訳): LLMベースのSQL生成: Prompting、Self-Refinement、Adaptive Weighted Majority Voting
- Authors: Yu-Jie Yang, Hung-Fu Chang, Po-An Chen,
- Abstract要約: アンサンブル投票(SSEV)を用いたシングルエージェント自己精製法を提案する。
私たちは、エンタープライズデータベースと現実のText-to-Actタスクの複雑さの増加に対処するために、SSEVパイプラインからの洞察に基づいています。
ReCAPAgent-5.5%は、計画、外部知識検索、批評、行動生成、自己修正、スキーマリンク、結果検証のための特殊エージェントを統合している。
- 参考スコア(独自算出の注目度): 7.590911146338215
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-SQL has emerged as a prominent research area, particularly with the rapid advancement of large language models (LLMs). By enabling users to query databases through natural language rather than SQL, this technology significantly lowers the barrier to data analysis. However, generating accurate SQL from natural language remains challenging due to ambiguity in user queries, the complexity of schema linking, limited generalization across SQL dialects, and the need for domain-specific understanding. In this study, we propose a Single-Agent Self-Refinement with Ensemble Voting (SSEV) pipeline built on PET-SQL that operates without ground-truth data, integrating self-refinement with Weighted Majority Voting (WMV) and its randomized variant (RWMA). Experimental results show that the SSEV achieves competitive performance across multiple benchmarks, attaining execution accuracies of 85.5% on Spider 1.0-Dev, 86.4% on Spider 1.0-Test, and 66.3% on BIRD-Dev. Building on insights from the SSEV pipeline, we further propose ReCAPAgent-SQL (Refinement-Critique-Act-Plan agent-based SQL framework) to address the growing complexity of enterprise databases and real-world Text-to-SQL tasks. The framework integrates multiple specialized agents for planning, external knowledge retrieval, critique, action generation, self-refinement, schema linking, and result validation, enabling iterative refinement of SQL predictions through agent collaboration. ReCAPAgent-SQL's WMA results achieve 31% execution accuracy on the first 100 queries of Spider 2.0-Lite, demonstrating significant improvements in handling real-world enterprise scenarios. Overall, our work facilitates the deployment of scalable Text-to-SQL systems in practical settings, supporting better data-driven decision-making at lower cost and with greater efficiency.
- Abstract(参考訳): Text-to-SQLは、特に大規模言語モデル(LLM)の急速な進歩によって、顕著な研究領域として登場した。
SQLではなく自然言語でデータベースをクエリできるので、この技術はデータ分析の障壁を大幅に減らす。
しかし、ユーザクエリの曖昧さ、スキーマリンクの複雑さ、SQL方言間の限定的な一般化、ドメイン固有の理解の必要性により、自然言語から正確なSQLを生成することは依然として困難である。
本研究では,PET-SQL 上に構築したシングルエージェント型自己精細化(SSEV)パイプラインについて,基本構造データなしで動作し,重み付き多数投票(WMV)とランダム化変動(RWMA)との自己精細化を統合することを提案する。
実験の結果、SSEVは複数のベンチマークで競合性能を達成し、スパイダー1.0-Devで85.5%、スパイダー1.0-Testで86.4%、BIRD-Devで66.3%の精度を達成した。
SSEVパイプラインからの洞察に基づいて、エンタープライズデータベースと現実のText-to-SQLタスクの複雑さの増加に対応するために、ReCAPAgent-SQL(Refinement-Critique-Act-PlanエージェントベースのSQLフレームワーク)をさらに提案する。
このフレームワークは、計画、外部知識検索、批評、アクション生成、自己修正、スキーマリンク、結果検証のための複数の特殊エージェントを統合し、エージェントの協調を通じてSQL予測を反復的に改善する。
ReCAPAgent-SQLのWMAは、Spider 2.0-Liteの最初の100クエリで31%の実行精度を達成し、実際のエンタープライズシナリオの処理における大幅な改善を示している。
全体として、当社の作業は、スケーラブルなText-to-SQLシステムの実用的な設定でのデプロイを容易にし、低コストでより効率的なデータ駆動による意思決定を支援する。
関連論文リスト
- SQL-Trail: Multi-Turn Reinforcement Learning with Interleaved Feedback for Text-to-SQL [20.49395306069103]
テキスト・ツー・ワン・ジェネレーションのためのマルチターン強化学習(RL)エージェント・フレームワークを提案する。
1ショットでクエリを生成するのではなく、SQL-Trailはデータベース環境と対話し、実行フィードバックを使用して予測を反復的に洗練する。
提案手法は, エージェントの相互作用深度を問合せ難易度に合わせるための適応的なターン予算配分機構と, sqlの正しさと効率的な探索を両立させる複合報酬パネルの2つを主眼とする。
論文 参考訳(メタデータ) (2026-01-25T05:16:52Z) - Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。
ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文 参考訳(メタデータ) (2025-11-26T13:52:50Z) - From Queries to Insights: Agentic LLM Pipelines for Spatio-Temporal Text-to-SQL [8.496933324334167]
本研究では,MistralをベースとしたRellama-sqlcoder-8bによるオーケストレーションにより,簡単なテキストからActまでのベースライン(Rellama-sqlcoder-8b)を提案する。
ニューヨークと東京のチェックインで35の自然言語クエリを評価し,空間的・時間的マルチデータセット推論について検討した。
このエージェントは、データセット 91.4% 対 28.6% よりもかなり精度が高く、地図によるユーザビリティを高め、自然言語の要約を構造化する。
論文 参考訳(メタデータ) (2025-10-29T22:18:57Z) - RAISE: Reasoning Agent for Interactive SQL Exploration [47.77323087050061]
本稿では,スキーマリンク,クエリ生成,反復的改善を1つのエンドツーエンドコンポーネントに統一する新しいフレームワークを提案する。
本手法は、不慣れなデータベースを扱う際に、人間がどう答えるかをエミュレートする。
論文 参考訳(メタデータ) (2025-06-02T03:07:08Z) - OpenSearch-SQL: Enhancing Text-to-SQL with Dynamic Few-shot and Consistency Alignment [6.2089733671434875]
我々は,テキストからエージェントまでのタスクを,整合性アライメント機構に基づくアライメントモジュールとともに,前処理,抽出,生成,リファインメントの4つの主要なモジュールに分割するOpenSearch-を提案する。
これらの手法はテキスト・ツー・エージェント・タスクにおけるLLMの性能を大幅に向上させた。
実験の結果、OpenSearch-はBIRD開発セットで69.3%、テストセットで72.28%、報酬ベースの効率スコア(R-VES)で69.3で実行精度(EX)を達成した。
論文 参考訳(メタデータ) (2025-02-19T07:51:50Z) - Solid-SQL: Enhanced Schema-linking based In-context Learning for Robust Text-to-SQL [13.122218546167463]
大規模言語モデル(LLM)は、テキスト・ツー・システムの性能を大幅に改善した。
多くのSOTA(State-of-the-art)アプローチは、システムの堅牢性の重要な側面を見落としている。
論文 参考訳(メタデータ) (2024-12-17T04:22:22Z) - Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation [76.76046657162306]
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
論文 参考訳(メタデータ) (2023-08-29T14:59:54Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。