論文の概要: ACE-SQL: Adaptive Co-Optimization via Empirical Credit Assignment for Text-to-SQL
- arxiv url: http://arxiv.org/abs/2606.05906v1
- Date: Thu, 04 Jun 2026 09:11:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-06 06:55:34.645559
- Title: ACE-SQL: Adaptive Co-Optimization via Empirical Credit Assignment for Text-to-SQL
- Title(参考訳): ACE-SQL: テキストからSQLへの経験的クレジット割り当てによる適応的共最適化
- Authors: Xiaobing Chen, Ai Jian, Eryu Guo, Zhiqi Pang,
- Abstract要約: 既存の方法は、フルスキーマ生成に依存するか、静的なゴールドカラムの監督で訓練された別個のレトリバーを使用するかのいずれかであり、現在のジェネレータポリシーに最適である可能性がある。
本研究では,実行フィードバック下でのスキーマ検索とsql生成を協調的に最適化する強化学習フレームワークであるACE最適化を提案する。
RLトレーニング用の約3kテキスト・ツー・クエクション・データベースペアでは、ACE-はクエリ毎に0.93kの出力トークンを使用しながら、BIRD Dev上で65.3%のグレディな実行精度を実現している。
- 参考スコア(独自算出の注目度): 6.968226996634463
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-SQL maps natural language questions to executable SQL queries. Modern databases often contain large and complex schemas, making schema linking a critical step for accurate SQL generation. Existing methods either rely on full-schema generation, which leaves schema linking implicit within a large search space, or use a separate retriever trained with static gold-column supervision, whose targets may be suboptimal for the current generator policy. To address this issue, we propose Adaptive Co-optimization via Empirical Credit Assignment for Text-to-SQL (ACE-SQL), a reinforcement learning (RL) framework that jointly optimizes schema retrieval and SQL generation under execution feedback. ACE-SQL constructs an online column-set pool from generator rollouts and derives adaptive on-policy retrieval targets from the column set most frequently associated with execution-correct rollouts. This induces bidirectional adaptation, where the retriever adapts toward column sets that the generator can execute correctly, while the generator adapts to the retriever's evolving schema selections under execution feedback. With approximately 3k synthetic Text-to-SQL question-database pairs for RL training, ACE-SQL achieves 65.3% greedy execution accuracy on BIRD Dev while using 0.93k output tokens per query. The repository is available at https://github.com/xbchen1/ACE-SQL.
- Abstract(参考訳): Text-to-SQLは自然言語の質問を実行可能なSQLクエリにマッピングする。
現代のデータベースは、しばしば大きくて複雑なスキーマを含んでいるため、スキーマリンクは正確なSQL生成の重要なステップとなる。
既存の手法では、大規模な検索空間に暗黙のリンクを残すフルスキーマ生成や、現在のジェネレータポリシーに最適なターゲットである静的ゴールドカラムの監督で訓練された別個のレトリバーを使用する。
本稿では,スキーマ検索とSQL生成を協調的に最適化する強化学習(RL)フレームワークであるEmpirical Credit Assignment for Text-to-SQL (ACE-SQL)による適応的協調最適化を提案する。
ACE-SQLは、ジェネレータのロールアウトからオンラインのカラムセットプールを構築し、実行の正しいロールアウトに最もよく関連付けられたカラムセットから、アダプティブなオンポリシー検索ターゲットを導出する。
これにより、レトリバーは、ジェネレータが正しく実行できる列セットに適応し、ジェネレータは、実行フィードバックの下で、レトリバーの進化するスキーマ選択に適応する。
RLトレーニングのための3kの合成テキスト-SQL問合せデータベースペアにより、ACE-SQLはクエリ毎に0.93kの出力トークンを使用しながら、BIRD Dev上で65.3%のグレディな実行精度を達成する。
リポジトリはhttps://github.com/xbchen1/ACE-SQLで公開されている。
関連論文リスト
- ProSPy: A Profiling-Driven SQL-Python Agentic Framework for Enterprise Text-to-SQL [51.98164069124653]
ProSPyは、エンタープライズスケールのテキスト-非依存分析のためのプロファイリング駆動フレームワークである。
ProSPyは推論プロセスを4段階に構成する。
まず、自動プロファイリングにより、きめ細かいデータ証拠を抽出する。
大規模なスキーマをタスク関連コンテキストに抽出する。
論文 参考訳(メタデータ) (2026-06-04T08:13:05Z) - Track-SQL: Enhancing Generative Language Models with Dual-Extractive Modules for Schema and Context Tracking in Multi-turn Text-to-SQL [50.84251174559123]
生成言語モデルの性能は、マルチターンテキストソースと同程度に拡張されない。
マルチターンテキスト・ソースにおけるスキーマとコンテキスト変化を追跡するために設計された二重抽出モジュールを用いた生成言語モデルを強化するトラック-を提案する。
Track-は、データセットでそれぞれ7.1%と9.55%のマルチターンインタラクションの実行精度を大幅に改善する。
論文 参考訳(メタデータ) (2026-03-06T07:57:06Z) - Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。
ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文 参考訳(メタデータ) (2025-11-26T13:52:50Z) - From Queries to Insights: Agentic LLM Pipelines for Spatio-Temporal Text-to-SQL [8.496933324334167]
本研究では,MistralをベースとしたRellama-sqlcoder-8bによるオーケストレーションにより,簡単なテキストからActまでのベースライン(Rellama-sqlcoder-8b)を提案する。
ニューヨークと東京のチェックインで35の自然言語クエリを評価し,空間的・時間的マルチデータセット推論について検討した。
このエージェントは、データセット 91.4% 対 28.6% よりもかなり精度が高く、地図によるユーザビリティを高め、自然言語の要約を構造化する。
論文 参考訳(メタデータ) (2025-10-29T22:18:57Z) - CogniSQL-R1-Zero: Lightweight Reinforced Reasoning for Efficient SQL Generation [1.169202600932732]
本稿では,強化学習(RL)フレームワークとモデルであるCogni-R1-Zeroを紹介する。
我々は、実行の正しさとフォーマットタグのコンプライアンスに基づく軽量な報酬信号を使用する。
提案手法は,Text2ベンチマーク上での最先端実行精度を実現する。
効率的かつ解釈可能なテキスト・ツー・コード・モデリングのさらなる研究を支援するために、2つのキュレートされたデータセットをリリースする。
論文 参考訳(メタデータ) (2025-07-08T14:17:07Z) - RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - E-SQL: Direct Schema Linking via Question Enrichment in Text-to-SQL [1.187832944550453]
E-Seekは、直接スキーマリンクと候補述語拡張を通じてこれらの課題に対処するように設計された、新しいパイプラインである。
E-Seekは、関連するデータベース項目(テーブル、列、値)と条件を直接質問とsql構築計画に組み込むことで、自然言語クエリを強化し、クエリとデータベース構造の間のギャップを埋める。
総合的な評価は、E-Seekが競争性能、特に66.29%の実行精度で複雑なクエリに優れていることを示している。
論文 参考訳(メタデータ) (2024-09-25T09:02:48Z) - Benchmarking and Improving Text-to-SQL Generation under Ambiguity [25.283118418288293]
我々はAmbiQTと呼ばれる新しいベンチマークを開発し、各テキストは語彙的および/または構造的あいまいさのために2つのもっともらしいSQLとして解釈できる。
提案するLogicalBeamは,計画ベースのテンプレート生成と制約付きインフィルを併用して,sql論理空間をナビゲートする新しい復号アルゴリズムである。
論文 参考訳(メタデータ) (2023-10-20T17:00:53Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。