論文の概要: CA-SQL: Complexity-Aware Inference Time Reasoning for Text-to-SQL via Exploration and Compute Budget Allocation
- arxiv url: http://arxiv.org/abs/2605.08057v1
- Date: Fri, 08 May 2026 17:44:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.250971
- Title: CA-SQL: Complexity-Aware Inference Time Reasoning for Text-to-SQL via Exploration and Compute Budget Allocation
- Title(参考訳): CA-SQL: 探索と計算予算配分によるテキストからSQLへの複雑な推論時間推論
- Authors: James Petullo, Nianwen Xue,
- Abstract要約: 現在のText-to-BIRDソリューションは、Bird-Benchベンチマークの最も難しいタスクでうまく機能するのに苦労しています。
これは不適切な解空間探索によるものである。
本稿では,探索の幅を動的に拡大して解候補を生成する新しいテキスト・ツー・BIRDパイプラインを提案する。
提案手法は,BIRD 開発セット問題における「混み合う」階層において,51.72%の最先端スコアを達成している。
- 参考スコア(独自算出の注目度): 6.312008949668287
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While recent advancements in inference-time learning have improved LLM reasoning on Text-to-SQL tasks, current solutions still struggle to perform well on the most challenging tasks in the Bird-Bench (BIRD) benchmark. This is due to inadequate solution space exploration, which is necessary to uncover promising candidate queries that can be further refined to produce the correct output. To address this challenge, we introduce CA-SQL, a novel Text-to-SQL pipeline that utilizes the estimated difficulty of a task to dynamically scale the breadth of the exploration for generating solution candidates. In addition, we use a custom prompt seeding method, based on principles of evolutionary search, to further elicit exploratory behavior from the base LLM and a novel voting method to select the best candidate solution at the end of the search. Experiments demonstrate that our solution achieves a state-of-the-art score of 51.72% on the "challenging" tier of BIRD development set problems, using only GPT-4o-mini, out-performing other in-context learning approaches, even those that leverage larger models. Overall, our method attains a competitive 61.06% execution accuracy and 68.77% Soft F1 score on the BIRD development dataset.
- Abstract(参考訳): 最近の推論時間学習の進歩は、Text-to-SQLタスクのLCM推論を改善したが、現在のソリューションは、Bird-Bench(BIRD)ベンチマークにおいて最も難しいタスクでうまく機能するのに依然として苦労している。
これは不適切な解空間探索のためであり、正しい出力を生成するためにさらに洗練できる有望な候補クエリを明らかにするために必要である。
この課題に対処するために,タスクの難易度を推定し,探索の幅を動的に拡大して解候補を生成する,新しいテキスト・トゥ・SQLパイプラインであるCA-SQLを紹介した。
さらに、進化探索の原理に基づく独自のプロンプトシード法を用いて、基礎LLMからの探索行動をさらに引き出すとともに、新しい投票法を用いて探索終了時の最適解を選択する。
GPT-4o-miniのみを使用し、大規模モデルを用いた場合でさえ、我々のソリューションが最先端の51.72%のBIRD開発レベルの問題に対して51.72%のスコアを達成していることを示す実験結果が得られた。
本手法は,BIRD 開発データセットにおいて,61.06% の実行精度と 68.77% のソフト F1 スコアを得た。
関連論文リスト
- SWE-SQL: Illuminating LLM Pathways to Solve User SQL Issues in Real-World Applications [42.04389915459889]
本稿では,BIRDCRITICを紹介した。
また、オープンソースのモデル機能を高めるためのトレーニング環境であるSixGymを紹介します。
これらのコンポーネントをオープンソースのエージェントであるBirdFixer-2.5-14Bに統合します。
論文 参考訳(メタデータ) (2025-06-23T09:41:37Z) - RAISE: Reasoning Agent for Interactive SQL Exploration [47.77323087050061]
本稿では,スキーマリンク,クエリ生成,反復的改善を1つのエンドツーエンドコンポーネントに統一する新しいフレームワークを提案する。
本手法は、不慣れなデータベースを扱う際に、人間がどう答えるかをエミュレートする。
論文 参考訳(メタデータ) (2025-06-02T03:07:08Z) - MCS-SQL: Leveraging Multiple Prompts and Multiple-Choice Selection For Text-to-SQL Generation [10.726734105960924]
大規模言語モデル(LLM)は、テキストからタスクへの微調整アプローチを大幅に上回る、ICL(In-context Learning)ベースの手法を実現している。
本研究は,LLMのプロンプトに対する感受性を考察し,複数のプロンプトを活用してより広い探索空間を探索する手法を提案する。
生成したクエリの精度と効率の両面から,BIRD上に新たなSOTA性能を確立する。
論文 参考訳(メタデータ) (2024-05-13T04:59:32Z) - Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation [76.76046657162306]
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
論文 参考訳(メタデータ) (2023-08-29T14:59:54Z) - JoinGym: An Efficient Query Optimization Environment for Reinforcement
Learning [58.71541261221863]
結合順序選択(JOS)は、クエリの実行コストを最小化するために結合操作を順序付けする問題である。
木質強化学習(RL)のためのクエリ最適化環境JoinGymを提案する。
JoinGymは内部で、事前計算されたデータセットから中間結果の濃度を調べることで、クエリプランのコストをシミュレートする。
論文 参考訳(メタデータ) (2023-07-21T17:00:06Z) - DIN-SQL: Decomposed In-Context Learning of Text-to-SQL with
Self-Correction [7.388002745070808]
本研究では、生成問題をサブプロブレムに分解し、それらのサブプロブレムの解を大規模言語モデルに供給する方法について検討する。
文脈内学習による我々のアプローチは、多くの微調整されたモデルを少なくとも5%上回っている。
論文 参考訳(メタデータ) (2023-04-21T15:02:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。