論文の概要: R$^3$-SQL: Ranking Reward and Resampling for Text-to-SQL
- arxiv url: http://arxiv.org/abs/2604.25325v1
- Date: Tue, 28 Apr 2026 07:40:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.762736
- Title: R$^3$-SQL: Ranking Reward and Resampling for Text-to-SQL
- Title(参考訳): R$^3$-SQL: テキストからSQLへのリワードとリサンプリングのランク付け
- Authors: Hojae Han, Yeonseok Jeong, Seung-won Hwang, Zhewei Yao, Yuxiong He,
- Abstract要約: R$3$-はBIRD-devで75.03の精度を達成した。
- 参考スコア(独自算出の注目度): 55.967050404665606
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern Text-to-SQL systems generate multiple candidate SQL queries and rank them to judge a final prediction. However, existing methods face two limitations. First, they often score functionally equivalent SQL queries inconsistently despite identical execution results. Second, ranking cannot recover when the correct SQL is absent from the candidate pool. We propose R$^3$-SQL, a Text-to-SQL framework that addresses both issues through unified reward for ranking and resampling. R$^3$-SQL first groups candidates by execution result and ranks groups for consistency. To score each group, it combines a pairwise preference across groups with a pointwise utility from the best group rank and size, capturing relative preference, consistency, and candidate quality. To improve candidate recall, R$^3$-SQL introduces agentic resampling, which judges the generated candidate pool and selectively resamples when the correct SQL is likely absent. R$^3$-SQL achieves 75.03 execution accuracy on BIRD-dev, a new state of the art among methods using models with disclosed sizes, with consistent gains across five benchmarks.
- Abstract(参考訳): 現代のText-to-SQLシステムは、複数の候補SQLクエリを生成し、それらをランク付けして最終的な予測を判断する。
しかし、既存の方法には2つの制限がある。
まず、同じ実行結果にもかかわらず、関数的に等価なSQLクエリを不整合にスコアすることが多い。
第二に、正しいSQLが候補プールから欠落した場合、ランキングは回復できない。
R$^3$-SQLは、ランキングと再サンプリングの統一的な報酬を通じて、両方の問題に対処するテキストからSQLのフレームワークである。
R$^3$-SQL まず、実行結果によって候補をグループ化し、一貫性のためにグループをランク付けする。
各グループを評価するために、グループ間でペアワイズな選好と、グループランクとサイズからポイントワイズなユーティリティを組み合わせて、相対的な選好、一貫性、および候補品質をキャプチャする。
候補リコールを改善するため、R$^3$-SQLではエージェントリサンプリングが導入されている。
R$^3$-SQLはBIRD-dev上で75.03の実行精度を達成する。
関連論文リスト
- JudgeSQL: Reasoning over SQL Candidates with Weighted Consensus Tournament [26.476304887882133]
審査員は、構造化された推論と重み付けされたコンセンサストーナメント機構を通じて候補者の選択を再定義する原則的な枠組みである。
審査員は優れた判断能力と優れたクロススケール一般化とジェネレータ能力を示す。
論文 参考訳(メタデータ) (2025-10-17T11:46:38Z) - PARROT: A Benchmark for Evaluating LLMs in Cross-System SQL Translation [21.0303026118673]
本稿では CrOss-System SQL Translation のための実践的で現実的なベンチマック PARROT を紹介する。
PARROTは38のオープンソースベンチマークと実世界のビジネスサービスから598の翻訳ペアで構成されている。
28,003 の PARROT-Diverse や 5,306 のサンプルを持つ PARROT-Simple など,複数のベンチマーク版も提供しています。
論文 参考訳(メタデータ) (2025-09-27T14:41:13Z) - XiYan-SQL: A Novel Multi-Generator Framework For Text-to-SQL [48.45491386478092]
本稿では,複数の候補を効果的に生成・活用する革新的なフレームワークであるXiYan-を提案する。
XiYan-はBIRDベンチマークで75.63%の新しいSOTA性能を達成した。
また、スパイダーテストセットのSOTA性能も89.65%の精度で達成した。
論文 参考訳(メタデータ) (2025-07-07T06:50:46Z) - SQLFixAgent: Towards Semantic-Accurate Text-to-SQL Parsing via Consistency-Enhanced Multi-Agent Collaboration [26.193588535592767]
本稿では,SQLの誤検出と修復を目的とした,新しい一貫性向上型マルチエージェント協調フレームワークを提案する。
提案するフレームワークを5つのテキスト・テキスト・ベンチマークで評価する。
本手法はベースラインモデルの性能を継続的に向上させる。
私たちのフレームワークは、他の高度なメソッドよりもトークン効率が高いので、より競争力があります。
論文 参考訳(メタデータ) (2024-06-19T09:57:19Z) - Benchmarking and Improving Text-to-SQL Generation under Ambiguity [25.283118418288293]
我々はAmbiQTと呼ばれる新しいベンチマークを開発し、各テキストは語彙的および/または構造的あいまいさのために2つのもっともらしいSQLとして解釈できる。
提案するLogicalBeamは,計画ベースのテンプレート生成と制約付きインフィルを併用して,sql論理空間をナビゲートする新しい復号アルゴリズムである。
論文 参考訳(メタデータ) (2023-10-20T17:00:53Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z) - Bertrand-DR: Improving Text-to-SQL using a Discriminative Re-ranker [1.049360126069332]
生成テキスト-リミモデルの性能向上を図るために,新しい離散型リランカを提案する。
テキスト・ト・リミモデルとリランカモデルの相対強度を最適性能として解析する。
本稿では,2つの最先端テキスト-リミモデルに適用することで,リランカの有効性を実証する。
論文 参考訳(メタデータ) (2020-02-03T04:52:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。