論文の概要: EGREFINE: An Execution-Grounded Optimization Framework for Text-to-SQL Schema Refinement
- arxiv url: http://arxiv.org/abs/2605.00628v1
- Date: Fri, 01 May 2026 13:01:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.954324
- Title: EGREFINE: An Execution-Grounded Optimization Framework for Text-to-SQL Schema Refinement
- Title(参考訳): EGREFINE: テキストからSQLへのスキーマリファインメントのための実行域最適化フレームワーク
- Authors: Jiaqian Wang, Yutao Qi, Wenjin Hou, Yu Pang, Rui Yang,
- Abstract要約: 既存のアプローチでは、スキーマを固定として扱い、下流でエラーに対処する。
我々は、制約付き最適化問題としてスキーマの洗練を枠組み化した。
この問題の計算硬度を解析し、カラムワイドグリーディ分解を動機付ける。
- 参考スコア(独自算出の注目度): 10.675982676332941
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-to-SQL enables non-expert users to query databases in natural language, yet real-world schemas often suffer from ambiguous, abbreviated, or inconsistent naming conventions that degrade model accuracy. Existing approaches treat schemas as fixed and address errors downstream. In this paper, we frame schema refinement as a constrained optimization problem: find a renaming function that maximizes downstream Text-to-SQL execution accuracy while preserving query equivalence through database views. We analyze the computational hardness of this problem, which motivates a column-wise greedy decomposition, and instantiate it as EGRefine: a four-phase pipeline that screens ambiguous columns, generates context-aware candidate names, verifies them through execution-grounded feedback, and materializes the result as non-destructive SQL views. The pipeline carries two structural properties: column-local non-degradation, ensured by the conservative selection rule in the verification phase, and database-level query equivalence, ensured by the view-based materialization phase. Together they make the resulting refinement safe by construction at the column level, with cross-column and prompt-level interactions handled empirically rather than analytically. Across controlled schema-degradation, real-world, and enterprise benchmarks, EGRefine recovers accuracy lost to schema naming noise where applicable and correctly abstains where the underlying task exceeds current Text-to-SQL capabilities, with refined schemas transferring across model families to enable refine-once, serve-many-models deployment. Code and data are publicly available at https://github.com/ai-jiaqian/EGRefine.
- Abstract(参考訳): Text-to-SQLにより、非専門家のユーザは自然言語でデータベースをクエリできるが、実際のスキーマは、モデルの精度を低下させる曖昧さ、短縮性、一貫性のない命名規則に悩まされることが多い。
既存のアプローチでは、スキーマを固定として扱い、下流でエラーに対処する。
本稿では,データベースビューによるクエリ等価性を保ちながら,下流のText-to-SQL実行精度を最大化するリネーム関数を求める。
本研究では, カラムワイズグリーディ分解を動機付け, EGRefineとしてインスタンス化し, 曖昧なカラムをスクリーニングし, コンテキスト対応の候補名を生成し, 実行地からのフィードバックにより検証し, 結果を非破壊的なSQLビューとして実現する。
パイプラインは、検証フェーズにおける保守的な選択規則によって保証されるカラムローカル非劣化と、ビューベースの物質化フェーズによって保証されるデータベースレベルのクエリ等価性という2つの構造特性を持っている。
結果として得られた改善をカラムレベルで構築することで安全にし、クロスカラムとプロンプトレベルの相互作用は分析的にではなく経験的に扱われる。
コントロールされたスキーマ劣化、実世界、エンタープライズベンチマーク全体にわたって、EGRefineは、スキーマ命名ノイズによって失われた正確さを回復する。
コードとデータはhttps://github.com/ai-jiaqian/EGRefine.comで公開されている。
関連論文リスト
- Agent-Agnostic Evaluation of SQL Accuracy in Production Text-to-SQL Systems [2.051598597332424]
運用環境におけるテキストからネイティブ(T2native)評価は、既存のベンチマークが対処しない根本的な課題を生じさせる。
本稿では,自然言語入力のみで動作する生産評価システムSTEFを提案する。
STEFは、フィルタアライメント、セマンティック検証、評価器の信頼性を含む合成計量を用いて、解釈可能な0から100の精度スコアを生成する。
論文 参考訳(メタデータ) (2026-04-30T15:59:28Z) - ASTRA: Adaptive Semantic Tree Reasoning Architecture for Complex Table Question Answering [55.55968342644846]
テーブルのシリアライゼーションは、複雑なテーブル質問応答において、LLM(Large Language Models)にとって重要なボトルネックであり続けている。
既存のシリアライゼーションメソッドは明示的な階層をキャプチャできず、スキーマの柔軟性が欠如している。
本稿では,AdaSTRとDuTRの2つの主要モジュールを含むASTRA(Adaptive Semantic Tree Reasoning Architecture)を提案する。
複雑なテーブルベンチマーク実験により,本手法がSOTA(State-of-the-art)性能を実現することを示す。
論文 参考訳(メタデータ) (2026-04-10T06:09:41Z) - ErrorLLM: Modeling SQL Errors for Text-to-SQL Refinement [57.98138819417949]
テキスト・ツー・クエリを明示的にモデル化するフレームワークであるErrorLLMを提案する。
ErrorLLMは、バックボーンの初期生成よりも大幅に改善されていることを示す。
ErrorLLMは、精錬効率を維持しつつ、高い検出F1スコアで両面に対処する。
論文 参考訳(メタデータ) (2026-03-04T05:27:20Z) - Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。
ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文 参考訳(メタデータ) (2025-11-26T13:52:50Z) - Rethinking Schema Linking: A Context-Aware Bidirectional Retrieval Approach for Text-to-SQL [14.44163500388232]
本稿では,スキーマリンクを独立した問題として扱う,コンテキスト対応の双方向スキーマ検索フレームワークを提案する。
提案手法は,テーブル優先検索と列選択,列優先検索とテーブル選択の2つの相補的戦略を組み合わせる。
提案手法は,完全なスキーマ設定と完全なスキーマ設定のギャップを50%縮小する。
論文 参考訳(メタデータ) (2025-10-16T04:46:22Z) - SQL-Exchange: Transforming SQL Queries Across Domains [5.5643498845134545]
我々は、ソースクエリ構造を保存しつつ、ターゲットスキーマに適合するようにドメイン固有の要素を適用することで、異なるデータベーススキーマ間でクエリをマッピングするフレームワークを導入する。
本研究は,テキスト・トゥ・コンテクスト・システムにおけるテキスト・トゥ・コンテクスト・ラーニングの性能向上に対する,そのようなマッピングが有用かつ有益である条件について検討する。
論文 参考訳(メタデータ) (2025-08-09T19:55:54Z) - UNJOIN: Enhancing Multi-Table Text-to-SQL Generation via Schema Simplification [50.59009084277447]
論理生成からスキーマ要素の検索を分離するフレームワークUNJOINを紹介する。
最初の段階では、各列をテーブル名でプレフィックスすることで、データベース内のすべてのテーブルの列名を単一のテーブル表現にマージします。
第2段階では、クエリは、この単純化されたスキーマに基づいて生成され、JOIN、UNION、リレーショナルロジックを再構築することで、元のスキーマにマップされる。
論文 参考訳(メタデータ) (2025-05-23T17:28:43Z) - RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - The Death of Schema Linking? Text-to-SQL in the Age of Well-Reasoned Language Models [0.9149661171430259]
次世代の大規模言語モデル(LLM)を使用する場合のスキーマリンクを再検討する。
より新しいモデルでは,無関係なモデルが多数存在する場合でも,生成時に関連するスキーマ要素を利用することが可能であることが実証的に判明した。
文脈情報をフィルタリングする代わりに、拡張、選択、修正などのテクニックを強調し、テキストからBIRDパイプラインの精度を向上させるためにそれらを採用する。
論文 参考訳(メタデータ) (2024-08-14T17:59:04Z) - Schema-Aware Multi-Task Learning for Complex Text-to-SQL [4.913409359995421]
複雑なsqlクエリのためのスキーマ対応マルチタスク学習フレームワーク(MT)を提案する。
具体的には、有効な質問スキーマリンクを識別するために、識別器モジュールを設計する。
デコーダ側では、テーブルと列の接続を記述するために、6種類の関係を定義します。
論文 参考訳(メタデータ) (2024-03-09T01:13:37Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。