論文の概要: PV-SQL: Synergizing Database Probing and Rule-based Verification for Text-to-SQL Agents
- arxiv url: http://arxiv.org/abs/2604.17653v1
- Date: Sun, 19 Apr 2026 22:54:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.620676
- Title: PV-SQL: Synergizing Database Probing and Rule-based Verification for Text-to-SQL Agents
- Title(参考訳): PV-SQL: テキストからSQLへのエージェントのためのデータベースの検索とルールベースの検証
- Authors: Yuan Tian, Tianyi Zhang,
- Abstract要約: テキスト・ツー・システムは、特に微妙な要求のある複雑なクエリにおいて、深いコンテキスト理解に苦しむことが多い。
本稿では,2つの相補的コンポーネント(プローブと検証)を通じて,これらの障害に対処するエージェントフレームワークであるPV-Verifyを紹介する。
Probeコンポーネントは、データベースから具体的なレコードを取得するための探索クエリを反復的に生成し、値形式、列のセマンティクス、テーブル間の関係の曖昧さを解消し、よりリッチなコンテキスト理解を構築する。
- 参考スコア(独自算出の注目度): 7.865833770467325
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-SQL systems often struggle with deep contextual understanding, particularly for complex queries with subtle requirements. We present PV-SQL, an agentic framework that addresses these failures through two complementary components: Probe and Verify. The Probe component iteratively generates probing queries to retrieve concrete records from the database, resolving ambiguities in value formats, column semantics, and inter-table relationships to build richer contextual understanding. The Verify component employs a rule-based method to extract verifiable conditions and construct an executable checklist, enabling iterative SQL refinement that effectively reduces missing constraints. Experiments on the BIRD benchmarks show that PV-SQL outperforms the best text-to-SQL baseline by 5% in execution accuracy and 20.8% in valid efficiency score while consuming fewer tokens.
- Abstract(参考訳): テキストからSQLへのシステムは、特に微妙な要求のある複雑なクエリにおいて、深いコンテキスト理解に苦しむことが多い。
本稿では,2つの相補的コンポーネント(プローブと検証)を通じて,これらの障害に対処するエージェントフレームワークであるPV-SQLを紹介する。
Probeコンポーネントは、データベースから具体的なレコードを取得するための探索クエリを反復的に生成し、値形式、列のセマンティクス、テーブル間の関係の曖昧さを解消し、よりリッチなコンテキスト理解を構築する。
Verifyコンポーネントは、検証可能な条件を抽出し、実行可能なチェックリストを構築するためのルールベースのメソッドを使用して、欠落した制約を効果的に削減する反復的なSQLリファインメントを可能にする。
BIRDベンチマークの実験では、PV-SQLは最高のテキストとSQLのベースラインを5%、有効な効率スコアは20.8%で上回り、トークンの消費は少ない。
関連論文リスト
- SpotIt+: Verification-based Text-to-SQL Evaluation with Database Constraints [9.733987594033907]
SpotIt+は、有界同値検証による音声合成システムの評価ツールである。
本稿では,ルールベース仕様マイニングとLLMに基づく検証を組み合わせた制約マイニングパイプラインを提案する。
BIRDデータセットの実験結果は、マイニングされた制約により、SpotIt+はより現実的な差別化データベースを生成することができることを示している。
論文 参考訳(メタデータ) (2026-03-04T17:51:42Z) - Bridging Global Intent with Local Details: A Hierarchical Representation Approach for Semantic Validation in Text-to-SQL [30.78817492504152]
HEROは、グローバルな意図と局所的な詳細を統合する階層的な表現アプローチである。
我々はNested Message Passing Neural Network (NMPNN) を用いて、関係スキーマ誘導セマンティクスにおける固有情報をキャプチャする。
提案手法は既存の最先端手法よりも優れており,AUPRCの9.40%,AUROCの12.35%が意味的不整合を識別している。
きめ細かいセマンティックエラーを検出し、よりきめ細かいフィードバックで大きな言語モデルを提供し、最終的にはデータクエリプラットフォームの信頼性と解釈性を高めます。
論文 参考訳(メタデータ) (2025-12-28T02:25:33Z) - Query Carefully: Detecting the Unanswerables in Text-to-SQL Tasks [1.7781743265224403]
テキスト・ツー・システムでは、専門家以外の者が自然言語を使ってデータベースと対話できる。
あいまいな、スコープ外、あるいは解決不可能なクエリに対して実行可能なsqlを生成する傾向は、出力が正しいと誤解される可能性があるため、隠れたリスクをもたらす。
クエリは、sql生成を明示的なあいまいさと不可解な入力の処理と統合するパイプラインである。
論文 参考訳(メタデータ) (2025-12-19T12:22:27Z) - Companion Agents: A Table-Information Mining Paradigm for Text-to-SQL [8.159121916366727]
BIRDのような大規模テキスト・ツー・キュレートのベンチマークは通常、利用可能な外部知識だけでなく、完全で正確なデータベースアノテーションを前提としている。
このミスマッチはドメイン・オブ・ザ・ドメイン・テキスト・トゥ・アーティファクトシステムの現実的な適用性を著しく制限する。
本稿では,関係データベースに内在する固有できめ細かな情報を活用するデータベース中心の手法を提案する。
論文 参考訳(メタデータ) (2025-12-17T07:11:55Z) - Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。
ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文 参考訳(メタデータ) (2025-11-26T13:52:50Z) - UNJOIN: Enhancing Multi-Table Text-to-SQL Generation via Schema Simplification [50.59009084277447]
論理生成からスキーマ要素の検索を分離するフレームワークUNJOINを紹介する。
最初の段階では、各列をテーブル名でプレフィックスすることで、データベース内のすべてのテーブルの列名を単一のテーブル表現にマージします。
第2段階では、クエリは、この単純化されたスキーマに基づいて生成され、JOIN、UNION、リレーショナルロジックを再構築することで、元のスキーマにマップされる。
論文 参考訳(メタデータ) (2025-05-23T17:28:43Z) - RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - E-SQL: Direct Schema Linking via Question Enrichment in Text-to-SQL [1.187832944550453]
E-Seekは、直接スキーマリンクと候補述語拡張を通じてこれらの課題に対処するように設計された、新しいパイプラインである。
E-Seekは、関連するデータベース項目(テーブル、列、値)と条件を直接質問とsql構築計画に組み込むことで、自然言語クエリを強化し、クエリとデータベース構造の間のギャップを埋める。
総合的な評価は、E-Seekが競争性能、特に66.29%の実行精度で複雑なクエリに優れていることを示している。
論文 参考訳(メタデータ) (2024-09-25T09:02:48Z) - DAC: Decomposed Automation Correction for Text-to-SQL [51.48239006107272]
De Automation Correction (DAC)を導入し、エンティティリンクとスケルトン解析を分解することでテキストから合成を補正する。
また,本手法では,ベースライン法と比較して,スパイダー,バード,カグルDBQAの平均値が平均3.7%向上することを示した。
論文 参考訳(メタデータ) (2024-08-16T14:43:15Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。