論文の概要: Extending Confidence-Based Text2Cypher with Grammar and Schema Aware Filtering
- arxiv url: http://arxiv.org/abs/2605.10318v1
- Date: Mon, 11 May 2026 10:18:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.724963
- Title: Extending Confidence-Based Text2Cypher with Grammar and Schema Aware Filtering
- Title(参考訳): 文法とスキーマ認識による信頼度に基づくText2Cypherの拡張
- Authors: Makbule Gulcin Ozsoy,
- Abstract要約: 構造化制約がText2Cypherのテスト時間推論にどのように使えるかを検討する。
テスト時に単純な構造チェックを追加することで、Text2Cypher生成の信頼性が向上することを示す。
- 参考スコア(独自算出の注目度): 0.20305676256390937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) allow users to query databases using natural language by translating questions into executable queries. Despite strong progress on tasks such as Text2SQL, Text2SPARQL, and Text2Cypher, most existing methods focus on better prompting, fine-tuning, or iterative refinement. However, they often do not explicitly enforce structural constraints, such as syntactic validity and schema consistency. This can reduce reliability, since generated queries must satisfy both syntax rules and database schema constraints to be executable. In this work, we study how structured constraints can be used in test-time inference for Text2Cypher. We focus on post-generation validation to improve query correctness. We extend a confidence-based inference framework with a sequential filtering process that combines confidence scoring, grammar validation, and schema constraints before final aggregation. This lets us analyze how different constraint types affect generated queries. Our experiments with two instruction-tuned models show that grammar-based filtering improves syntactic validity. Schema-aware filtering further improves execution quality by enforcing consistency with the database structure. However, stronger filtering also increases the number of empty predictions and reduces execution coverage. Overall, we show that adding simple structural checks at test time improves the reliability of Text2Cypher generation, and we provide a clearer view of how syntax and schema constraints contribute differently.
- Abstract(参考訳): 大規模言語モデル(LLM)では、質問を実行可能なクエリに変換することで、自然言語を使ってデータベースをクエリすることができる。
Text2SQL、Text2SPARQL、Text2Cypherといったタスクの進歩にもかかわらず、既存のほとんどのメソッドは、より良いプロンプト、微調整、反復的な改善にフォーカスしている。
しかし、それらは構文的妥当性やスキーマの整合性といった構造的制約を明示的に強制しないことが多い。
生成されたクエリは、構文ルールとデータベーススキーマの制約の両方を満たす必要があるため、信頼性が低下する可能性がある。
本研究では,Text2Cypherに対するテスト時間推論において,構造化制約をどのように利用できるかを検討する。
我々は、クエリの正確性を改善するために、ポストジェネレーションの検証に焦点をあてる。
ファイナルアグリゲーションの前に、信頼度スコアリング、文法検証、スキーマ制約を組み合わせたシーケンシャルなフィルタリングプロセスにより、信頼度ベースの推論フレームワークを拡張します。
これにより、異なる制約タイプが生成されたクエリにどのように影響するかを分析することができます。
2つの命令調整モデルによる実験により,文法に基づくフィルタリングが構文的妥当性を向上させることが示された。
スキーマ対応フィルタリングは、データベース構造との整合性を強化することにより、実行品質をさらに向上する。
しかし、より強力なフィルタリングは、空の予測数を増やし、実行カバレッジを減少させる。
全体として、テスト時に単純な構造チェックを追加することで、Text2Cypher生成の信頼性が向上し、構文とスキーマの制約がどう異なるかを明確にする。
関連論文リスト
- EGREFINE: An Execution-Grounded Optimization Framework for Text-to-SQL Schema Refinement [10.675982676332941]
既存のアプローチでは、スキーマを固定として扱い、下流でエラーに対処する。
我々は、制約付き最適化問題としてスキーマの洗練を枠組み化した。
この問題の計算硬度を解析し、カラムワイドグリーディ分解を動機付ける。
論文 参考訳(メタデータ) (2026-05-01T13:01:59Z) - Agent-Agnostic Evaluation of SQL Accuracy in Production Text-to-SQL Systems [2.051598597332424]
運用環境におけるテキストからネイティブ(T2native)評価は、既存のベンチマークが対処しない根本的な課題を生じさせる。
本稿では,自然言語入力のみで動作する生産評価システムSTEFを提案する。
STEFは、フィルタアライメント、セマンティック検証、評価器の信頼性を含む合成計量を用いて、解釈可能な0から100の精度スコアを生成する。
論文 参考訳(メタデータ) (2026-04-30T15:59:28Z) - ASTRA: Adaptive Semantic Tree Reasoning Architecture for Complex Table Question Answering [55.55968342644846]
テーブルのシリアライゼーションは、複雑なテーブル質問応答において、LLM(Large Language Models)にとって重要なボトルネックであり続けている。
既存のシリアライゼーションメソッドは明示的な階層をキャプチャできず、スキーマの柔軟性が欠如している。
本稿では,AdaSTRとDuTRの2つの主要モジュールを含むASTRA(Adaptive Semantic Tree Reasoning Architecture)を提案する。
複雑なテーブルベンチマーク実験により,本手法がSOTA(State-of-the-art)性能を実現することを示す。
論文 参考訳(メタデータ) (2026-04-10T06:09:41Z) - Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。
ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文 参考訳(メタデータ) (2025-11-26T13:52:50Z) - E3-Rewrite: Learning to Rewrite SQL for Executability, Equivalence,and Efficiency [35.2472369073336]
E3-Rewriteは実行可能で等価で効率的なクエリを生成するフレームワークである。
コンテキスト構築モジュールと強化学習フレームワークの2つのコアコンポーネントを統合している。
E3-Rewriteは、主要なベースラインと比較してクエリ実行時間を最大25.6%短縮することができる。
論文 参考訳(メタデータ) (2025-08-12T15:38:10Z) - Enhancing Text2Cypher with Schema Filtering [0.20305676256390937]
Cypherはグラフデータベースのための強力なクエリ言語である。
近年の大規模言語モデルの進歩により、自然言語の質問をCypherクエリ - Text2Cypherに翻訳できるようになった。
本研究では、Text2Cypherタスクのさまざまなスキーマフィルタリング方法を検討し、トークンの長さ、パフォーマンス、コストへの影響を分析する。
論文 参考訳(メタデータ) (2025-05-08T10:42:20Z) - DAC: Decomposed Automation Correction for Text-to-SQL [51.48239006107272]
De Automation Correction (DAC)を導入し、エンティティリンクとスケルトン解析を分解することでテキストから合成を補正する。
また,本手法では,ベースライン法と比較して,スパイダー,バード,カグルDBQAの平均値が平均3.7%向上することを示した。
論文 参考訳(メタデータ) (2024-08-16T14:43:15Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。