論文の概要: Evidence-Guided Schema Normalization for Temporal Tabular Reasoning
- arxiv url: http://arxiv.org/abs/2512.00329v1
- Date: Sat, 29 Nov 2025 05:40:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.17313
- Title: Evidence-Guided Schema Normalization for Temporal Tabular Reasoning
- Title(参考訳): Evidence-Guided Schema normalization for Temporal Tabular Reasoning
- Authors: Ashish Thanga, Vibhu Dixit, Abhilash Shankarampeta, Vivek Gupta,
- Abstract要約: 半構造化テーブルの進化に対する時間的推論は、現在のQAシステムに課題をもたらす。
スキーマ設計の品質は、モデルのキャパシティよりもQAの精度に大きな影響を与えます。
我々は、文脈を保存する正規化、曖昧さを減らす意味的命名、一貫した時間的アンカーの3つのエビデンスに基づく原則を確立する。
- 参考スコア(独自算出の注目度): 7.888957857563514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Temporal reasoning over evolving semi-structured tables poses a challenge to current QA systems. We propose a SQL-based approach that involves (1) generating a 3NF schema from Wikipedia infoboxes, (2) generating SQL queries, and (3) query execution. Our central finding challenges model scaling assumptions: the quality of schema design has a greater impact on QA precision than model capacity. We establish three evidence-based principles: normalization that preserves context, semantic naming that reduces ambiguity, and consistent temporal anchoring. Our best configuration (Gemini 2.5 Flash schema + Gemini-2.0-Flash queries) achieves 80.39 EM, a 16.8\% improvement over the baseline (68.89 EM).
- Abstract(参考訳): 半構造化テーブルの進化に対する時間的推論は、現在のQAシステムに課題をもたらす。
本稿では,(1)ウィキペディアのインフォボックスから3NFスキーマを生成し,(2)SQLクエリを生成し,(3)クエリ実行を行うSQLベースのアプローチを提案する。
スキーマ設計の品質は、モデルのキャパシティよりもQAの精度に大きな影響を与えます。
我々は、文脈を保存する正規化、曖昧さを減らす意味的命名、一貫した時間的アンカーの3つのエビデンスに基づく原則を確立する。
私たちの最高の設定(Gemini 2.5 Flash schema + Gemini-2.0-Flash query)は80.39 EMを実現し、ベースライン(68.89 EM)よりも16.8 %改善しました。
関連論文リスト
- Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。
ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文 参考訳(メタデータ) (2025-11-26T13:52:50Z) - Exploring Database Normalization Effects on SQL Generation [0.9256004093538199]
正規化は、自然言語 tosql (NL2) システムにおいて批判的であるが、しばしば見過ごされる要素である。
正規化レベルの異なる合成および実世界のデータセット上で,8つの主要な大言語モデルを評価する。
この結果から,NL2アプリケーションの最適スキーマ設計は,サポートするクエリの種類に依存することが示唆された。
論文 参考訳(メタデータ) (2025-10-02T13:11:30Z) - Learning to Route: A Rule-Driven Agent Framework for Hybrid-Source Retrieval-Augmented Generation [55.47971671635531]
大言語モデル(LLM)は、一般質問回答(QA)において顕著な性能を示した。
Retrieval-Augmented Generation (RAG)は、LLMを外部知識で強化することで、この制限に対処する。
既存のシステムは、主に構造化されていないドキュメントに依存しているが、主にリレーショナルデータベースを見下ろしている。
論文 参考訳(メタデータ) (2025-09-30T22:19:44Z) - TableZoomer: A Collaborative Agent Framework for Large-scale Table Question Answering [26.00027389659854]
TableZoomerは、テーブル質問応答(TQA)タスクのためのプログラミングベースのエージェントフレームワークである。
2)列選択とエンティティリンクを通じてサブテーブルスキーマを動的に生成するクエリ対応テーブルズーム機構,(3)クエリを実行可能なコードに変換するプログラム・オブ・ソート(PoT)戦略により,数値幻覚を緩和する。
論文 参考訳(メタデータ) (2025-09-01T09:53:01Z) - Schema-R1: A reasoning training approach for schema linking in Text-to-SQL Task [3.686808512438363]
スキーマリンクモデルに対する現在の微調整アプローチは、ロートラーニングパラダイムを採用している。
強化学習を用いて学習した推論スキーマリンクモデルである-R1を提案する。
論文 参考訳(メタデータ) (2025-06-13T17:46:02Z) - LLM-Symbolic Integration for Robust Temporal Tabular Reasoning [69.27153114778748]
本研究では,システムおよび制御された評価のための合成データセットであるTempTabQA-Cを紹介する。
この構造化アプローチにより、LLM(Large Language Models)はsqlクエリの生成と実行を可能にし、一般化とバイアス軽減の強化を行う。
論文 参考訳(メタデータ) (2025-06-06T05:14:04Z) - LinkAlign: Scalable Schema Linking for Real-World Large-Scale Multi-Database Text-to-SQL [24.740161980003652]
LinkAlignは、数千のフィールドを持つ大規模データベースに適した、新しいフレームワークである。
LinkAlignは、すべてのスキーマリンクメトリクスにおいて、既存のベースラインを一貫して上回る。
これは、Spider 2.0-Liteベンチマークで33.09%の新しい最先端スコアを達成した。
論文 参考訳(メタデータ) (2025-03-24T11:53:06Z) - Effective Instruction Parsing Plugin for Complex Logical Query Answering on Knowledge Graphs [51.33342412699939]
知識グラフクエリ埋め込み(KGQE)は、不完全なKGに対する複雑な推論のために、低次元KG空間に一階論理(FOL)クエリを埋め込むことを目的としている。
近年の研究では、FOLクエリの論理的セマンティクスをよりよく捉えるために、さまざまな外部情報(エンティティタイプや関係コンテキストなど)を統合している。
コードのようなクエリ命令から遅延クエリパターンをキャプチャする効果的なクエリ命令解析(QIPP)を提案する。
論文 参考訳(メタデータ) (2024-10-27T03:18:52Z) - KET-QA: A Dataset for Knowledge Enhanced Table Question Answering [63.56707527868466]
本研究では,TableQAの外部知識源として知識ベース(KB)を用いることを提案する。
すべての質問は、答えるテーブルとサブグラフの両方からの情報を統合する必要がある。
我々は,膨大な知識サブグラフから関連する情報を抽出するために,レトリバー・レゾナー構造パイプラインモデルを設計する。
論文 参考訳(メタデータ) (2024-05-13T18:26:32Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。