論文の概要: SQuARE: Structured Query & Adaptive Retrieval Engine For Tabular Formats
- arxiv url: http://arxiv.org/abs/2512.04292v1
- Date: Wed, 03 Dec 2025 22:11:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:45.901039
- Title: SQuARE: Structured Query & Adaptive Retrieval Engine For Tabular Formats
- Title(参考訳): SQuARE: タブラリフォーマットのための構造化クエリと適応型検索エンジン
- Authors: Chinmay Gondhalekar, Urjitkumar Patel, Fang-Chun Yeh,
- Abstract要約: SQuAREはシートレベルの複雑なルーティングを備えたハイブリッド検索フレームワークである。
ヘッダの深さとマージ密度に基づいて連続的なスコアを計算する。
SQuAREは、検索精度とエンドツーエンドの回答精度の両方において、シングルストラテジーベースラインとChatGPT-4oを一貫して上回る。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Accurate question answering over real spreadsheets remains difficult due to multirow headers, merged cells, and unit annotations that disrupt naive chunking, while rigid SQL views fail on files lacking consistent schemas. We present SQuARE, a hybrid retrieval framework with sheet-level, complexity-aware routing. It computes a continuous score based on header depth and merge density, then routes queries either through structure-preserving chunk retrieval or SQL over an automatically constructed relational representation. A lightweight agent supervises retrieval, refinement, or combination of results across both paths when confidence is low. This design maintains header hierarchies, time labels, and units, ensuring that returned values are faithful to the original cells and straightforward to verify. Evaluated on multi-header corporate balance sheets, a heavily merged World Bank workbook, and diverse public datasets, SQuARE consistently surpasses single-strategy baselines and ChatGPT-4o on both retrieval precision and end-to-end answer accuracy while keeping latency predictable. By decoupling retrieval from model choice, the system is compatible with emerging tabular foundation models and offers a practical bridge toward a more robust table understanding.
- Abstract(参考訳): 実際のスプレッドシート上での正確な質問応答は、マルチローヘッダ、マージセル、単純なチャンキングを妨害するユニットアノテーションによって困難であり、一方、堅固なSQLビューは一貫性のあるスキーマを持たないファイルで失敗する。
SQuAREはシートレベルの複雑なルーティングを備えたハイブリッド検索フレームワークである。
ヘッダの深さとマージ密度に基づいて連続的なスコアを計算し、自動的に構築されたリレーショナル表現上で構造保存されたチャンク検索またはSQLを介してクエリをルーティングする。
軽量エージェントは、信頼度が低い場合には、両方の経路にわたる検索結果の検索、精細化、または組み合わせを監督する。
この設計はヘッダ階層、タイムラベル、ユニットを維持し、返却された値が元のセルに忠実であり、容易に検証できるようにする。
マルチヘッダのコーポレートバランスシート、大まかにマージされたワールドバンクワークブック、およびさまざまなパブリックデータセットに基づいて評価されたSQuAREは、レイテンシを予測しながら、検索精度とエンドツーエンドの回答精度の両方において、シングルストラテジーベースラインとChatGPT-4oを一貫して上回っている。
検索をモデル選択から切り離すことにより、システムは新たなテーブル基盤モデルと互換性を持ち、より堅牢なテーブル理解に向けた実用的なブリッジを提供する。
関連論文リスト
- ST-Raptor: LLM-Powered Semi-Structured Table Question Answering [17.807768747239205]
現実世界のアプリケーションで広く使われている半構造化テーブルは、フレキシブルで複雑なレイアウトを含むことが多い。
これらのテーブルは、テーブルレイアウトを解釈し、関連する自然言語の質問に答えるために、人間アナリストに依存している。
大規模言語モデルを用いた半構造化テーブル質問応答のための木ベースのフレームワークST-Raptorを提案する。
論文 参考訳(メタデータ) (2025-08-25T16:48:51Z) - Weaver: Interweaving SQL and LLM for Table Reasoning [62.55797244714265]
Weaverは、構造化データ検索のためのsqlとセマンティック処理のためのLLMを組み合わせたフレキシブルなステップバイステッププランを生成する。
Weaverは、4つのTableQAデータセットで、最先端のメソッドを一貫して上回る。
論文 参考訳(メタデータ) (2025-05-25T03:27:37Z) - Generative Retrieval for Book search [106.67655212825025]
書籍検索のための効率的な生成検索フレームワークを提案する。
データ拡張とアウトライン指向の書籍エンコーディングの2つの主要コンポーネントがある。
プロプライエタリなBaiduデータセットの実験では、GBSが強力なベースラインを上回ることが示されている。
論文 参考訳(メタデータ) (2025-01-19T12:57:13Z) - Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity [59.57065228857247]
Retrieval-augmented Large Language Models (LLMs) は、質問回答(QA)のようなタスクにおける応答精度を高めるための有望なアプローチとして登場した。
本稿では,クエリの複雑さに基づいて,LLMの最適戦略を動的に選択できる適応型QAフレームワークを提案する。
オープンドメインのQAデータセットを用いて、複数のクエリの複雑さを網羅し、QAシステムの全体的な効率性と精度を高めることを示す。
論文 参考訳(メタデータ) (2024-03-21T13:52:30Z) - Beyond Extraction: Contextualising Tabular Data for Efficient
Summarisation by Language Models [0.0]
Retrieval-Augmented Generation アーキテクチャの従来の利用は、様々な文書から情報を取得するのに有効であることが証明されている。
本研究では,RAGに基づくシステムにおいて,複雑なテーブルクエリの精度を高めるための革新的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-01-04T16:16:14Z) - TRUST: An Accurate and End-to-End Table structure Recognizer Using
Splitting-based Transformers [56.56591337457137]
本稿では,TRUSTと呼ばれるテーブル構造認識手法を提案する。
変換器は、大域的な計算、完全メモリ、並列計算のためにテーブル構造認識に適している。
我々はPubTabNetやSynthTableなど,いくつかの人気のあるベンチマークで実験を行い,新しい最先端の結果を得た。
論文 参考訳(メタデータ) (2022-08-31T08:33:36Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。