論文の概要: FT-RAG: A Fine-grained Retrieval-Augmented Generation Framework for Complex Table Reasoning
- arxiv url: http://arxiv.org/abs/2605.01495v1
- Date: Sat, 02 May 2026 15:32:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.803853
- Title: FT-RAG: A Fine-grained Retrieval-Augmented Generation Framework for Complex Table Reasoning
- Title(参考訳): FT-RAG:複雑なテーブル推論のためのきめ細かい検索拡張生成フレームワーク
- Authors: Zebin Guo, Weidong Geng, Ruichen Mao,
- Abstract要約: FT-RAGは,表を意味単位に分解することで,知識関連性を生かした,きめ細かいフレームワークである。
FT-RAGは、すべての指標で最高パフォーマンスのベースラインを上回っている。
本手法は,複合モダリティ文書に対する複雑な推論のための新しい最先端性能を確立する。
- 参考スコア(独自算出の注目度): 1.5612868551214847
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-Augmented Generation (RAG) enhances Large Language Models (LLMs) by grounding responses in external knowledge during inference. However, conventiona RAG systems under-perform on structured tabular data, largely due to coarse retrieval granularity and insufficient table semantic comprehension. To address these limitations, we introduce FT-RAG, a fine-grained framework that employs knowledge association by decomposing tables into entry-level semantic units to construct a structured graph. FT-RAG employs a structural neighbor expansion mechanism to find semantically connected entities during graph retrieval, followed by multi-modal fusion to consolidate the context of table retrieval results. Further, to address the scarcity of specialized datasets in this domain, we introduce Multi-Table-RAG-Lib, a benchmark comprising 9870 QA pairs with high complexity and difficulty, curated to demand multi-table integration and text-table information fusion for reasoning. FT-RAG surpasses top-performing baselines across all metrics, achieving a 23.5\% and 59.2\% improvement in table-level and cell-level Hit Rates, respectively. Generation performance also sees a remarkable 62.2\% increase in exact value accuracy recall. These metrics verify the framework's effectiveness in factual grounding across both pure tabular and heterogeneous table-text contexts. Therefore, our method establishes a new state-of-the-art performance for complex reasoning over mixed-modality documents.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) は、推論中の外部知識の応答を基盤として、Large Language Models (LLM) を強化する。
しかし、コンベンショナリRAGシステムは、粗い検索粒度とテーブルの意味理解が不十分なため、構造化表データに基づいて性能が低い。
これらの制約に対処するため、FT-RAGは、テーブルをエントリレベルの意味単位に分解して構造化グラフを構築することで、知識関連性を活用する、きめ細かいフレームワークである。
FT-RAGは、グラフ検索中にセマンティックに連結されたエンティティを見つけるために、構造的な隣り合う拡張機構を採用し、次いでテーブル検索結果のコンテキストを統合するためにマルチモーダル融合を行う。
さらに、この領域における特別なデータセットの不足に対処するため、9870QAペアの複雑さと難易度の高いベンチマークであるMulti-Table-RAG-Libを導入する。
FT-RAGは全ての指標で最高パフォーマンスのベースラインを超え、テーブルレベルとセルレベルのヒット率でそれぞれ23.5\%と59.2\%の改善を達成した。
生成性能も62.2倍の精度で向上している。
これらのメトリクスは、純粋な表と不均一なテーブルコンテキストの両方にわたる実際の基盤化におけるフレームワークの有効性を検証する。
そこで本手法は,複合モダリティ文書に対する複雑な推論のための新しい最先端性能を確立する。
関連論文リスト
- Transforming External Knowledge into Triplets for Enhanced Retrieval in RAG of LLMs [55.78708003681562]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚を、生成時に外部知識を取り入れることで緩和する。
既存のRAGアプローチは通常、コンテキストとしてテキストフラグメントを検索し、非構造化する。
本稿では,三重項に基づく検索フレームワークTri-RAGを提案する。
論文 参考訳(メタデータ) (2026-04-14T11:36:29Z) - TDATR: Improving End-to-End Table Recognition via Table Detail-Aware Learning and Cell-Level Visual Alignment [70.83664203825235]
TDATR(Table Detail-Aware Table Recognition)は、テーブルの詳細学習とセルレベルの視覚アライメントにより、エンドツーエンドのTRを改善する。
データセット固有の微調整なしで、7つのベンチマークで最先端または高い競争性能を達成する。
論文 参考訳(メタデータ) (2026-03-24T05:45:02Z) - TableRAG: A Retrieval Augmented Generation Framework for Heterogeneous Document Reasoning [7.706148486477738]
Retrieval-Augmented Generation (RAG) は、オープンドメイン質問応答においてかなりの効果を示した。
既存のRAGアプローチでは、異種文書に適用する場合に限界がある。
論文 参考訳(メタデータ) (2025-06-12T06:16:49Z) - Mixture-of-RAG: Integrating Text and Tables with Large Language Models [5.038576104344948]
不均一文書RAGは、テキストデータと階層データ間の共同検索と推論を必要とする。
階層構造と異種関係を保存する新しい3段階フレームワークであるMixRAGを提案する。
実験の結果、MixRAGは強いテキストのみ、テーブルのみ、ナイーブミキサーベースラインよりもトップ1検索を46%向上させることがわかった。
論文 参考訳(メタデータ) (2025-04-13T13:02:33Z) - RAG over Tables: Hierarchical Memory Index, Multi-Stage Retrieval, and Benchmarking [63.253294691180635]
現実世界のシナリオでは、純粋なテキスト以外では、かなりの量の知識がテーブルに格納される。
まず、階層型メモリインデックス、多段階検索、グラフ認識プロンプトからなるテーブルコーパス対応RAGフレームワークT-RAGを提案する。
論文 参考訳(メタデータ) (2025-04-02T04:24:41Z) - TableRAG: Million-Token Table Understanding with Language Models [53.039560091592215]
TableRAG(TableRAG)は、LMベースのテーブル理解用に特別に設計された検索拡張生成(RAG)フレームワークである。
TableRAGは、スキーマとセル検索を組み合わせたクエリ拡張を活用して、LMにそれを提供する前に重要な情報をピンポイントする。
以上の結果から,TableRAGは検索精度が向上し,大規模テーブル理解における最先端性能が向上することが示唆された。
論文 参考訳(メタデータ) (2024-10-07T04:15:02Z) - Beyond Extraction: Contextualising Tabular Data for Efficient
Summarisation by Language Models [0.0]
Retrieval-Augmented Generation アーキテクチャの従来の利用は、様々な文書から情報を取得するのに有効であることが証明されている。
本研究では,RAGに基づくシステムにおいて,複雑なテーブルクエリの精度を高めるための革新的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-01-04T16:16:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。