論文の概要: Decomposing Retrieval Failures in RAG for Long-Document Financial Question Answering
- arxiv url: http://arxiv.org/abs/2602.17981v1
- Date: Fri, 20 Feb 2026 04:31:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 18:01:41.227
- Title: Decomposing Retrieval Failures in RAG for Long-Document Financial Question Answering
- Title(参考訳): 長期財務質問応答のためのRAGの検索失敗の分解
- Authors: Amine Kobeissi, Philippe Langlais,
- Abstract要約: 正しい文書が検索されるが、回答を含むページやチャンクが欠落する頻繁な障害モードについて検討する。
この文書内検索失敗モードは,QA(Financial Question Answering)文学において,体系的に限定的に注目されている。
複数レベルの粒度, 文書, ページ, チャンクレベルでの検索を評価し, オラクルに基づく解析を導入し, 検索および生成性能に関する実証的な上限を提供する。
- 参考スコア(独自算出の注目度): 10.782576574175044
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-augmented generation is increasingly used for financial question answering over long regulatory filings, yet reliability depends on retrieving the exact context needed to justify answers in high stakes settings. We study a frequent failure mode in which the correct document is retrieved but the page or chunk that contains the answer is missed, leading the generator to extrapolate from incomplete context. Despite its practical significance, this within-document retrieval failure mode has received limited systematic attention in the Financial Question Answering (QA) literature. We evaluate retrieval at multiple levels of granularity, document, page, and chunk level, and introduce an oracle based analysis to provide empirical upper bounds on retrieval and generative performance. On a 150 question subset of FinanceBench, we reproduce and compare diverse retrieval strategies including dense, sparse, hybrid, and hierarchical methods with reranking and query reformulation. Across methods, gains in document discovery tend to translate into stronger page recall, yet oracle performance still suggests headroom for page and chunk level retrieval. To target this gap, we introduce a domain fine-tuned page scorer that treats pages as an intermediate retrieval unit between documents and chunks. Unlike prior passage-based hierarchical retrieval, we fine-tune a bi-encoder specifically for page-level relevance on financial filings, exploiting the semantic coherence of pages. Overall, our results demonstrate a significant improvement in page recall and chunk retrieval.
- Abstract(参考訳): 検索の強化された世代は、長期の規制申請よりも金融上の問題への回答にますます使われているが、信頼性は、高利得設定で回答を正当化するために必要な正確なコンテキストを取得することに依存している。
正しい文書を検索する頻繁な障害モードについて検討するが、回答を含むページやチャンクが欠落し、生成元は不完全なコンテキストから外挿する。
その実用的重要性にもかかわらず、この文書内検索失敗モードは、金融質問回答(QA)文学において、体系的に限定的に注目されている。
複数レベルの粒度, 文書, ページ, チャンクレベルでの検索を評価し, オラクルに基づく解析を導入し, 検索および生成性能に関する実証的な上限を提供する。
ファイナンスベンチの150の質問サブセットでは、密度、疎度、ハイブリッド、階層的手法などの多様な検索戦略を再現・比較し、再ランク付けとクエリの再構成を行う。
メソッド全体では、ドキュメント発見の利得はページリコールの強化につながる傾向にあるが、オラクルのパフォーマンスは依然としてページレベルの検索とチャンクレベルの検索のためのヘッドルームを示唆している。
このギャップを解消するために、文書とチャンク間の中間的な検索単位としてページを扱うドメイン微調整ページスコアラを導入する。
従来のパスベースの階層検索とは異なり、ファイナンシャルファイリングにおけるページレベルの関連性に特化したバイエンコーダを微調整し、ページのセマンティックコヒーレンスを利用する。
その結果,ページリコールとチャンク検索が大幅に改善した。
関連論文リスト
- Resolving Evidence Sparsity: Agentic Context Engineering for Long-Document Understanding [49.26132236798123]
視覚言語モデル(VLM)は、文書理解における主要なアプローチになりつつある。
本稿では,粗いプロセスにおいて,検索者と4つの協調エージェントを編成するマルチエージェントフレームワークSLEUTHを提案する。
このフレームワークは、検索したページ内の重要なテキストおよび視覚的手がかりを特定し、テーブルやチャートなどの健全な視覚的エビデンスをフィルタし、クエリを分析して推論戦略を考案する。
論文 参考訳(メタデータ) (2025-11-28T03:09:40Z) - Query Decomposition for RAG: Balancing Exploration-Exploitation [83.79639293409802]
RAGシステムは複雑なユーザ要求に対処し、それらをサブクエリに分解し、それぞれに関連する可能性のあるドキュメントを取得し、それを集約して回答を生成する。
クエリの分解とドキュメントの検索をエクスプロレーション探索設定で定式化し、一度に1つのドキュメントを検索すると、与えられたサブクエリの有用性についての信念が構築される。
我々の主な発見は、ランク情報と人的判断を用いた文書関連性の推定により、文書レベルの精度が35%向上し、α-nDCGが15%向上し、長文生成の下流タスクの性能が向上するということである。
論文 参考訳(メタデータ) (2025-10-21T13:37:11Z) - Chain of Retrieval: Multi-Aspect Iterative Search Expansion and Post-Order Search Aggregation for Full Paper Retrieval [68.71038700559195]
The Chain of Retrieval (COR) is a novel repeaterative framework for full-paper search。
SCIBENCH(SCIBENCH)は、クエリと候補のための全論文の完全なコンテキストとセグメント化されたコンテキストを提供するベンチマークである。
論文 参考訳(メタデータ) (2025-07-14T08:41:53Z) - Hierarchical Retrieval with Evidence Curation for Open-Domain Financial Question Answering on Standardized Documents [9.173952465423966]
標準化されたドキュメントは、反復的なボイラープレートテキストや同様のテーブル構造など、同様のフォーマットを共有している。
この類似性により、従来のRAGメソッドは、ほぼ重複したテキストを誤識別し、精度と完全性を損なう重複検索につながる。
本稿では,これらの問題に対処するためのEvidence Curationフレームワークを用いた階層検索手法を提案する。
論文 参考訳(メタデータ) (2025-05-26T11:08:23Z) - CAPSTONE: Curriculum Sampling for Dense Retrieval with Document
Expansion [68.19934563919192]
本稿では,学習中に擬似クエリを利用して,生成したクエリと実際のクエリとの関係を徐々に向上させるカリキュラムサンプリング戦略を提案する。
ドメイン内およびドメイン外両方のデータセットに対する実験結果から,本手法が従来の高密度検索モデルより優れていることが示された。
論文 参考訳(メタデータ) (2022-12-18T15:57:46Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Improving Query Representations for Dense Retrieval with Pseudo
Relevance Feedback [29.719150565643965]
本稿では,疑似関連性フィードバック(PRF)を用いて高密度検索のためのクエリ表現を改善する新しいクエリエンコーダであるANCE-PRFを提案する。
ANCE-PRF は BERT エンコーダを使用し、検索モデルである ANCE からクエリとトップ検索されたドキュメントを消費し、関連ラベルから直接クエリの埋め込みを生成する。
PRFエンコーダは、学習された注意機構でノイズを無視しながら、PRF文書から関連および補完的な情報を効果的にキャプチャする。
論文 参考訳(メタデータ) (2021-08-30T18:10:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。