論文の概要: RECIPER: A Dual-View Retrieval Pipeline for Procedure-Oriented Materials Question Answering
- arxiv url: http://arxiv.org/abs/2604.11229v1
- Date: Mon, 13 Apr 2026 09:29:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.454464
- Title: RECIPER: A Dual-View Retrieval Pipeline for Procedure-Oriented Materials Question Answering
- Title(参考訳): RECIPER: 手続き指向材料質問応答のためのデュアルビュー検索パイプライン
- Authors: Zhuoyu Wu, Wenhui Ou, Pei-Sze Tan, Wenqi Fang, Sailaja Rajanala, Raphaël C. -W. Phan,
- Abstract要約: 本稿では、段落レベルの文脈とコンパクトな大言語モデル抽出手続き要約の両方を索引付けする二重ビュー検索パイプラインRECIPERを提案する。
4つの高密度検索バックボーンにわたって、RECIPERは段落のみの高密度検索よりも早期検索を継続的に改善する。
- 参考スコア(独自算出の注目度): 8.385035962396545
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieving procedure-oriented evidence from materials science papers is difficult because key synthesis details are often scattered across long, context-heavy documents and are not well captured by paragraph-only dense retrieval. We present RECIPER, a dual-view retrieval pipeline that indexes both paragraph-level context and compact large language model-extracted procedural summaries, then combines the two candidate streams with lightweight lexical reranking. Across four dense retrieval backbones, RECIPER consistently improves early-rank retrieval over paragraph-only dense retrieval, achieving average gains of +3.73 in Recall@1, +2.85 in nDCG@10, and +3.13 in MRR. With BGE-large-en-v1.5, it reaches 86.82%, 97.07%, and 97.85% on Recall@1, Recall@5, and Recall@10, respectively. We further observe improved downstream question answering under automatic metrics, suggesting that procedural summaries can serve as a useful complementary retrieval signal for procedure-oriented materials question answering. Code and data are available at https://github.com/ReaganWu/RECIPER.
- Abstract(参考訳): 資料科学論文から手順指向の証拠を回収することは困難である。なぜなら、重要な合成の詳細は、しばしば長い文脈に重なる文書に散らばり、段落のみの高密度検索ではうまく捉えられていないからである。
本稿では、段落レベルの文脈とコンパクトな大言語モデル抽出された手続き的要約の両方を索引付けするデュアルビュー検索パイプラインRECIPERについて述べる。
4つの高密度検索バックボーン全体で、RECIPERは段落のみの高密度検索よりも早期検索を継続的に改善し、Recall@1では+3.73、nDCG@10では+2.85、MRRでは+3.13の平均ゲインを達成している。
BGE-large-en-v1.5では、それぞれ86.82%、97.07%、Recall@1、Recall@5、Recall@10で97.85%に達する。
さらに,自動メトリクスによる下流質問応答の改善を観察し,手順指向の材料質問応答において,手続き的要約が有用な補完的検索信号として機能することを示唆した。
コードとデータはhttps://github.com/ReaganWu/RECIPERで公開されている。
関連論文リスト
- From BM25 to Corrective RAG: Benchmarking Retrieval Strategies for Text-and-Table Documents [0.0]
スパース, 密度, ハイブリッド融合, クロスエンコーダリグレード, クエリ拡張, インデックス拡張, 適応検索にまたがる10の検索戦略をベンチマークした。
我々はRecall@k,MRR,nDCGによる検索品質とNumber Matchによるエンドツーエンド生成品質を評価する。
論文 参考訳(メタデータ) (2026-04-02T07:53:40Z) - Test-Time Strategies for More Efficient and Accurate Agentic RAG [58.44913384057518]
Retrieval-Augmented Generation (RAG) システムは複雑なマルチホップ問題に直面している。
このような手法は、以前に処理された情報の反復的な検索を含む非効率性を導入することができる。
本稿では,これらの問題を軽減するために,サーチ-R1パイプラインに対するテスト時間修正について検討する。
論文 参考訳(メタデータ) (2026-03-12T19:18:59Z) - Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage [89.58253972744531]
Retrieval-augmented Generation (RAG) システムは、文書検索と生成モデルを組み合わせて、レポート生成のような複雑な情報を求める課題に対処する。
我々は,上流の検索指標が,最終生成応答の情報カバレッジの信頼性の高い早期指標として機能するかどうかを検討する。
本研究は,トピックとシステムレベルの両方で生成した応答におけるカバレッジベース検索指標とナゲットカバレッジとの間に強い相関関係を示した。
論文 参考訳(メタデータ) (2026-03-09T18:20:20Z) - Single-Turn LLM Reformulation Powered Multi-Stage Hybrid Re-Ranking for Tip-of-the-Tongue Known-Item Retrieval [3.976291254896486]
本稿では,汎用8Bパラメータ LLM への単一呼び出しをクエリ再構成に用いることを提案する。
本手法は,初回リコールが不十分なため,Pseudo-Relevance Feedbackがフェールした場合に有効である。
2025 TREC-ToTデータセットの実験により、生クエリは性能が劣る一方、軽量な検索前変換によりリコールが20.61%向上することが示された。
論文 参考訳(メタデータ) (2026-02-10T21:59:10Z) - Chain of Retrieval: Multi-Aspect Iterative Search Expansion and Post-Order Search Aggregation for Full Paper Retrieval [68.71038700559195]
The Chain of Retrieval (COR) is a novel repeaterative framework for full-paper search。
SCIBENCH(SCIBENCH)は、クエリと候補のための全論文の完全なコンテキストとセグメント化されたコンテキストを提供するベンチマークである。
論文 参考訳(メタデータ) (2025-07-14T08:41:53Z) - Question Decomposition for Retrieval-Augmented Generation [2.6409776648054764]
本稿では疑問分解をサブクエストに組み込んだRAGパイプラインを提案する。
補間的な文書を効果的に組み立てる一方で、再ランク付けによってノイズが減少することを示す。
再ランク自体は標準的なものであるが、LLMによる質問分解と既製のクロスエンコーダのペアリングは、マルチホップ質問の検索ギャップを橋渡しすることを示す。
論文 参考訳(メタデータ) (2025-07-01T01:01:54Z) - AUEB-Archimedes at RIRAG-2025: Is obligation concatenation really all you need? [11.172264842171682]
本稿では,RIRAG-2025のために開発したシステムについて述べる。
生成された回答は、参照フリーでモデルベースのメトリクスであるRePASを用いて評価される。
抽出された節から重要な文(「無視」)を抽出するRePASの神経成分を利用することで、精度の高いスコア(0.947)が得られることを示す。
そして、いくつかの代替案の中で最も優れたRePASで答えを選択することで、より可読で比較的高い結果が得られる可読で一貫性のある回答を生成することができることを示す。
論文 参考訳(メタデータ) (2024-12-16T08:54:21Z) - BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval [54.54576644403115]
BRIGHTは、関係する文書を検索するために、集中的推論を必要とする最初のテキスト検索ベンチマークである。
私たちのデータセットは、経済学、心理学、数学、コーディングなど、さまざまな領域にまたがる1,384の現実世界のクエリで構成されています。
クエリに関する明示的な推論を取り入れることで、検索性能が最大12.2ポイント向上することを示す。
論文 参考訳(メタデータ) (2024-07-16T17:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。