論文の概要: Graph-Aware Late Chunking for Retrieval-Augmented Generation in Biomedical Literature
- arxiv url: http://arxiv.org/abs/2603.22633v1
- Date: Mon, 23 Mar 2026 23:22:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.217527
- Title: Graph-Aware Late Chunking for Retrieval-Augmented Generation in Biomedical Literature
- Title(参考訳): バイオメディカル文学における検索生成のためのグラフ対応遅延チャンキング
- Authors: Pouria Mortezaagha, Arya Rahgozar,
- Abstract要約: GraLC-RAGは、グラフ認識構造インテリジェンスと遅延チャンキングを統合するフレームワークである。
2,359 IMRaD-filtered Centralの項目に対して,2,033の横断質問を用いた6つの戦略を評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-Augmented Generation (RAG) systems for biomedical literature are typically evaluated using ranking metrics like Mean Reciprocal Rank (MRR), which measure how well the system identifies the single most relevant chunk. We argue that for full-text scientific documents, this paradigm is incomplete: it rewards retrieval precision while ignoring retrieval breadth -- the ability to surface evidence from across a document's structural sections. We propose GraLC-RAG, a framework that unifies late chunking with graph-aware structural intelligence, introducing structure-aware chunk boundary detection, UMLS knowledge graph infusion, and graph-guided hybrid retrieval. We evaluate six strategies on 2,359 IMRaD-filtered PubMed Central articles using 2,033 cross-section questions and two metric families: standard ranking metrics (MRR, Recall@k) and structural coverage metrics (SecCov@k, CS Recall). Our results expose a sharp divergence: content-similarity methods achieve the highest MRR (0.517) but always retrieve from a single section, while structure-aware methods retrieve from up to 15.6x more sections. Generation experiments show that KG-infused retrieval narrows the answer-quality gap to delta-F1 = 0.009 while maintaining 4.6x section diversity. These findings demonstrate that standard metrics systematically undervalue structural retrieval and that closing the multi-section synthesis gap is a key open problem for biomedical RAG.
- Abstract(参考訳): バイオメディカル文学のための検索・拡張生成(RAG)システムは、一般的に、システムが最も関連性の高いチャンクをいかに正確に識別するかを測定する平均相互ランク(MRR)のようなランキングメトリクスを用いて評価される。
我々は、全文の科学文献では、このパラダイムは不完全であると主張する: 検索幅を無視しながら、検索精度を報い、文書の構造的セクション全体から証拠を提示する能力である。
グラフ認識構造インテリジェンスと遅延チャンキングを統合化し,構造認識境界検出,UMLS知識グラフの注入,グラフ誘導ハイブリッド検索を導入するフレームワークであるGraLC-RAGを提案する。
2,359 IMRaD-filtered PubMed Central article using 2,033 cross-section questions and two metric family: standard ranking metrics (MRR, Recall@k) and structure coverage metrics (SecCov@k, CS Recall)。
コンテント類似性法は最も高いMRR(0.517)を達成できるが、常に単一のセクションから取り出すが、構造認識法は最大15.6倍のセクションから取り出す。
生成実験により、KGを注入した検索は、解答品質のギャップをデルタF1 = 0.009に狭め、かつ4.6倍の多様性を維持することを示した。
これらの結果から, 標準指標が体系的に過小評価され, 多区間合成ギャップの閉鎖が生物医学的RAGの鍵となる問題であることが示唆された。
関連論文リスト
- Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage [89.58253972744531]
Retrieval-augmented Generation (RAG) システムは、文書検索と生成モデルを組み合わせて、レポート生成のような複雑な情報を求める課題に対処する。
我々は,上流の検索指標が,最終生成応答の情報カバレッジの信頼性の高い早期指標として機能するかどうかを検討する。
本研究は,トピックとシステムレベルの両方で生成した応答におけるカバレッジベース検索指標とナゲットカバレッジとの間に強い相関関係を示した。
論文 参考訳(メタデータ) (2026-03-09T18:20:20Z) - Retrieval Augmented Generation of Literature-derived Polymer Knowledge: The Example of a Biodegradable Polymer Expert System [4.222675210976564]
高分子文学は、大きくて成長する実験的な知識を含んでいる。
その多くは、構造化されていないテキストと一貫性のない用語に埋もれている。
既存のツールは通常、狭く、研究固有の事実を分離して抽出する。
論文 参考訳(メタデータ) (2026-02-18T17:46:09Z) - From Evidence-Based Medicine to Knowledge Graph: Retrieval-Augmented Generation for Sports Rehabilitation and a Domain Benchmark [12.595335483488052]
医学において、大規模な言語モデルは、最新の外部証拠のアウトプットを得るために、検索強化世代(RAG)にますます依存している。
本研究は,(1)クエリと検索されたエビデンス間のPICOアライメントの欠如,(2)再ランク付け時のエビデンス階層的考察の欠如,の2つの主要なギャップに対処する。
本稿では,知識グラフ構築と検索にPICOフレームワークを統合することにより,EMMをグラフベースRAGに適用するための一般化可能な戦略を提案する。
論文 参考訳(メタデータ) (2026-01-01T05:20:54Z) - Towards Global Retrieval Augmented Generation: A Benchmark for Corpus-Level Reasoning [50.27838512822097]
我々は,グローバルRAG機能を評価するために設計された最初のベンチマークであるGlobalQAを紹介する。
我々は,チャンクレベルの検索によって構造的コヒーレンスを保存するマルチツール協調フレームワークであるGlobalRAGを提案する。
Qwen2.5-14Bモデルでは、GlobalRAGは最強のベースラインである1.51 F1と比較して6.63 F1を達成した。
論文 参考訳(メタデータ) (2025-10-30T07:29:14Z) - HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文 参考訳(メタデータ) (2025-08-01T20:30:42Z) - Medical Graph RAG: Towards Safe Medical Large Language Model via Graph Retrieval-Augmented Generation [9.286509119104563]
我々は、MedGraphRAGと呼ばれる医療領域向けに設計された新しいグラフベースのRetrieval-Augmented Generationフレームワークを紹介する。
提案手法は,9つの医療用Q&Aベンチマーク,2つの健康用ファクトチェックベンチマーク,および1つの収集データセットで検証した。
論文 参考訳(メタデータ) (2024-08-08T03:11:12Z) - How Does Generative Retrieval Scale to Millions of Passages? [68.98628807288972]
各種コーパス尺度における生成的検索手法の実証的研究を行った。
我々は8.8Mパスのコーパスで数百万のパスに生成検索をスケールし、モデルサイズを最大11Bパラメータまで評価する。
生成的検索は、小さなコーパス上の最先端のデュアルエンコーダと競合するが、数百万のパスへのスケーリングは依然として重要で未解決の課題である。
論文 参考訳(メタデータ) (2023-05-19T17:33:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。