論文の概要: CoCR-RAG: Enhancing Retrieval-Augmented Generation in Web Q&A via Concept-oriented Context Reconstruction
- arxiv url: http://arxiv.org/abs/2603.23989v1
- Date: Wed, 25 Mar 2026 06:38:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.165442
- Title: CoCR-RAG: Enhancing Retrieval-Augmented Generation in Web Q&A via Concept-oriented Context Reconstruction
- Title(参考訳): CoCR-RAG:概念指向コンテキスト再構成によるWebQ&Aの検索強化
- Authors: Kaize Shi, Xueyao Sun, Qika Lin, Firoj Alam, Qing Li, Xiaohui Tao, Guandong Xu,
- Abstract要約: Retrieval-augmented Generation (RAG)は、Webや他の外部ソースからの情報を取り入れることで、Q&Aの強化に有望な結果を示している。
本稿では,マルチソース情報融合問題に対処するフレームワークである概念指向コンテキスト再構成RAG(CoCR-RAG)を提案する。
- 参考スコア(独自算出の注目度): 26.159576535656274
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-augmented generation (RAG) has shown promising results in enhancing Q&A by incorporating information from the web and other external sources. However, the supporting documents retrieved from the heterogeneous web often originate from multiple sources with diverse writing styles, varying formats, and inconsistent granularity. Fusing such multi-source documents into a coherent and knowledge-intensive context remains a significant challenge, as the presence of irrelevant and redundant information can compromise the factual consistency of the inferred answers. This paper proposes the Concept-oriented Context Reconstruction RAG (CoCR-RAG), a framework that addresses the multi-source information fusion problem in RAG through linguistically grounded concept-level integration. Specifically, we introduce a concept distillation algorithm that extracts essential concepts from Abstract Meaning Representation (AMR), a stable semantic representation that structures the meaning of texts as logical graphs. The distilled concepts from multiple retrieved documents are then fused and reconstructed into a unified, information-intensive context by Large Language Models, which supplement only the necessary sentence elements to highlight the core knowledge. Experiments on the PopQA and EntityQuestions datasets demonstrate that CoCR-RAG significantly outperforms existing context-reconstruction methods across these Web Q&A benchmarks. Furthermore, CoCR-RAG shows robustness across various backbone LLMs, establishing itself as a flexible, plug-and-play component adaptable to different RAG frameworks.
- Abstract(参考訳): Retrieval-augmented Generation (RAG)は、Webや他の外部ソースからの情報を取り入れることで、Q&Aの強化に有望な結果を示している。
しかし、異種Webから取得したサポートドキュメントは、多種多様な書式、様々なフォーマット、一貫性のない粒度を持つ複数のソースに由来することが多い。
このような多ソース文書を一貫性のある、知識集約的なコンテキストに融合することは、無関係で冗長な情報の存在が、推測された回答の事実的一貫性を損なう可能性があるため、依然として重要な課題である。
本稿では,言語的に基礎付けられた概念レベルの統合を通じて,RAGのマルチソース情報融合問題に対処するフレームワークである概念指向コンテキスト再構成RAG(CoCR-RAG)を提案する。
具体的には、テキストの意味を論理グラフとして構造化する安定な意味表現である抽象的意味表現(AMR)から重要な概念を抽出する概念蒸留アルゴリズムを提案する。
複数の検索された文書から抽出された概念を融合して、大言語モデルによって統合された情報集約的な文脈に再構築し、コア知識を強調するために必要な文要素のみを補完する。
PopQAデータセットとEntityQuestionsデータセットの実験は、CoCR-RAGがこれらのWeb Q&Aベンチマークで既存のコンテキスト再構成メソッドを大幅に上回っていることを示している。
さらに、CoCR-RAG は様々なバックボーン LLM に対して堅牢性を示し、様々なRAG フレームワークに適応可能なフレキシブルなプラグイン・アンド・プレイコンポーネントとしての地位を確立している。
関連論文リスト
- MegaRAG: Multimodal Knowledge Graph-Based Retrieval Augmented Generation [17.382062394739588]
大規模言語モデル(LLM)は、コンテキストウィンドウが限られているため、高レベルな概念的理解と包括的理解に苦慮する。
本稿では,マルチモーダルな知識グラフに基づくRAGを導入し,より優れたコンテンツ理解のためのクロスモーダル推論を実現する。
本手法では,知識グラフの構築,検索フェーズ,回答生成プロセスに視覚的手がかりを取り入れた。
論文 参考訳(メタデータ) (2025-11-26T05:00:03Z) - Scaling Beyond Context: A Survey of Multimodal Retrieval-Augmented Generation for Document Understanding [61.36285696607487]
文書理解は、財務分析から科学的発見への応用に不可欠である。
現在のアプローチでは、OCRベースのパイプラインがLarge Language Models(LLM)やネイティブのMultimodal LLMs(MLLM)に制限されている。
Retrieval-Augmented Generation (RAG)は、外部データの基底モデルを支援するが、文書のマルチモーダルな性質は、テキスト、テーブル、チャート、レイアウトを組み合わせることで、より高度なパラダイムを必要とする。
論文 参考訳(メタデータ) (2025-10-17T02:33:16Z) - RAG-Anything: All-in-One RAG Framework [10.858282833070726]
RAG-Anythingは,すべてのモダリティにまたがる包括的知識検索を可能にする統一的なフレームワークである。
本手法は, 孤立データ型ではなく, 相互接続された知識エンティティとして, マルチモーダルコンテンツを再認識する。
論文 参考訳(メタデータ) (2025-10-14T09:25:35Z) - Domain-Specific Data Generation Framework for RAG Adaptation [58.20906914537952]
Retrieval-Augmented Generation (RAG)は、大規模言語モデルの言語理解と推論能力と外部検索を組み合わせ、ドメイン基底応答を可能にする。
本稿では,様々なRAG適応手法に合わせて,ドメイン基底型質問応答コンテキスト(QAC)トリプルを生成するフレームワークであるRAGenを提案する。
論文 参考訳(メタデータ) (2025-10-13T09:59:49Z) - UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities [53.76854299076118]
UniversalRAGは異種情報源からの知識を多様さと粒度で検索・統合するための新しいRAGフレームワークである。
本稿では,最も適切なモダリティ固有コーパスを動的に識別し,その内部でターゲット検索を行うモダリティ対応ルーティング機構を提案する。
マルチモーダル性にまたがる8つのベンチマークでUniversalRAGを検証する。
論文 参考訳(メタデータ) (2025-04-29T13:18:58Z) - CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented Generation of Large Language Models [49.16989035566899]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の能力を高める技術である。
本稿では,大規模かつ包括的なベンチマークを構築し,様々なRAGアプリケーションシナリオにおけるRAGシステムのすべてのコンポーネントを評価する。
論文 参考訳(メタデータ) (2024-01-30T14:25:32Z) - Retrieval-Augmented Generation for Large Language Models: A Survey [17.82361213043507]
大きな言語モデル(LLM)には印象的な能力があるが、幻覚のような課題に直面している。
Retrieval-Augmented Generation (RAG) は,外部データベースからの知識を取り入れた,有望なソリューションとして登場した。
論文 参考訳(メタデータ) (2023-12-18T07:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。