論文の概要: FD-RAG: Federated Dual-System Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2605.27432v1
- Date: Fri, 22 May 2026 05:21:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.268082
- Title: FD-RAG: Federated Dual-System Retrieval-Augmented Generation
- Title(参考訳): FD-RAG:フェデレーテッドデュアルシステム検索型ジェネレーション
- Authors: Tianhao Gao, Kai Yang, Yiyang Li,
- Abstract要約: FD-RAGは局所コーパス上の意味認識適応ハイパーグラフを学習し、それをコンパクトなQAメモリに蒸留する。
直接メモリマッチングを通じて精査されたクエリに回答し、必要な時にのみLSMベースの推論を起動する。
QAベンチマークの実験では、FD-RAGの精度は最大7.8%向上し、レイテンシは8.4times$に低下した。
- 参考スコア(独自算出の注目度): 6.293987395462135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-augmented generation (RAG) has emerged as a paradigm for grounding large language models in external knowledge, yet most existing RAG systems assume centralized knowledge access and ample computation. These assumptions break down in edge environments, where knowledge is fragmented across devices, raw data cannot be shared, and repeated LLM calls are prohibitively expensive. We propose FD-RAG, a federated dual-system RAG framework that decouples lightweight memory access from on-demand LLM reasoning for decentralized deployment. Specifically, FD-RAG learns semantic-aware adaptive hypergraphs over local corpora and distills them into compact QA memories. At inference time, it answers well-covered queries via direct memory matching and invokes LLM-based reasoning only when necessary, while tracing retrieved memories to hypergraph-grounded evidence. To mitigate cross-device knowledge fragmentation, FD-RAG aggregates anonymized memories across devices without exposing raw documents. Experiments on QA benchmarks show that FD-RAG improves accuracy by up to 7.8\% while reducing latency by 8.4$\times$ compared with strong local and federated baselines. We also provide theoretical analysis establishing an $\mathcal{O}(1/ε^{2})$ convergence rate for the proposed hypergraph learning, supporting its tractable deployment in edge settings.
- Abstract(参考訳): Retrieval-augmented Generation (RAG) は、大規模な言語モデルを外部知識に基盤付けるパラダイムとして登場したが、既存のRAGシステムの多くは、集中的な知識アクセスと十分な計算を前提としている。
これらの仮定は、デバイス間で知識が断片化され、生データを共有できない、繰り返しLLM呼び出しが違法に高価であるエッジ環境に分解される。
本稿では,FD-RAG(Federated dual-system RAG)フレームワークを提案する。
具体的には、FD-RAGは局所コーパス上の意味認識適応ハイパーグラフを学習し、それらをコンパクトなQAメモリに蒸留する。
推測時には、直接メモリマッチングによってよく検索されたクエリに回答し、必要なときにのみLSMベースの推論を実行し、検索したメモリをハイパーグラフの根拠に追跡する。
デバイス間の知識の断片化を軽減するため、FD-RAGは、生文書を公開せずにデバイス間で匿名化されたメモリを集約する。
QAベンチマークの実験では、FD-RAGは、強い局所およびフェデレーションベースラインと比較して、レイテンシを8.4$\times$に削減しながら、最大7.8\%の精度向上を実現している。
また,提案したハイパーグラフ学習のための$\mathcal{O}(1/ε^{2})$収束率を確立し,エッジ設定における抽出可能な展開をサポートする。
関連論文リスト
- VRAG-DFD: Verifiable Retrieval-Augmentation for MLLM-based Deepfake Detection [49.88962095967614]
本稿では,正確な動的偽情報検索と強力なクリティカル推論機能を備えたVRAG-DFDフレームワークを提案する。
データに関しては、DFD知識アノテーションのためのForensic Knowledge Database(FKD)と、重要なCoT構築のためのForensic Chain-of-Thoughtデータセット(F-CoT)の2つのデータセットを構築した。
性能面では、VRAG-DFD は SOTA と DFD の一般化テストにおける競合性能を達成した。
論文 参考訳(メタデータ) (2026-04-15T09:27:49Z) - PAR$^2$-RAG: Planned Active Retrieval and Reasoning for Multi-Hop Question Answering [57.89576196160413]
大規模言語モデル (LLM) はマルチホップ質問応答 (MHQA) において脆弱のままである。
textbfPlanned Active Retrieval and Reasoning RAG (PAR$2-RAG)を提案する。
論文 参考訳(メタデータ) (2026-03-30T23:52:54Z) - HELP: HyperNode Expansion and Logical Path-Guided Evidence Localization for Accurate and Efficient GraphRAG [53.30561659838455]
大きな言語モデル(LLM)は、しばしば固有の知識境界と幻覚に苦しむ。
Retrieval-Augmented Generation (RAG) は、マルチホップ推論に不可欠な構造的相互依存性をしばしば見落としている。
ヘルプは、複数の単純でマルチホップなQAベンチマークで競合性能を達成し、グラフベースのRAGベースラインよりも28.8$times$のスピードアップを実現している。
論文 参考訳(メタデータ) (2026-02-24T14:05:29Z) - TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework [62.66056331998838]
TeaRAGは、検索内容と推論ステップの両方を圧縮できるトークン効率のエージェントRAGフレームワークである。
報奨関数は,過剰な推論ステップをペナルティ化しながら,知識マッチング機構によって知識満足度を評価する。
論文 参考訳(メタデータ) (2025-11-07T16:08:34Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - TeleRAG: Efficient Retrieval-Augmented Generation Inference with Lookahead Retrieval [16.65446281180872]
Retrieval-augmented Generation (RAG)は、大規模な言語モデル(LLM)を外部データソースに拡張する。
現代のRAGパイプラインは大規模なデータストアに依存しており、レイテンシに敏感なデプロイメントにおけるシステムの課題につながっている。
我々は,GPUメモリの必要量を最小限に抑え,RAGレイテンシを低減する効率的な推論システムであるTeleRAGを提案する。
論文 参考訳(メタデータ) (2025-02-28T11:32:22Z) - RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework [66.93260816493553]
本稿では,様々なシナリオにまたがってRAGシステムを評価するためのフレームワークであるRAGvalを紹介する。
事実の正確性に焦点をあてて,完全性,幻覚,不適切性の3つの新しい指標を提案する。
実験結果から, RAGEvalは, 生成した試料の明瞭度, 安全性, 適合性, 豊かさにおいて, ゼロショット法とワンショット法より優れていた。
論文 参考訳(メタデータ) (2024-08-02T13:35:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。