論文の概要: HyFedRAG: A Federated Retrieval-Augmented Generation Framework for Heterogeneous and Privacy-Sensitive Data
- arxiv url: http://arxiv.org/abs/2509.06444v1
- Date: Mon, 08 Sep 2025 08:44:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:04.022064
- Title: HyFedRAG: A Federated Retrieval-Augmented Generation Framework for Heterogeneous and Privacy-Sensitive Data
- Title(参考訳): HyFedRAG: 不均一でプライバシに敏感なデータのためのフェデレーション検索拡張生成フレームワーク
- Authors: Cheng Qian, Hainan Zhang, Yongxin Tong, Hong-Wei Zheng, Zhiming Zheng,
- Abstract要約: HyFedRAGはハイブリッドデータモダリティに適した、統一的で効率的なFederated RAGフレームワークである。
HyFedRAGはエッジクラウドのコラボレーティブメカニズムを活用することで、RAGがデータのプライバシを保ちながら、さまざまなデータソースをまたいだ運用を可能にする。
- 参考スコア(独自算出の注目度): 16.102325291252324
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Centralized RAG pipelines struggle with heterogeneous and privacy-sensitive data, especially in distributed healthcare settings where patient data spans SQL, knowledge graphs, and clinical notes. Clinicians face difficulties retrieving rare disease cases due to privacy constraints and the limitations of traditional cloud-based RAG systems in handling diverse formats and edge devices. To address this, we introduce HyFedRAG, a unified and efficient Federated RAG framework tailored for Hybrid data modalities. By leveraging an edge-cloud collaborative mechanism, HyFedRAG enables RAG to operate across diverse data sources while preserving data privacy. Our key contributions are: (1) We design an edge-cloud collaborative RAG framework built on Flower, which supports querying structured SQL data, semi-structured knowledge graphs, and unstructured documents. The edge-side LLMs convert diverse data into standardized privacy-preserving representations, and the server-side LLMs integrates them for global reasoning and generation. (2) We integrate lightweight local retrievers with privacy-aware LLMs and provide three anonymization tools that enable each client to produce semantically rich, de-identified summaries for global inference across devices. (3) To optimize response latency and reduce redundant computation, we design a three-tier caching strategy consisting of local cache, intermediate representation cache, and cloud inference cache. Experimental results on PMC-Patients demonstrate that HyFedRAG outperforms existing baselines in terms of retrieval quality, generation consistency, and system efficiency. Our framework offers a scalable and privacy-compliant solution for RAG over structural-heterogeneous data, unlocking the potential of LLMs in sensitive and diverse data environments.
- Abstract(参考訳): 集中型RAGパイプラインは、特に患者データがSQL、知識グラフ、臨床ノートにまたがる分散ヘルスケア環境で、異質でプライバシに敏感なデータを扱う。
臨床医は、さまざまなフォーマットやエッジデバイスを扱う上で、プライバシー上の制約と従来のクラウドベースのRAGシステムの制限により、まれな疾患の検索が困難になる。
これを解決するために,HyFedRAGを導入した。HyFedRAGはハイブリッドデータモダリティに適した,統一的で効率的なFederated RAGフレームワークである。
HyFedRAGはエッジクラウドのコラボレーティブメカニズムを活用することで、RAGがデータのプライバシを保ちながら、さまざまなデータソースをまたいだ運用を可能にする。
1) 構造化SQLデータ、半構造化知識グラフ、非構造化ドキュメントのクエリをサポートする、Flower上に構築されたエッジクラウド協調RAGフレームワークを設計する。
エッジ側 LLM は多様なデータを標準化されたプライバシ保護表現に変換し、サーバ側 LLM はそれらをグローバルな推論と生成のために統合する。
2) 軽量なローカルレトリバーをプライバシを意識したLCMと統合し,各クライアントがセマンティックにリッチで識別不能な要約を生成できる3つの匿名化ツールを提供する。
(3)応答遅延の最適化と冗長計算の削減のために,ローカルキャッシュ,中間表現キャッシュ,クラウド推論キャッシュからなる3層キャッシュ戦略を設計する。
PMC-Patientsの実験結果から,HyFedRAGは検索品質,生成整合性,システム効率において,既存のベースラインを上回っていることが示された。
我々のフレームワークは、構造的不均一なデータに対するRAGのスケーラブルでプライバシに準拠したソリューションを提供し、敏感で多様なデータ環境におけるLLMの可能性を解き放つ。
関連論文リスト
- Adaptive and Robust DBSCAN with Multi-agent Reinforcement Learning [53.527506374566485]
本稿では,多エージェント強化学習クラスタフレームワーク,すなわちAR-DBSCANを用いた新しいAdaptive and Robust DBSCANを提案する。
我々は、AR-DBSCANが、NMIおよびARIメトリクスの最大144.1%と175.3%のクラスタリング精度を向上するだけでなく、支配的なパラメータを確実に見つけることができることを示した。
論文 参考訳(メタデータ) (2025-05-07T11:37:23Z) - Privacy-Preserving Federated Embedding Learning for Localized Retrieval-Augmented Generation [60.81109086640437]
我々はFedE4RAG(Federated Retrieval-Augmented Generation)と呼ばれる新しいフレームワークを提案する。
FedE4RAGはクライアント側RAG検索モデルの協調トレーニングを容易にする。
モデルパラメータの保護にフェデレート学習の準同型暗号化を適用する。
論文 参考訳(メタデータ) (2025-04-27T04:26:02Z) - MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG [65.0423152595537]
本稿では,エンティティ固有のクエリ処理を強化し,正確でセキュアで一貫した応答を提供するMES-RAGを提案する。
MES-RAGは、データアクセスの前に保護を適用してシステムの整合性を確保するための積極的なセキュリティ対策を導入している。
実験の結果,MES-RAGは精度とリコールの両方を著しく改善し,質問応答の安全性と有用性を向上する効果が示された。
論文 参考訳(メタデータ) (2025-03-17T08:09:42Z) - C-FedRAG: A Confidential Federated Retrieval-Augmented Generation System [7.385458207094507]
我々は、FedRAG(Federated Retrieval Augmented Generation)をセキュアにするためのソリューションとして、CC(Confidential Computing)技術を紹介する。
提案するConfidential FedRAGシステム(C-FedRAG)は、コンテキスト機密性を確保することにより、分散化されたデータプロバイダのネットワークをまたいだRAGのセキュアな接続とスケーリングを可能にする。
論文 参考訳(メタデータ) (2024-12-17T18:42:21Z) - FRAG: Toward Federated Vector Database Management for Collaborative and Secure Retrieval-Augmented Generation [1.3824176915623292]
本稿では,検索集約システム (RAG) のニーズの増大に対応する新しいデータベース管理パラダイムである textitFederated Retrieval-Augmented Generation (FRAG) を紹介する。
FRAGは、ANN(Approximate $k$-Nearest Neighbor)による、暗号化されたクエリベクタと分散ベクトルデータベースに格納された暗号化データ検索を相互に行うことができる。
論文 参考訳(メタデータ) (2024-10-17T06:57:29Z) - RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework [66.93260816493553]
本稿では,様々なシナリオにまたがってRAGシステムを評価するためのフレームワークであるRAGvalを紹介する。
事実の正確性に焦点をあてて,完全性,幻覚,不適切性の3つの新しい指標を提案する。
実験結果から, RAGEvalは, 生成した試料の明瞭度, 安全性, 適合性, 豊かさにおいて, ゼロショット法とワンショット法より優れていた。
論文 参考訳(メタデータ) (2024-08-02T13:35:11Z) - Free Lunch for Federated Remote Sensing Target Fine-Grained
Classification: A Parameter-Efficient Framework [23.933367972846312]
本稿では、PRFLと呼ばれるフェデレートラーニングに基づく新しいプライバシー保護TFGCフレームワークを提案する。
4つの公開データセットを活用することにより,従来のTFGCタスクにおけるPRFLの有効性を示す。
論文 参考訳(メタデータ) (2024-01-03T01:45:00Z) - Federated Learning Empowered by Generative Content [55.576885852501775]
フェデレートラーニング(FL)は、プライバシ保護方法でモデルのトレーニングに分散プライベートデータを活用可能にする。
本稿では,FedGCと呼ばれる新しいFLフレームワークを提案する。
我々は、さまざまなベースライン、データセット、シナリオ、モダリティをカバーする、FedGCに関する体系的な実証的研究を行う。
論文 参考訳(メタデータ) (2023-12-10T07:38:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。