論文の概要: A Decentralized Retrieval Augmented Generation System with Source Reliabilities Secured on Blockchain
- arxiv url: http://arxiv.org/abs/2511.07577v1
- Date: Wed, 12 Nov 2025 01:04:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.389681
- Title: A Decentralized Retrieval Augmented Generation System with Source Reliabilities Secured on Blockchain
- Title(参考訳): ブロックチェーン上でのソース信頼性を確保した分散検索拡張生成システム
- Authors: Yining Lu, Wenyi Tang, Max Johnson, Taeho Jung, Meng Jiang,
- Abstract要約: 分散化は課題をもたらします。多数の独立したデータソースは信頼性に大きく違いがあります。
本システムでは,実世界のような信頼性の低いデータ環境において,集中型データに比べて+10.7%の性能向上を実現している。
分散インフラは、安全で信頼性の高いスコア管理を可能にし、約56%の限界コスト削減を実現している。
- 参考スコア(独自算出の注目度): 18.738400901246898
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing retrieval-augmented generation (RAG) systems typically use a centralized architecture, causing a high cost of data collection, integration, and management, as well as privacy concerns. There is a great need for a decentralized RAG system that enables foundation models to utilize information directly from data owners who maintain full control over their sources. However, decentralization brings a challenge: the numerous independent data sources vary significantly in reliability, which can diminish retrieval accuracy and response quality. To address this, our decentralized RAG system has a novel reliability scoring mechanism that dynamically evaluates each source based on the quality of responses it contributes to generate and prioritizes high-quality sources during retrieval. To ensure transparency and trust, the scoring process is securely managed through blockchain-based smart contracts, creating verifiable and tamper-proof reliability records without relying on a central authority. We evaluate our decentralized system with two Llama models (3B and 8B) in two simulated environments where six data sources have different levels of reliability. Our system achieves a +10.7\% performance improvement over its centralized counterpart in the real world-like unreliable data environments. Notably, it approaches the upper-bound performance of centralized systems under ideally reliable data environments. The decentralized infrastructure enables secure and trustworthy scoring management, achieving approximately 56\% marginal cost savings through batched update operations. Our code and system are open-sourced at github.com/yining610/Reliable-dRAG.
- Abstract(参考訳): 既存の検索拡張世代(RAG)システムは、一般的に中央集権的なアーキテクチャを使用し、データ収集、統合、管理のコストが高くなり、プライバシー上の懸念も生じる。
ファンデーションモデルでは,ソースを完全に管理しているデータ所有者から直接情報を活用できる分散RAGシステムが必要である。
しかし、分散化は、多くの独立したデータソースの信頼性が著しく異なり、検索精度と応答品質が低下する可能性がある。
これを解決するために、分散RAGシステムは、検索中に高品質なソースを生成・優先順位付けするために寄与する応答の品質に基づいて、各ソースを動的に評価する、新しい信頼性スコアリング機構を備えている。
透明性と信頼性を確保するために、スコアリングプロセスはブロックチェーンベースのスマートコントラクトを通じてセキュアに管理される。
2つのLlamaモデル(3Bと8B)を6つのデータソースが信頼性の異なる2つのシミュレーション環境で評価した。
本システムは, 実世界のような信頼性の低いデータ環境において, 集中型データに比べて+10.7 %の性能向上を実現している。
特に、理想的な信頼性のあるデータ環境下での集中型システムの上限性能にアプローチする。
分散インフラストラクチャは、セキュアで信頼性の高いスコア管理を可能にし、バッチ更新操作を通じて、約56倍の限界コスト削減を達成する。
我々のコードとシステムはgithub.com/yining610/Reliable-dRAGでオープンソース化されています。
関連論文リスト
- Privacy-Preserving Federated Embedding Learning for Localized Retrieval-Augmented Generation [60.81109086640437]
我々はFedE4RAG(Federated Retrieval-Augmented Generation)と呼ばれる新しいフレームワークを提案する。
FedE4RAGはクライアント側RAG検索モデルの協調トレーニングを容易にする。
モデルパラメータの保護にフェデレート学習の準同型暗号化を適用する。
論文 参考訳(メタデータ) (2025-04-27T04:26:02Z) - The Built-In Robustness of Decentralized Federated Averaging to Bad Data [2.7961972519572447]
分散連合学習(DFL)は、中央コントローラに頼ることなく、複雑なネットワークトポロジ上でモデルを協調的にトレーニングすることを可能にする。
この設定では、ローカルデータはプライベートのままだが、その品質と量はノード間で大きく異なる可能性がある。
劣化したデータをノードのサブセットに均等に分散するシナリオと,単一ノードに集中するシナリオの2つをシミュレーションする。
論文 参考訳(メタデータ) (2025-02-25T11:06:51Z) - Protocol Learning, Decentralized Frontier Risk and the No-Off Problem [56.74434512241989]
私たちは第3のパラダイムであるプロトコル学習(Protocol Learning)を特定します。
このアプローチは、単一の集中型エンティティよりも桁違いに多くの計算資源を集約する可能性がある。
また、不均一で信頼性の低いノード、悪意のある参加者、インセンティブを維持するために抽出不可能なモデルの必要性、複雑なガバナンスのダイナミクスなど、新しい課題も導入されている。
論文 参考訳(メタデータ) (2024-12-10T19:53:50Z) - Retrieval-Augmented Generation with Estimation of Source Reliability [28.70905685371307]
Reliability-Aware RAG (RA-RAG) は、ソースの信頼性を推定する新しいマルチソースRAGフレームワークである。
RA-RAGはまず、複数のソース間で情報をクロスチェックすることで、ソースの信頼性を推定する。
その後、上位$kappa$の信頼性と関連するソースからドキュメントを検索し、重み付けされた多数決投票(WMV)を使用して情報を集約する。
論文 参考訳(メタデータ) (2024-10-30T12:09:29Z) - Towards Secure and Private AI: A Framework for Decentralized Inference [14.526663289437584]
大規模マルチモーダル基盤モデルは、スケーラビリティ、信頼性、潜在的な誤用に関する課題を提示する。
分散システムは、ワークロードの分散と障害の中心的なポイントの緩和によるソリューションを提供する。
これらの課題に対処するためには、AI開発に責任を負うように設計された包括的なフレームワークを使います。
論文 参考訳(メタデータ) (2024-07-28T05:09:17Z) - Digital Twin-Assisted Data-Driven Optimization for Reliable Edge Caching in Wireless Networks [60.54852710216738]
我々はD-RECと呼ばれる新しいデジタルツインアシスト最適化フレームワークを導入し、次世代無線ネットワークにおける信頼性の高いキャッシュを実現する。
信頼性モジュールを制約付き決定プロセスに組み込むことで、D-RECは、有利な制約に従うために、アクション、報酬、状態を適応的に調整することができる。
論文 参考訳(メタデータ) (2024-06-29T02:40:28Z) - Networked Communication for Decentralised Agents in Mean-Field Games [59.01527054553122]
平均フィールドゲームフレームワークにネットワーク通信を導入する。
当社のアーキテクチャは、中央集権型と独立した学習ケースの双方で保証されていることを証明しています。
ネットワーク化されたアプローチは、障害の更新や人口規模の変化に対する堅牢性という点において、両方の選択肢に対して大きなメリットがあることが示されています。
論文 参考訳(メタデータ) (2023-06-05T10:45:39Z) - Decentralised Learning from Independent Multi-Domain Labels for Person
Re-Identification [69.29602103582782]
ディープラーニングは多くのコンピュータビジョンタスクで成功している。
しかし、プライバシー問題に対する意識の高まりは、特に人物の再識別(Re-ID)において、ディープラーニングに新たな課題をもたらす。
我々は,複数のプライバシ保護されたローカルモデル(ローカルクライアント)を同時に学習することにより,汎用的なグローバルモデル(中央サーバ)を構築するための,フェデレート・パーソナライゼーション(FedReID)と呼ばれる新しいパラダイムを提案する。
このクライアントサーバ共同学習プロセスは、プライバシコントロールの下で反復的に実行されるため、分散データを共有したり、収集したりすることなく、分散学習を実現することができる。
論文 参考訳(メタデータ) (2020-06-07T13:32:33Z) - Byzantine-resilient Decentralized Stochastic Gradient Descent [85.15773446094576]
分散学習システムのビザンチンレジリエンスに関する詳細な研究について述べる。
ビザンチンフォールトトレランスを用いた分散学習を支援する新しいアルゴリズムUBARを提案する。
論文 参考訳(メタデータ) (2020-02-20T05:11:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。