論文の概要: DGRAG: Distributed Graph-based Retrieval-Augmented Generation in Edge-Cloud Systems
- arxiv url: http://arxiv.org/abs/2505.19847v1
- Date: Mon, 26 May 2025 11:31:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.385225
- Title: DGRAG: Distributed Graph-based Retrieval-Augmented Generation in Edge-Cloud Systems
- Title(参考訳): DGRAG:エッジクラウドシステムにおける分散グラフベースの検索拡張生成
- Authors: Wenqing Zhou, Yuxuan Yan, Qianqian Yang,
- Abstract要約: エッジクラウドシステムにおいて,DGRAGと呼ばれる分散知識グラフに基づくRAGアプローチを提案する。
分散知識構築フェーズでは、DGRAGは知識グラフを使用してローカル知識を整理し、サブグラフの要約を生成し、それらをクラウドの要約データベースに格納する。
局所的な知識範囲を超えるクエリに対して、クラウドは要約に基づいて最も関連性の高いエッジから知識を取得し、より正確な回答を生成する。
- 参考スコア(独自算出の注目度): 2.156425352848428
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-Augmented Generation (RAG) has emerged as a promising approach to enhance the capabilities of language models by integrating external knowledge. Due to the diversity of data sources and the constraints of memory and computing resources, real-world data is often scattered in multiple devices. Conventional RAGs that store massive amounts of scattered data centrally face increasing privacy concerns and high computational costs. Additionally, RAG in a central node raises latency issues when searching over a large-scale knowledge base. To address these challenges, we propose a distributed Knowledge Graph-based RAG approach, referred to as DGRAG, in an edge-cloud system, where each edge device maintains a local knowledge base without the need to share it with the cloud, instead sharing only summaries of its knowledge. Specifically, DGRAG has two main phases. In the Distributed Knowledge Construction phase, DGRAG organizes local knowledge using knowledge graphs, generating subgraph summaries and storing them in a summary database in the cloud as information sharing. In the Collaborative Retrieval and Generation phase, DGRAG first performs knowledge retrieval and answer generation locally, and a gate mechanism determines whether the query is beyond the scope of local knowledge or processing capabilities. For queries that exceed the local knowledge scope, the cloud retrieves knowledge from the most relevant edges based on the summaries and generates a more precise answer. Experimental results demonstrate the effectiveness of the proposed DGRAG approach in significantly improving the quality of question-answering tasks over baseline approaches.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) は、言語モデルの能力を高めるための有望なアプローチとして、外部知識を統合することによって登場した。
データソースの多様性とメモリとコンピューティングリソースの制約のため、実世界のデータは複数のデバイスに分散することが多い。
大量の分散データを格納する従来のRAGは、プライバシーの懸念と計算コストの増大に直面している。
さらに、中央ノードのRAGは、大規模な知識ベースを検索する際にレイテンシの問題を引き起こす。
これらの課題に対処するために、エッジクラウドシステムでは、各エッジデバイスがローカルな知識ベースをクラウドと共有することなく維持し、その知識の要約のみを共有する、分散知識グラフベースのRAGアプローチ(DGRAG)を提案する。
具体的には、DGRAGには2つの主要なフェーズがある。
分散知識構築フェーズでは、DGRAGは知識グラフを使用してローカル知識を整理し、サブグラフの要約を生成し、それらをクラウド上の要約データベースに情報共有として保存する。
協調検索生成フェーズにおいて、DGRAGはまず、ローカルで知識検索と回答生成を行い、ゲート機構により、クエリが局所的な知識や処理能力の範囲を超えているかどうかを判断する。
局所的な知識範囲を超えるクエリに対して、クラウドは要約に基づいて最も関連性の高いエッジから知識を取得し、より正確な回答を生成する。
実験の結果,提案手法がベースライン手法よりも質問応答タスクの質を著しく向上させる効果が示された。
関連論文リスト
- Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [75.9865035064794]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - Explain What You Mean: Intent Augmented Knowledge Graph Recommender Built With An LLM [8.40367600570591]
Intent Knowledge Recommender (IKGR)は、検索拡張生成と知識グラフの構築と密度化のための符号化アプローチを活用する新しいフレームワークである。
IKGRは知識ギャップを克服し、公開と内部レコメンデーションデータセットの両方で最先端のベースラインよりも大幅に向上します。
論文 参考訳(メタデータ) (2025-05-16T06:07:19Z) - Graph-based Approaches and Functionalities in Retrieval-Augmented Generation: A Comprehensive Survey [15.60128530639056]
大規模な言語モデル(LLM)は、十分なトレーニングデータと最も更新された知識が不足しているため、推論中に事実エラーに悩まされる。
検索・拡張生成(RAG)はLLMの限界に対処するための有望な解決策として注目されている。
この調査は、RAG内のグラフの機能とパフォーマンス向上への影響について、新たな視点を提供する。
論文 参考訳(メタデータ) (2025-04-08T03:52:05Z) - Retrieval-Augmented Generation with Graphs (GraphRAG) [84.29507404866257]
Retrieval-augmented Generation (RAG) は、追加情報を取得することによって下流タスクの実行を向上させる強力な技術である。
グラフは、その固有の「エッジで接続されたノード」の性質により、巨大な異種情報と関係情報を符号化する。
従来のRAGとは異なり、多種多様な形式とドメイン固有の関係知識のようなグラフ構造化データのユニークさは、異なるドメインでGraphRAGを設計する際、ユニークで重要な課題を生じさせる。
論文 参考訳(メタデータ) (2024-12-31T06:59:35Z) - Multi-Source Knowledge Pruning for Retrieval-Augmented Generation: A Benchmark and Empirical Study [46.55831783809377]
大規模言語モデル(LLM)の幻覚を緩和するための効果的なアプローチとして,検索拡張世代(RAG)がますます認識されている。
PruningRAGはマルチグラニュラリティ・プルーニング・ストラテジーを用いて,関連コンテキストをより効果的に統合し,誤った情報に対するネガティブな影響を軽減するためのプラグアンドプレイRAGフレームワークである。
論文 参考訳(メタデータ) (2024-09-03T03:31:37Z) - Bridged-GNN: Knowledge Bridge Learning for Effective Knowledge Transfer [65.42096702428347]
グラフニューラルネットワーク(GNN)は、隣接するノードから情報を集約する。
知識ブリッジ学習(KBL)は、対象ドメインに対する知識強化後部分布を学習する。
Bridged-GNNには、Bridged-Graphを構築するためのAdaptive Knowledge Retrievalモジュールと、Graph Knowledge Transferモジュールが含まれている。
論文 参考訳(メタデータ) (2023-08-18T12:14:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。