論文の概要: A Survey of Multi-Agent Deep Reinforcement Learning with Graph Neural Network-Based Communication
- arxiv url: http://arxiv.org/abs/2604.25972v1
- Date: Tue, 28 Apr 2026 07:50:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.113057
- Title: A Survey of Multi-Agent Deep Reinforcement Learning with Graph Neural Network-Based Communication
- Title(参考訳): グラフニューラルネットワークを用いた多エージェント深層強化学習の検討
- Authors: Valentin Cuzin-Rambaud, Laetitia Matignon, Maxime Morge,
- Abstract要約: マルチエージェント強化学習(MARL)において、コミュニケーション機構の統合により、エージェントは、情報を共有することで、行動のコーディネートと目的への収束をより良く学習することができる。
相互作用グラフに基づいて、メソッドのサブクラスは、通信を学ぶためにグラフニューラルネットワーク(GNN)を使用し、エージェントは情報を交換することで内部表現を改善することができる。
提案手法の背景にある概念をより明確かつアクセスしやすいものにすることを目的として,汎用的なGNNベースの通信プロセスを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In multi-agent reinforcement learning (MARL), the integration of a communication mechanism, allowing agents to better learn to coordinate their actions and converge on their objectives by sharing information. Based on an interaction graph, a subclass of methods employs graph neural networks (GNNs) to learn the communication, enabling agents to improve their internal representations by enriching them with information exchanged. With growing research, we note a lack of explicit structure and framework to distinguish and classify MARL approaches with communication based on GNNs. Thus, this paper surveys recent works in this field. We propose a generalized GNN-based communication process with the goal of making the underlying concepts behind the methods more obvious and accessible.
- Abstract(参考訳): マルチエージェント強化学習(MARL)では、エージェントが情報を共有することで、行動のコーディネートと目的への収束をよりよく学習できるコミュニケーション機構を統合する。
相互作用グラフに基づいて、メソッドのサブクラスは、通信を学ぶためにグラフニューラルネットワーク(GNN)を使用し、エージェントは情報を交換することで内部表現を改善することができる。
研究の進展に伴い、GNNに基づく通信でMARLアプローチを識別・分類するための明示的な構造と枠組みが欠如していることに留意する。
そこで本研究では,本分野における最近の研究を概観する。
提案手法の背景にある概念をより明確かつアクセスしやすいものにすることを目的として,汎用的なGNNベースの通信プロセスを提案する。
関連論文リスト
- Networked Agents in the Dark: Team Value Learning under Partial Observability [3.8779763612314633]
ネットワークエージェントのための協調型マルチエージェント強化学習(MARL)手法を提案する。
完全な状態情報や共同観測に依存する従来の手法とは対照的に、我々のエージェントは部分観測可能性の下で共有目的に到達する方法を学ぶ必要がある。
トレーニング中、個々の報酬を収集し、ローカルコミュニケーションを通じてチームの価値関数を近似し、協調行動をもたらす。
論文 参考訳(メタデータ) (2025-01-15T13:01:32Z) - Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - Learning State-Augmented Policies for Information Routing in Communication Networks [84.76186111434818]
我々は,グラフニューラルネットワーク(GNN)アーキテクチャを用いて,ソースノードの集約情報を最大化する,新たなステート拡張(SA)戦略を開発した。
教師なし学習手法を利用して、GNNアーキテクチャの出力を最適情報ルーティング戦略に変換する。
実験では,実時間ネットワークトポロジの評価を行い,アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2023-09-30T04:34:25Z) - Collaborative Information Dissemination with Graph-based Multi-Agent
Reinforcement Learning [2.9904113489777826]
本稿では,効率的な情報伝達のためのマルチエージェント強化学習(MARL)手法を提案する。
本稿では,各エージェントが個別にメッセージ転送を決定するための情報発信のための部分観測可能なゲーム(POSG)を提案する。
実験の結果,既存の手法よりも訓練済みの方針が優れていることがわかった。
論文 参考訳(メタデータ) (2023-08-25T21:30:16Z) - Cooperative Policy Learning with Pre-trained Heterogeneous Observation
Representations [51.8796674904734]
事前訓練された異種観察表現を用いた新たな協調学習フレームワークを提案する。
エンコーダ-デコーダに基づくグラフアテンションを用いて、複雑な相互作用と異種表現を学習する。
論文 参考訳(メタデータ) (2020-12-24T04:52:29Z) - Networked Multi-Agent Reinforcement Learning with Emergent Communication [18.47483427884452]
MARL(Multi-Agent Reinforcement Learning)法は,他の学習エージェントの存在下で活動するエージェントに対して最適なポリシーを求める。
コーディネートするひとつの方法は、相互通信を学ぶことです。
エージェントは共通のタスクを実行するために学習しながら言語を開発することができるか?
論文 参考訳(メタデータ) (2020-04-06T16:13:23Z) - Learning Structured Communication for Multi-agent Reinforcement Learning [104.64584573546524]
本研究では,マルチエージェント強化学習(MARL)環境下での大規模マルチエージェント通信機構について検討する。
本稿では、より柔軟で効率的な通信トポロジを用いて、LSC(Learning Structured Communication)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-11T07:19:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。