論文の概要: The Emergence of Adversarial Communication in Multi-Agent Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2008.02616v2
- Date: Wed, 4 Nov 2020 18:01:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 06:53:56.401427
- Title: The Emergence of Adversarial Communication in Multi-Agent Reinforcement
Learning
- Title(参考訳): マルチエージェント強化学習における逆コミュニケーションの出現
- Authors: Jan Blumenkamp, Amanda Prorok
- Abstract要約: 多くの現実世界の問題は、複数の自律エージェントの調整を必要とする。
最近の研究は、複雑なマルチエージェント協調を可能にする明示的なコミュニケーション戦略を学ぶためのグラフニューラルネットワーク(GNN)の約束を示している。
一つの利己的なエージェントが高度に操作的なコミュニケーション戦略を学習し、協調的なエージェントチームを大幅に上回っていることを示す。
- 参考スコア(独自算出の注目度): 6.18778092044887
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many real-world problems require the coordination of multiple autonomous
agents. Recent work has shown the promise of Graph Neural Networks (GNNs) to
learn explicit communication strategies that enable complex multi-agent
coordination. These works use models of cooperative multi-agent systems whereby
agents strive to achieve a shared global goal. When considering agents with
self-interested local objectives, the standard design choice is to model these
as separate learning systems (albeit sharing the same environment). Such a
design choice, however, precludes the existence of a single, differentiable
communication channel, and consequently prohibits the learning of inter-agent
communication strategies. In this work, we address this gap by presenting a
learning model that accommodates individual non-shared rewards and a
differentiable communication channel that is common among all agents. We focus
on the case where agents have self-interested objectives, and develop a
learning algorithm that elicits the emergence of adversarial communications. We
perform experiments on multi-agent coverage and path planning problems, and
employ a post-hoc interpretability technique to visualize the messages that
agents communicate to each other. We show how a single self-interested agent is
capable of learning highly manipulative communication strategies that allows it
to significantly outperform a cooperative team of agents.
- Abstract(参考訳): 多くの現実世界の問題は複数の自律エージェントの調整を必要とする。
最近の研究は、複雑なマルチエージェント協調を可能にする明示的なコミュニケーション戦略を学ぶためのグラフニューラルネットワーク(GNN)の約束を示している。
これらの研究は協調型マルチエージェントシステムのモデルを用いており、エージェントは共通のグローバル目標を達成するために努力する。
自己関心のあるローカルな目的を持つエージェントを考えるとき、標準的な設計選択はこれらを独立した学習システムとしてモデル化することである。
しかし、このような設計選択は、単一の異なる通信チャネルの存在を妨げ、結果としてエージェント間通信戦略の学習を禁止している。
本研究では,このギャップに対処するために,個別の非共有報酬に対応する学習モデルと,すべてのエージェントに共通する識別可能なコミュニケーションチャネルを提示する。
エージェントが自己関心のある目的を持つ場合に注目し,敵とのコミュニケーションの出現を誘発する学習アルゴリズムを開発する。
我々は,マルチエージェントのカバレッジと経路計画問題に関する実験を行い,エージェントが相互に通信するメッセージを可視化するポストホックな解釈手法を用いた。
エージェントの協調チームを大きく上回るような,高度にマニピュレイティブなコミュニケーション戦略を学習できる,単一の自己関心エージェントの能力を示す。
関連論文リスト
- Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - Coordinating Policies Among Multiple Agents via an Intelligent
Communication Channel [81.39444892747512]
MARL(Multi-Agent Reinforcement Learning)では、エージェントが直接通信できる特別なチャンネルがしばしば導入される。
本稿では,エージェントの集団的性能を向上させるために,エージェントが提供した信号の伝達と解釈を学習する,インテリジェントなファシリテータを通じてエージェントがコミュニケーションする手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T14:11:33Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。
先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。
I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-06-11T14:07:57Z) - Networked Multi-Agent Reinforcement Learning with Emergent Communication [18.47483427884452]
MARL(Multi-Agent Reinforcement Learning)法は,他の学習エージェントの存在下で活動するエージェントに対して最適なポリシーを求める。
コーディネートするひとつの方法は、相互通信を学ぶことです。
エージェントは共通のタスクを実行するために学習しながら言語を開発することができるか?
論文 参考訳(メタデータ) (2020-04-06T16:13:23Z) - A Visual Communication Map for Multi-Agent Deep Reinforcement Learning [7.003240657279981]
マルチエージェント学習は、隠蔽された通信媒体を割り当てる上で大きな課題となる。
最近の研究は一般的に、エージェント間の通信を可能にするために、特殊なニューラルネットワークと強化学習を組み合わせる。
本稿では,多数のエージェントを扱うだけでなく,異種機能エージェント間の協調を可能にする,よりスケーラブルなアプローチを提案する。
論文 参考訳(メタデータ) (2020-02-27T02:38:21Z) - Learning Structured Communication for Multi-agent Reinforcement Learning [104.64584573546524]
本研究では,マルチエージェント強化学習(MARL)環境下での大規模マルチエージェント通信機構について検討する。
本稿では、より柔軟で効率的な通信トポロジを用いて、LSC(Learning Structured Communication)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-11T07:19:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。