論文の概要: Learning Individually Inferred Communication for Multi-Agent Cooperation
- arxiv url: http://arxiv.org/abs/2006.06455v2
- Date: Thu, 29 Apr 2021 03:43:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 13:04:28.891597
- Title: Learning Individually Inferred Communication for Multi-Agent Cooperation
- Title(参考訳): マルチエージェント協調のための個人推論コミュニケーションの学習
- Authors: Ziluo Ding, Tiejun Huang and Zongqing Lu
- Abstract要約: 我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。
先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。
I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
- 参考スコア(独自算出の注目度): 37.56115000150748
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Communication lays the foundation for human cooperation. It is also crucial
for multi-agent cooperation. However, existing work focuses on broadcast
communication, which is not only impractical but also leads to information
redundancy that could even impair the learning process. To tackle these
difficulties, we propose Individually Inferred Communication (I2C), a simple
yet effective model to enable agents to learn a prior for agent-agent
communication. The prior knowledge is learned via causal inference and realized
by a feed-forward neural network that maps the agent's local observation to a
belief about who to communicate with. The influence of one agent on another is
inferred via the joint action-value function in multi-agent reinforcement
learning and quantified to label the necessity of agent-agent communication.
Furthermore, the agent policy is regularized to better exploit communicated
messages. Empirically, we show that I2C can not only reduce communication
overhead but also improve the performance in a variety of multi-agent
cooperative scenarios, comparing to existing methods. The code is available at
https://github.com/PKU-AI-Edge/I2C.
- Abstract(参考訳): コミュニケーションは人間の協力の基盤となる。
マルチエージェント協調にも不可欠である。
しかし、既存の研究は、非現実的であるだけでなく、学習プロセスを損なう可能性のある情報冗長性につながる放送通信に焦点を当てている。
これらの課題に対処するために,エージェントがエージェントエージェント・エージェント・コミュニケーションの事前学習を可能にする簡易かつ効果的なモデルであるPersonally Inferred Communication (I2C)を提案する。
事前の知識は因果推論を通じて学習され、エージェントのローカルな観察を誰と通信すべきかについての信念にマッピングするフィードフォワードニューラルネットワークによって実現される。
一方のエージェントが他方に与える影響は、多エージェント強化学習における関節行動値関数を介して推測され、エージェントエージェント通信の必要性を示すために定量化される。
さらに、エージェントポリシーは、通信されたメッセージをよりうまく活用するために規則化されます。
実験により、I2Cは通信オーバーヘッドを低減できるだけでなく、既存の手法と比較して、様々なマルチエージェント協調シナリオの性能を向上させることができることを示した。
コードはhttps://github.com/PKU-AI-Edge/I2Cで公開されている。
関連論文リスト
- T2MAC: Targeted and Trusted Multi-Agent Communication through Selective
Engagement and Evidence-Driven Integration [15.91335141803629]
我々は、エージェントが選択的なエンゲージメントとエビデンス駆動の統合を学ぶのを助けるために、T2MAC(Targeted and Trusted Multi-Agent Communication)を提案する。
T2MACは、エージェントが個別化されたメッセージを作成し、理想的なコミュニケーションウィンドウをピンポイントし、信頼できるパートナーと対話することを可能にする。
本手法は,様々な課題を伴って,多様な協調型マルチエージェントタスクに対して評価を行う。
論文 参考訳(メタデータ) (2024-01-19T18:00:33Z) - Context-aware Communication for Multi-agent Reinforcement Learning [6.109127175562235]
マルチエージェント強化学習(MARL)のための文脈認識型コミュニケーション手法を開発した。
第1段階では、エージェントは放送方式で粗い表現を交換し、第2段階のコンテキストを提供する。
その後、エージェントは第2段階の注意機構を利用し、受信機用にパーソナライズされたメッセージを選択的に生成する。
CACOMの有効性を評価するため,アクタ批判型と値に基づくMARLアルゴリズムを併用する。
論文 参考訳(メタデータ) (2023-12-25T03:33:08Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - AC2C: Adaptively Controlled Two-Hop Communication for Multi-Agent
Reinforcement Learning [4.884877440051105]
本稿では,AC2C(Adaptive Controlled Two-Hop Communication)と呼ばれる新しい通信プロトコルを提案する。
AC2Cは、エージェント間の長距離情報交換によるパフォーマンス向上を可能にするために、適応的な2ホップ通信戦略を採用している。
本稿では,3つの協調型マルチエージェントタスクにおけるAC2Cの評価を行った。
論文 参考訳(メタデータ) (2023-02-24T09:00:34Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Coordinating Policies Among Multiple Agents via an Intelligent
Communication Channel [81.39444892747512]
MARL(Multi-Agent Reinforcement Learning)では、エージェントが直接通信できる特別なチャンネルがしばしば導入される。
本稿では,エージェントの集団的性能を向上させるために,エージェントが提供した信号の伝達と解釈を学習する,インテリジェントなファシリテータを通じてエージェントがコミュニケーションする手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T14:11:33Z) - Learning Selective Communication for Multi-Agent Path Finding [18.703918339797283]
決定因果通信(Decision Causal Communication、DCC)は、エージェントが隣人を選択して通信を行うためのシンプルで効率的なモデルである。
DCCは大規模問題を扱うために分散実行に適している。
論文 参考訳(メタデータ) (2021-09-12T03:07:20Z) - Adversarial Attacks On Multi-Agent Communication [80.4392160849506]
現代の自律システムはすぐに大規模に展開され、協調型マルチエージェントシステムの可能性を広げる。
このような利点は、セキュリティ侵害に対して脆弱であることが示されている通信チャネルに大きく依存している。
本稿では,エージェントが学習した中間表現を共有してコミュニケーションする新しいマルチエージェント環境において,このような攻撃を探索する。
論文 参考訳(メタデータ) (2021-01-17T00:35:26Z) - The Emergence of Adversarial Communication in Multi-Agent Reinforcement
Learning [6.18778092044887]
多くの現実世界の問題は、複数の自律エージェントの調整を必要とする。
最近の研究は、複雑なマルチエージェント協調を可能にする明示的なコミュニケーション戦略を学ぶためのグラフニューラルネットワーク(GNN)の約束を示している。
一つの利己的なエージェントが高度に操作的なコミュニケーション戦略を学習し、協調的なエージェントチームを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2020-08-06T12:48:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。