論文の概要: Mixed Cooperative-Competitive Communication Using Multi-Agent
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2110.15762v1
- Date: Fri, 29 Oct 2021 13:25:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 15:35:57.557342
- Title: Mixed Cooperative-Competitive Communication Using Multi-Agent
Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習を用いた複合協調コミュニケーション
- Authors: Astrid Vanneste, Wesley Van Wijnsberghe, Simon Vanneste, Kevin Mets,
Siegfried Mercelis, Steven Latr\'e, Peter Hellinckx
- Abstract要約: 混合協調競争環境に微分可能なエージェント間学習(DIAL)を適用した。
私たちは、チームにとってプライベートなコミュニケーションと、他のチームによって過度に耳を傾けるコミュニケーションの間のパフォーマンスの違いに注目します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: By using communication between multiple agents in multi-agent environments,
one can reduce the effects of partial observability by combining one agent's
observation with that of others in the same dynamic environment. While a lot of
successful research has been done towards communication learning in cooperative
settings, communication learning in mixed cooperative-competitive settings is
also important and brings its own complexities such as the opposing team
overhearing the communication. In this paper, we apply differentiable
inter-agent learning (DIAL), designed for cooperative settings, to a mixed
cooperative-competitive setting. We look at the difference in performance
between communication that is private for a team and communication that can be
overheard by the other team. Our research shows that communicating agents are
able to achieve similar performance to fully observable agents after a given
training period in our chosen environment. Overall, we find that sharing
communication across teams results in decreased performance for the
communicating team in comparison to results achieved with private
communication.
- Abstract(参考訳): マルチエージェント環境で複数のエージェント間の通信を利用することで、あるエージェントの観測と他のエージェントの観測を同じ動的環境で組み合わせることで、部分的可観測性の影響を低減できる。
協調的な環境でのコミュニケーション学習に多くの研究が成功したが、協調競争の混合環境でのコミュニケーション学習もまた重要であり、相手チームがコミュニケーションを過度に聞き取っているなど、独自の複雑さをもたらす。
本稿では,協調的設定のために設計された微分可能エージェント間学習(dial)を,協調的競争的混合設定に適用する。
私たちは、チームにとってプライベートなコミュニケーションと、他のチームによって耳にされるコミュニケーションとのパフォーマンスの違いに注目します。
本研究は,コミュニケーションエージェントが,選択した環境下でのトレーニング期間後に,完全観測可能なエージェントと同等の性能を達成できることを示唆する。
全体として、チーム間でのコミュニケーションの共有は、プライベートなコミュニケーションで達成した結果と比較して、コミュニケーションチームのパフォーマンスを低下させる。
関連論文リスト
- Mutual Theory of Mind in Human-AI Collaboration: An Empirical Study with LLM-driven AI Agents in a Real-time Shared Workspace Task [56.92961847155029]
心の理論(ToM)は、他人を理解する上で重要な能力として、人間の協調とコミュニケーションに大きな影響を及ぼす。
Mutual Theory of Mind (MToM) は、ToM能力を持つAIエージェントが人間と協力するときに発生する。
エージェントのToM能力はチームのパフォーマンスに大きな影響を与えず,エージェントの人間的理解を高めていることがわかった。
論文 参考訳(メタデータ) (2024-09-13T13:19:48Z) - T2MAC: Targeted and Trusted Multi-Agent Communication through Selective
Engagement and Evidence-Driven Integration [15.91335141803629]
我々は、エージェントが選択的なエンゲージメントとエビデンス駆動の統合を学ぶのを助けるために、T2MAC(Targeted and Trusted Multi-Agent Communication)を提案する。
T2MACは、エージェントが個別化されたメッセージを作成し、理想的なコミュニケーションウィンドウをピンポイントし、信頼できるパートナーと対話することを可能にする。
本手法は,様々な課題を伴って,多様な協調型マルチエージェントタスクに対して評価を行う。
論文 参考訳(メタデータ) (2024-01-19T18:00:33Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Provably Efficient Cooperative Multi-Agent Reinforcement Learning with
Function Approximation [15.411902255359074]
定常的な通信予算を一定に保っても,ほぼ最適に学習できることを示す。
私たちの仕事は、マルチエージェントコンテキストとマルチアームバンディット文学からMDP、強化学習まで、いくつかのアイデアを一般化します。
論文 参考訳(メタデータ) (2021-03-08T18:51:00Z) - Emergent Communication under Competition [10.926117869188651]
我々は,部分競合シナリオのスペクトルを調べるために,修正された送信者・受信者ゲームを導入する。
コミュニケーションは協調に比例し、部分的に競合するシナリオで起こりうることを示す。
論文 参考訳(メタデータ) (2021-01-25T17:58:22Z) - Exploring Zero-Shot Emergent Communication in Embodied Multi-Agent
Populations [59.608216900601384]
本研究では,3次元環境下で関節を作動させることでコミュニケーションを学ぶエージェントについて検討する。
現実的な仮定、意図の非一様分布、共通知識エネルギーコストにおいて、これらのエージェントは新規パートナーに一般化するプロトコルを見つけることができることを示す。
論文 参考訳(メタデータ) (2020-10-29T19:23:10Z) - Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。
先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。
I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-06-11T14:07:57Z) - On Emergent Communication in Competitive Multi-Agent Teams [116.95067289206919]
外部のエージェントチームによるパフォーマンスの競争が社会的影響として作用するかどうかを検討する。
以上の結果から,外部競争の影響により精度と一般化が向上し,コミュニケーション言語が急速に出現することが示唆された。
論文 参考訳(メタデータ) (2020-03-04T01:14:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。