論文の概要: Learning to Coordinate without Communication under Incomplete Information
- arxiv url: http://arxiv.org/abs/2409.12397v1
- Date: Thu, 19 Sep 2024 01:41:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 15:03:37.770181
- Title: Learning to Coordinate without Communication under Incomplete Information
- Title(参考訳): 不完全情報に基づくコミュニケーションのない協調学習
- Authors: Shenghui Chen, Shufang Zhu, Giuseppe De Giacomo, Ufuk Topcu,
- Abstract要約: 自律的なエージェントが、パートナーの行動を解釈することで、どのように協力するかを示す。
Gnomes at Nightというテストベッドの実験結果から、学習したコミュニケーションの協調戦略が成功率を著しく向上させることが示された。
- 参考スコア(独自算出の注目度): 39.106914895158035
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Achieving seamless coordination in cooperative games is a crucial challenge in artificial intelligence, particularly when players operate under incomplete information. A common strategy to mitigate this information asymmetry involves leveraging explicit communication. However, direct communication is not always feasible due to factors such as transmission loss. We explore how effective coordination can be achieved without verbal communication, relying solely on observing each other's actions. We demonstrate how an autonomous agent can learn to cooperate by interpreting its partner's actions, which are used to hint at its intents. Our approach involves developing an agent strategy by constructing deterministic finite automata for each possible action and integrating them into a non-Markovian finite-state transducer. This transducer represents a non-deterministic strategy for the agent that suggests actions to assist its partner during gameplay. Experimental results in a testbed called Gnomes at Night show that the learned no-communication coordination strategy achieves significantly higher success rates and requires fewer steps to complete the game compared to uncoordinated scenarios, performing almost as well as an oracle baseline with direct communication.
- Abstract(参考訳): 協調ゲームにおけるシームレスなコーディネーションを達成することは、特に不完全な情報の下でプレイヤーが操作する場合、人工知能において重要な課題である。
この情報の非対称性を緩和するための一般的な戦略は、明示的なコミュニケーションを活用することである。
しかし、伝送損失などの要因により、直接通信が常に可能であるとは限らない。
我々は,お互いの行動を観察することのみに頼って,言葉によるコミュニケーションを使わずに効果的なコーディネーションを実現する方法について検討する。
我々は、自律エージェントが、その意図を暗示するために使用されるパートナーの行動を理解することによって、どのように協力を学べるかを実証する。
提案手法では, 可能な動作毎に決定論的有限オートマトンを構築し, 非マルコフ有限状態トランスデューサに統合することにより, エージェント戦略の開発を行う。
このトランスデューサは、ゲームプレイ中にパートナーを支援するアクションを提案するエージェントの非決定論的戦略を表す。
Gnomes at Night というテストベッドでの実験結果から,学習した非コミュニケーション協調戦略は成功率を著しく高くし,非コーディネートシナリオよりもゲームを完成させる手順を少なくする必要があり,直接通信によるオラクルベースラインとほぼ同等に機能することがわかった。
関連論文リスト
- Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [72.96949760114575]
我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。
GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。
我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-03-17T03:52:52Z) - Learning Communication Policies for Different Follower Behaviors in a
Collaborative Reference Game [22.28337771947361]
協調参照ゲームにおいて、仮定されたパートナー行動に対するニューラルネットワークエージェントの適応性を評価する。
以上の結果から, この新規成分は, より冗長なコミュニケーション戦略につながることが示唆された。
論文 参考訳(メタデータ) (2024-02-07T13:22:17Z) - From Explicit Communication to Tacit Cooperation:A Novel Paradigm for
Cooperative MARL [14.935456456463731]
本稿では,明示的なコミュニケーションから暗黙的な協調への段階的なシフトを促進する新しいパラダイムを提案する。
初期訓練段階では,エージェント間で関連情報を共有することで協力を促進する。
次に、明示的に伝達された情報と再構成された情報を組み合わせて混合情報を得る。
論文 参考訳(メタデータ) (2023-04-28T06:56:07Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - The Enforcers: Consistent Sparse-Discrete Methods for Constraining
Informative Emergent Communication [5.432350993419402]
コミュニケーションは、エージェントが目標を達成するために協力することを可能にする。
疎間コミュニケーションの学習における最近の研究は、特に協調作業において、コミュニケーションの減少のコストが報酬の減少につながるような、高分散トレーニングに悩まされている。
本研究は、コミュニケーションの減少による報酬の損失を抑え、差別に対するペナルティを排除し、上記の課題に対処する。
論文 参考訳(メタデータ) (2022-01-19T07:31:06Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Curriculum-Driven Multi-Agent Learning and the Role of Implicit
Communication in Teamwork [24.92668968807012]
難解なマルチエージェントコーディネーションタスクを解決するためのカリキュラム駆動型学習戦略を提案する。
我々は、創発的な暗黙のコミュニケーションが、優れた調整レベルを実現する上で大きな役割を果たすと主張している。
論文 参考訳(メタデータ) (2021-06-21T14:54:07Z) - Pow-Wow: A Dataset and Study on Collaborative Communication in Pommerman [12.498028338281625]
多エージェント学習では、エージェントは成功するために互いに調整する必要がある。人間にとって、この調整は通常、言語の使用によって行われる。
Pow-Wowは、ゴール指向の人間コミュニケーションを測る新しいデータセットである。
我々は,効果的なゲーム戦略をもたらすコミュニケーションの種類を分析し,それに応じて注釈を付けるとともに,コミュニケーションの傾向がゲーム結果に与える影響をコーパスレベルで統計分析する。
論文 参考訳(メタデータ) (2020-09-13T07:11:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。