論文の概要: Learning to Coordinate without Communication under Incomplete Information
- arxiv url: http://arxiv.org/abs/2409.12397v2
- Date: Wed, 05 Feb 2025 19:00:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 17:43:44.882005
- Title: Learning to Coordinate without Communication under Incomplete Information
- Title(参考訳): 不完全情報に基づくコミュニケーションのない協調学習
- Authors: Shenghui Chen, Shufang Zhu, Giuseppe De Giacomo, Ufuk Topcu,
- Abstract要約: 夜間のGnomes at Nightテストベッドでの実験結果から、直接コミュニケーションがなくても効果的な協調戦略を学習できることが示されている。
このような戦略は成功率を著しく高くし、未調整の戦略に比べてゲームを完成させる手順を少なくする。
- 参考スコア(独自算出の注目度): 39.106914895158035
- License:
- Abstract: Achieving seamless coordination in cooperative games is a crucial challenge in artificial intelligence, particularly when players operate under incomplete information. A common strategy to mitigate this information asymmetry involves leveraging explicit communication. However, direct (verbal) communication is not always feasible due to factors such as transmission loss. Leveraging the game Gnomes at Night, we explore how effective coordination can be achieved without verbal communication, relying solely on observing each other's actions. We demonstrate how an autonomous agent can learn to cooperate by interpreting its partner's sequences of actions, which are used to hint at its intents. Our approach generates a non-Markovian strategy for the agent by learning a deterministic finite automaton for each possible action and integrating these automata into a finite-state transducer. Experimental results in a Gnomes at Night testbed show that, even without direct communication, one can learn effective cooperation strategies. Such strategies achieve significantly higher success rates and require fewer steps to complete the game compared to uncoordinated ones, and perform almost as well as in the case direct communication is allowed.
- Abstract(参考訳): 協調ゲームにおけるシームレスなコーディネーションを達成することは、特に不完全な情報の下でプレイヤーが操作する場合、人工知能において重要な課題である。
この情報の非対称性を緩和するための一般的な戦略は、明示的なコミュニケーションを活用することである。
しかし、直接(言語)通信は、伝送損失などの要因により、必ずしも実現可能であるとは限らない。
Gnomes at Nightのゲームを活用することで、お互いの行動を観察することのみに頼らず、言葉によるコミュニケーションなしで効果的なコーディネーションが達成できるかを探求する。
我々は、自律エージェントが、その意図を示唆するために使用される、パートナーの行動列を解釈することで、どのように協力を学べるかを実証する。
提案手法は,可能な動作毎に決定論的有限オートマトンを学習し,これらのオートマトンを有限状態トランスデューサに統合することにより,エージェントに対するマルコフ的でない戦略を生成する。
夜間のGnomes at Nightテストベッドでの実験結果から、直接コミュニケーションがなくても効果的な協調戦略を学習できることが示されている。
このような戦略は成功率を著しく高くし、非協調的な戦略に比べてゲームを完成させる手順を少なくする必要があり、直接通信が許される場合とほぼ同等に機能する。
関連論文リスト
- Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [72.96949760114575]
我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。
GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。
我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-03-17T03:52:52Z) - Learning Communication Policies for Different Follower Behaviors in a
Collaborative Reference Game [22.28337771947361]
協調参照ゲームにおいて、仮定されたパートナー行動に対するニューラルネットワークエージェントの適応性を評価する。
以上の結果から, この新規成分は, より冗長なコミュニケーション戦略につながることが示唆された。
論文 参考訳(メタデータ) (2024-02-07T13:22:17Z) - From Explicit Communication to Tacit Cooperation:A Novel Paradigm for
Cooperative MARL [14.935456456463731]
本稿では,明示的なコミュニケーションから暗黙的な協調への段階的なシフトを促進する新しいパラダイムを提案する。
初期訓練段階では,エージェント間で関連情報を共有することで協力を促進する。
次に、明示的に伝達された情報と再構成された情報を組み合わせて混合情報を得る。
論文 参考訳(メタデータ) (2023-04-28T06:56:07Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - The Enforcers: Consistent Sparse-Discrete Methods for Constraining
Informative Emergent Communication [5.432350993419402]
コミュニケーションは、エージェントが目標を達成するために協力することを可能にする。
疎間コミュニケーションの学習における最近の研究は、特に協調作業において、コミュニケーションの減少のコストが報酬の減少につながるような、高分散トレーニングに悩まされている。
本研究は、コミュニケーションの減少による報酬の損失を抑え、差別に対するペナルティを排除し、上記の課題に対処する。
論文 参考訳(メタデータ) (2022-01-19T07:31:06Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Curriculum-Driven Multi-Agent Learning and the Role of Implicit
Communication in Teamwork [24.92668968807012]
難解なマルチエージェントコーディネーションタスクを解決するためのカリキュラム駆動型学習戦略を提案する。
我々は、創発的な暗黙のコミュニケーションが、優れた調整レベルを実現する上で大きな役割を果たすと主張している。
論文 参考訳(メタデータ) (2021-06-21T14:54:07Z) - Pow-Wow: A Dataset and Study on Collaborative Communication in Pommerman [12.498028338281625]
多エージェント学習では、エージェントは成功するために互いに調整する必要がある。人間にとって、この調整は通常、言語の使用によって行われる。
Pow-Wowは、ゴール指向の人間コミュニケーションを測る新しいデータセットである。
我々は,効果的なゲーム戦略をもたらすコミュニケーションの種類を分析し,それに応じて注釈を付けるとともに,コミュニケーションの傾向がゲーム結果に与える影響をコーパスレベルで統計分析する。
論文 参考訳(メタデータ) (2020-09-13T07:11:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。