Fugu-MT 論文翻訳(概要): Learning to Coordinate without Communication under Incomplete Information

論文の概要: Learning to Coordinate without Communication under Incomplete Information

arxiv url: http://arxiv.org/abs/2409.12397v1
Date: Thu, 19 Sep 2024 01:41:41 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-07 15:03:37.770181
Title: Learning to Coordinate without Communication under Incomplete Information
Title（参考訳）: 不完全情報に基づくコミュニケーションのない協調学習
Authors: Shenghui Chen, Shufang Zhu, Giuseppe De Giacomo, Ufuk Topcu,
Abstract要約: 自律的なエージェントが、パートナーの行動を解釈することで、どのように協力するかを示す。 Gnomes at Nightというテストベッドの実験結果から、学習したコミュニケーションの協調戦略が成功率を著しく向上させることが示された。
参考スコア（独自算出の注目度）: 39.106914895158035
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Achieving seamless coordination in cooperative games is a crucial challenge in artificial intelligence, particularly when players operate under incomplete information. A common strategy to mitigate this information asymmetry involves leveraging explicit communication. However, direct communication is not always feasible due to factors such as transmission loss. We explore how effective coordination can be achieved without verbal communication, relying solely on observing each other's actions. We demonstrate how an autonomous agent can learn to cooperate by interpreting its partner's actions, which are used to hint at its intents. Our approach involves developing an agent strategy by constructing deterministic finite automata for each possible action and integrating them into a non-Markovian finite-state transducer. This transducer represents a non-deterministic strategy for the agent that suggests actions to assist its partner during gameplay. Experimental results in a testbed called Gnomes at Night show that the learned no-communication coordination strategy achieves significantly higher success rates and requires fewer steps to complete the game compared to uncoordinated scenarios, performing almost as well as an oracle baseline with direct communication.
Abstract（参考訳）: 協調ゲームにおけるシームレスなコーディネーションを達成することは、特に不完全な情報の下でプレイヤーが操作する場合、人工知能において重要な課題である。この情報の非対称性を緩和するための一般的な戦略は、明示的なコミュニケーションを活用することである。しかし、伝送損失などの要因により、直接通信が常に可能であるとは限らない。我々は,お互いの行動を観察することのみに頼って,言葉によるコミュニケーションを使わずに効果的なコーディネーションを実現する方法について検討する。我々は、自律エージェントが、その意図を暗示するために使用されるパートナーの行動を理解することによって、どのように協力を学べるかを実証する。提案手法では, 可能な動作毎に決定論的有限オートマトンを構築し, 非マルコフ有限状態トランスデューサに統合することにより, エージェント戦略の開発を行う。このトランスデューサは、ゲームプレイ中にパートナーを支援するアクションを提案するエージェントの非決定論的戦略を表す。 Gnomes at Night というテストベッドでの実験結果から,学習した非コミュニケーション協調戦略は成功率を著しく高くし,非コーディネートシナリオよりもゲームを完成させる手順を少なくする必要があり,直接通信によるオラクルベースラインとほぼ同等に機能することがわかった。

関連論文リスト

Learning to Interact in World Latent for Team Coordination [53.51290193631586]
本研究は,多エージェント強化学習(MARL)におけるチーム協調を支援するために,対話型ワールドラテント(IWoL)という新しい表現学習フレームワークを提案する。コミュニケーションプロトコルを直接モデル化することにより,エージェント間関係とタスク固有の世界情報とを協調的にキャプチャする学習可能な表現空間を構築する。私たちの表現は、各エージェントの暗黙のラテントとしてだけでなく、コミュニケーションのための明示的なメッセージとしても使用できます。
論文参考訳（メタデータ） (2025-09-29T22:13:39Z)
Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文参考訳（メタデータ） (2024-11-01T05:56:51Z)
Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文参考訳（メタデータ） (2024-05-14T12:40:25Z)
GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [72.96949760114575]
我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。 GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文参考訳（メタデータ） (2024-03-17T03:52:52Z)
Learning Communication Policies for Different Follower Behaviors in a Collaborative Reference Game [22.28337771947361]
協調参照ゲームにおいて、仮定されたパートナー行動に対するニューラルネットワークエージェントの適応性を評価する。以上の結果から, この新規成分は, より冗長なコミュニケーション戦略につながることが示唆された。
論文参考訳（メタデータ） (2024-02-07T13:22:17Z)
Inferring the Goals of Communicating Agents from Actions and Instructions [47.5816320484482]
本稿では,あるエージェント,プリンシパルが,その共有計画に関する自然言語指示を他のエージェント,アシスタントに伝達できるような協力チームのモデルを提案する。 3人目のオブザーバが、アクションや指示からマルチモーダルな逆計画を通じて、チームの目標を推測する方法を示します。我々は,マルチエージェントグリッドワールドにおける人間の目標推定と比較し,モデルの推定が人間の判断と密接に相関していることを見出した。
論文参考訳（メタデータ） (2023-06-28T13:43:46Z)
From Explicit Communication to Tacit Cooperation:A Novel Paradigm for Cooperative MARL [14.935456456463731]
本稿では,明示的なコミュニケーションから暗黙的な協調への段階的なシフトを促進する新しいパラダイムを提案する。初期訓練段階では,エージェント間で関連情報を共有することで協力を促進する。次に、明示的に伝達された情報と再構成された情報を組み合わせて混合情報を得る。
論文参考訳（メタデータ） (2023-04-28T06:56:07Z)
Over-communicate no more: Situated RL agents learn concise communication protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。強化学習(RL)を用いたコミュニケーションの出現に関する研究エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文参考訳（メタデータ） (2022-11-02T21:08:14Z)
The Enforcers: Consistent Sparse-Discrete Methods for Constraining Informative Emergent Communication [5.432350993419402]
コミュニケーションは、エージェントが目標を達成するために協力することを可能にする。疎間コミュニケーションの学習における最近の研究は、特に協調作業において、コミュニケーションの減少のコストが報酬の減少につながるような、高分散トレーニングに悩まされている。本研究は、コミュニケーションの減少による報酬の損失を抑え、差別に対するペナルティを排除し、上記の課題に対処する。
論文参考訳（メタデータ） (2022-01-19T07:31:06Z)
Interpretation of Emergent Communication in Heterogeneous Collaborative Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文参考訳（メタデータ） (2021-10-12T06:56:11Z)
Curriculum-Driven Multi-Agent Learning and the Role of Implicit Communication in Teamwork [24.92668968807012]
難解なマルチエージェントコーディネーションタスクを解決するためのカリキュラム駆動型学習戦略を提案する。我々は、創発的な暗黙のコミュニケーションが、優れた調整レベルを実現する上で大きな役割を果たすと主張している。
論文参考訳（メタデータ） (2021-06-21T14:54:07Z)
Pow-Wow: A Dataset and Study on Collaborative Communication in Pommerman [12.498028338281625]
多エージェント学習では、エージェントは成功するために互いに調整する必要がある。人間にとって、この調整は通常、言語の使用によって行われる。 Pow-Wowは、ゴール指向の人間コミュニケーションを測る新しいデータセットである。我々は,効果的なゲーム戦略をもたらすコミュニケーションの種類を分析し,それに応じて注釈を付けるとともに,コミュニケーションの傾向がゲーム結果に与える影響をコーパスレベルで統計分析する。
論文参考訳（メタデータ） (2020-09-13T07:11:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。