論文の概要: Pow-Wow: A Dataset and Study on Collaborative Communication in Pommerman
- arxiv url: http://arxiv.org/abs/2009.05940v1
- Date: Sun, 13 Sep 2020 07:11:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 02:51:39.593148
- Title: Pow-Wow: A Dataset and Study on Collaborative Communication in Pommerman
- Title(参考訳): pow-wow: pommermanにおけるコラボレーティブコミュニケーションのデータセットと研究
- Authors: Takuma Yoneda, Matthew R. Walter, Jason Naradowsky
- Abstract要約: 多エージェント学習では、エージェントは成功するために互いに調整する必要がある。人間にとって、この調整は通常、言語の使用によって行われる。
Pow-Wowは、ゴール指向の人間コミュニケーションを測る新しいデータセットである。
我々は,効果的なゲーム戦略をもたらすコミュニケーションの種類を分析し,それに応じて注釈を付けるとともに,コミュニケーションの傾向がゲーム結果に与える影響をコーパスレベルで統計分析する。
- 参考スコア(独自算出の注目度): 12.498028338281625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In multi-agent learning, agents must coordinate with each other in order to
succeed. For humans, this coordination is typically accomplished through the
use of language. In this work we perform a controlled study of human language
use in a competitive team-based game, and search for useful lessons for
structuring communication protocol between autonomous agents. We construct
Pow-Wow, a new dataset for studying situated goal-directed human communication.
Using the Pommerman game environment, we enlisted teams of humans to play
against teams of AI agents, recording their observations, actions, and
communications. We analyze the types of communications which result in
effective game strategies, annotate them accordingly, and present corpus-level
statistical analysis of how trends in communications affect game outcomes.
Based on this analysis, we design a communication policy for learning agents,
and show that agents which utilize communication achieve higher win-rates
against baseline systems than those which do not.
- Abstract(参考訳): マルチエージェント学習では、エージェントは成功するために互いにコーディネートする必要がある。
人間にとって、この協調は通常、言語の使用によって達成される。
本研究では,競争型チームベースゲームにおける人間の言語使用に関する制御研究を行い,自律エージェント間のコミュニケーションプロトコル構築のための有用な教訓を探索する。
Pow-Wowは、ゴール指向の人間コミュニケーションを測る新しいデータセットである。
Pommermanのゲーム環境を使って、私たちは人間のチームをAIエージェントのチームと対戦させ、観察、アクション、コミュニケーションを記録しました。
効果的なゲーム戦略をもたらすコミュニケーションの種類を分析し,それに従ってアノテートし,コミュニケーションの傾向がゲーム結果に与える影響に関するコーパスレベルの統計分析を行った。
この分析に基づいて,学習エージェントのためのコミュニケーションポリシーをデザインし,コミュニケーションを利用するエージェントがベースラインシステムに対して,そうでないエージェントよりも高いウィンレートを達成することを示す。
関連論文リスト
- Learning to Coordinate without Communication under Incomplete Information [39.106914895158035]
自律的なエージェントが、パートナーの行動を解釈することで、どのように協力するかを示す。
Gnomes at Nightというテストベッドの実験結果から、学習したコミュニケーションの協調戦略が成功率を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-09-19T01:41:41Z) - Human-Agent Cooperation in Games under Incomplete Information through Natural Language Communication [32.655335061150566]
不完全な情報の下で共通の目的を達成するために、2人のプレイヤーが交互にトークンを制御できる共有制御ゲームを導入する。
本ゲームでは,人間を相手とする自律エージェントのポリシー合成問題を定式化する。
本稿では,言語モジュールと計画モジュールからなるコミュニケーションベースのアプローチを提案する。
論文 参考訳(メタデータ) (2024-05-23T04:58:42Z) - GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [72.96949760114575]
我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。
GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。
我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-03-17T03:52:52Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Preference Communication in Multi-Objective Normal-Form Games [3.8099752264464883]
マルチオブジェクト環境において,複数のエージェントが同時に学習する問題について検討する。
協調型および自己関心型のコミュニケーションのための4つの新しい嗜好通信プロトコルを導入する。
嗜好コミュニケーションは学習過程を劇的に変化させ,循環的ナッシュ均衡の出現につながることが判明した。
論文 参考訳(メタデータ) (2021-11-17T15:30:41Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Few-shot Language Coordination by Modeling Theory of Mind [95.54446989205117]
我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
論文 参考訳(メタデータ) (2021-07-12T19:26:11Z) - The Emergence of Adversarial Communication in Multi-Agent Reinforcement
Learning [6.18778092044887]
多くの現実世界の問題は、複数の自律エージェントの調整を必要とする。
最近の研究は、複雑なマルチエージェント協調を可能にする明示的なコミュニケーション戦略を学ぶためのグラフニューラルネットワーク(GNN)の約束を示している。
一つの利己的なエージェントが高度に操作的なコミュニケーション戦略を学習し、協調的なエージェントチームを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2020-08-06T12:48:08Z) - Learning to cooperate: Emergent communication in multi-agent navigation [49.11609702016523]
本稿では,協調ナビゲーションタスクを行うエージェントが,解釈可能な通信プロトコルを学ぶことを示す。
エージェントのポリシーの分析により、創発的信号が状態空間を空間的にクラスタリングすることが明らかになった。
エージェントの集団を用いて,創発的プロトコルは基本構成構造を持つことを示す。
論文 参考訳(メタデータ) (2020-04-02T16:03:17Z) - On Emergent Communication in Competitive Multi-Agent Teams [116.95067289206919]
外部のエージェントチームによるパフォーマンスの競争が社会的影響として作用するかどうかを検討する。
以上の結果から,外部競争の影響により精度と一般化が向上し,コミュニケーション言語が急速に出現することが示唆された。
論文 参考訳(メタデータ) (2020-03-04T01:14:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。