論文の概要: Massively Multiagent Minigames for Training Generalist Agents
- arxiv url: http://arxiv.org/abs/2406.05071v1
- Date: Fri, 7 Jun 2024 16:41:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-10 13:12:42.530544
- Title: Massively Multiagent Minigames for Training Generalist Agents
- Title(参考訳): 総合エージェント訓練のための多エージェントミニゲーム
- Authors: Kyoung Whan Choe, Ryan Sullivan, Joseph Suárez,
- Abstract要約: 本稿では,強化学習ベンチマークとして使用する多エージェントミニゲームの集合であるMeta MMOを紹介する。
Meta MMOは、NeurIPSの2つのコンペティションの対象となった、非常にマルチエージェントな環境であるNeural MMO上に構築されている。
- 参考スコア(独自算出の注目度): 1.2762029466132794
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Meta MMO, a collection of many-agent minigames for use as a reinforcement learning benchmark. Meta MMO is built on top of Neural MMO, a massively multiagent environment that has been the subject of two previous NeurIPS competitions. Our work expands Neural MMO with several computationally efficient minigames. We explore generalization across Meta MMO by learning to play several minigames with a single set of weights. We release the environment, baselines, and training code under the MIT license. We hope that Meta MMO will spur additional progress on Neural MMO and, more generally, will serve as a useful benchmark for many-agent generalization.
- Abstract(参考訳): 本稿では,強化学習ベンチマークとして使用する多エージェントミニゲームの集合であるMeta MMOを紹介する。
Meta MMOは、NeurIPSの2つのコンペティションの対象となった、非常にマルチエージェントな環境であるNeural MMO上に構築されている。
我々の研究は、いくつかの計算効率の良いミニゲームでNeural MMOを拡張している。
メタMMOをまたいだ一般化を,一組の重みで複数のミニゲームを学ぶことで検討する。
私たちは環境、ベースライン、トレーニングコードをMITライセンス下でリリースしています。
Meta MMOがNeural MMOのさらなる進歩を加速し、より一般的には、多エージェントの一般化のための有用なベンチマークとして機能することを願っている。
関連論文リスト
- Leading the Pack: N-player Opponent Shaping [52.682734939786464]
我々は、複数のコプレーヤと複数のシェーピングエージェントを含む環境に、対向型シェーピング(OS)メソッドを拡張します。
多数のコプレーヤでプレイすると,OSメソッドの相対的な性能が低下し,OSメソッドが動作しない可能性が示唆された。
論文 参考訳(メタデータ) (2023-12-19T20:01:42Z) - Neural MMO 2.0: A Massively Multi-task Addition to Massively Multi-agent
Learning [36.03451274861878]
ニューラルMMO 2.0は強化学習研究のための大規模マルチエージェント環境である。
フレキシブルなタスクシステムを備えており、ユーザーは幅広い目的や報酬のシグナルを定義できる。
バージョン2.0は前バージョンを完全に書き直したもので、3倍の性能改善とCleanRLとの互換性がある。
論文 参考訳(メタデータ) (2023-11-07T05:36:39Z) - Towards Effective and Interpretable Human-Agent Collaboration in MOBA
Games: A Communication Perspective [23.600139293202336]
本稿は,MOBAゲームにおける人間とエージェントのコラボレーションを調査するための最初の試みである。
我々は,効率的なメタコマンド・コミュニケーション・フレームワークを設計することにより,人やエージェントが明示的なコミュニケーションを通じて協調することを可能にすることを提案する。
我々は、MCCエージェントが人間のチームメイトと合理的に協力できることを示し、また、異なるレベルのチームメイトと、人間のチームメイトの数とのコラボレーションを一般化することも示している。
論文 参考訳(メタデータ) (2023-04-23T12:11:04Z) - MineDojo: Building Open-Ended Embodied Agents with Internet-Scale
Knowledge [70.47759528596711]
私たちは、人気のMinecraftゲーム上に構築された新しいフレームワークであるMineDojoを紹介します。
本稿では,学習報酬関数として,大規模な事前学習ビデオ言語モデルを活用する新しいエージェント学習アルゴリズムを提案する。
我々のエージェントは、手動で設計した密なシェーピング報酬なしで、自由形式の言語で指定された様々なオープンエンドタスクを解くことができる。
論文 参考訳(メタデータ) (2022-06-17T15:53:05Z) - The Neural MMO Platform for Massively Multiagent Research [49.51549968445566]
Neural MMOは、大規模なエージェント集団、長期水平線、オープンエンドタスク、モジュール型ゲームシステムを組み合わせた研究プラットフォームである。
我々は、Neural MMOを、アクティブなサポート、継続的な開発、ドキュメント、追加のトレーニング、ロギング、視覚化ツールを備えた、フリーでオープンソースのソフトウェアとして提示します。
論文 参考訳(メタデータ) (2021-10-14T17:54:49Z) - Discovering Multi-Agent Auto-Curricula in Two-Player Zero-Sum Games [31.97631243571394]
明示的な人間設計なしに更新ルールの発見を自動化するフレームワークであるLMACを導入する。
意外なことに、人間のデザインがなくても、発見されたMARLアルゴリズムは競争力や性能が向上する。
LMAC は,例えば Kuhn Poker のトレーニングやPSRO の成績など,小型ゲームから大規模ゲームへの一般化が可能であることを示す。
論文 参考訳(メタデータ) (2021-06-04T22:30:25Z) - Scaling up Mean Field Games with Online Mirror Descent [55.36153467919289]
オンラインミラー Descent (OMD) を用いた平均場ゲーム (MFG) のスケールアップ均衡計算に対処する。
連続時間 OMD は自然かつモチベーションの良い単調性仮定の集合の下でナッシュ平衡に確実に収束することを示す。
様々な単一および多集団MFGに関する徹底的な実験的研究は、OMDがFictitious Play (FP)のような従来のアルゴリズムより優れていることを示している。
論文 参考訳(メタデータ) (2021-02-28T21:28:36Z) - Multi-Agent Collaboration via Reward Attribution Decomposition [75.36911959491228]
本稿では,StarCraftのマルチエージェントチャレンジにおいて,最先端のパフォーマンスを実現するコラボレーション型Q-ラーニング(CollaQ)を提案する。
CollaQは様々なStarCraft属性マップで評価され、既存の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-16T17:42:11Z) - Neural MMO v1.3: A Massively Multiagent Game Environment for Training
and Evaluating Neural Networks [48.5733173329785]
本稿では,MMOにインスパイアされたマルチエージェントゲーム環境であるNeural MMOを紹介する。
分散インフラストラクチャとゲームIOという,AI研究のためのマルチエージェントシステムエンジニアリングにおける,より一般的な2つの課題について論じる。
論文 参考訳(メタデータ) (2020-01-31T18:50:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。