論文の概要: Fever Basketball: A Complex, Flexible, and Asynchronized Sports Game
Environment for Multi-agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2012.03204v1
- Date: Sun, 6 Dec 2020 07:51:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-21 13:59:09.034560
- Title: Fever Basketball: A Complex, Flexible, and Asynchronized Sports Game
Environment for Multi-agent Reinforcement Learning
- Title(参考訳): Fever Basketball:マルチエージェント強化学習のための複雑で柔軟で非同期なスポーツゲーム環境
- Authors: Hangtian Jia, Yujing Hu, Yingfeng Chen, Chunxu Ren, Tangjie Lv,
Changjie Fan, Chongjie Zhang
- Abstract要約: バスケットボールの試合をエージェントが訓練する新しい強化学習環境であるFever Basketballゲームを紹介した。
複数の文字、複数の位置、シングルエージェントとマルチエージェントのプレイヤー制御モードをサポートする複雑で困難な環境である。
現実のバスケットボールの試合をより良くシミュレートするために、アクションの実行時間が異なるため、Fever Basketballは新しい非同期環境となる。
- 参考スコア(独自算出の注目度): 38.4742699455284
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of deep reinforcement learning (DRL) has benefited from the
emergency of a variety type of game environments where new challenging problems
are proposed and new algorithms can be tested safely and quickly, such as Board
games, RTS, FPS, and MOBA games. However, many existing environments lack
complexity and flexibility and assume the actions are synchronously executed in
multi-agent settings, which become less valuable. We introduce the Fever
Basketball game, a novel reinforcement learning environment where agents are
trained to play basketball game. It is a complex and challenging environment
that supports multiple characters, multiple positions, and both the
single-agent and multi-agent player control modes. In addition, to better
simulate real-world basketball games, the execution time of actions differs
among players, which makes Fever Basketball a novel asynchronized environment.
We evaluate commonly used multi-agent algorithms of both independent learners
and joint-action learners in three game scenarios with varying difficulties,
and heuristically propose two baseline methods to diminish the extra
non-stationarity brought by asynchronism in Fever Basketball Benchmarks.
Besides, we propose an integrated curricula training (ICT) framework to better
handle Fever Basketball problems, which includes several game-rule based
cascading curricula learners and a coordination curricula switcher focusing on
enhancing coordination within the team. The results show that the game remains
challenging and can be used as a benchmark environment for studies like
long-time horizon, sparse rewards, credit assignment, and non-stationarity,
etc. in multi-agent settings.
- Abstract(参考訳): 深層強化学習(drl)の開発は,新たな課題が提案され,ボードゲームやrts,fps,mobaゲームなど,新たなアルゴリズムを安全かつ迅速にテストすることが可能な,多種多様なゲーム環境の緊急性から恩恵を受けている。
しかし、多くの既存の環境は複雑さと柔軟性に欠けており、アクションがマルチエージェント設定で同期的に実行されると仮定している。
我々は,エージェントがバスケットボールゲームを練習する新しい強化学習環境である「フィーバー・バスケットボール・ゲーム」を紹介する。
複数の文字、複数の位置、シングルエージェントとマルチエージェントのプレイヤー制御モードをサポートする複雑で困難な環境である。
さらに、現実世界のバスケットボールの試合をより良くシミュレートするために、アクションの実行時間が異なるため、Fever Basketballを新しい非同期環境にする。
独立学習者と共同動作学習者の双方でよく使われるマルチエージェントアルゴリズムを,様々な困難を伴う3つのゲームシナリオで評価し,Fever Basketball Benchmarksにおける非定常性による余分な非定常性を減少させる2つのベースライン手法を提案する。
さらに,Fever Basketball問題に対処する統合型カリキュラムトレーニング(ICT)フレームワークを提案する。
その結果,ゲームは依然として挑戦的であり,長期水平地平線,スパース報酬,クレジット代入,非定常性などの研究のためのベンチマーク環境として使用できることがわかった。
マルチエージェント設定で。
関連論文リスト
- SkillMimic: Learning Reusable Basketball Skills from Demonstrations [85.23012579911378]
SkillMimicは、人間とボールの両方の動きを模倣して、さまざまなバスケットボールスキルを学習するデータ駆動型アプローチである。
SkillMimicは、人間とボールのモーションデータセットから多様なスキルを学ぶために、統一された構成を採用している。
SkillMimicが獲得したスキルは、高レベルのコントローラーで簡単に再利用でき、複雑なバスケットボールのタスクをこなせる。
論文 参考訳(メタデータ) (2024-08-12T15:19:04Z) - Basketball-SORT: An Association Method for Complex Multi-object Occlusion Problems in Basketball Multi-object Tracking [1.7331775755285384]
バスケットボールビデオにおけるCMOO問題に焦点を当てた,オンラインかつ堅牢なMOT手法であるBasketball-SORTを提案する。
本手法は,バスケットボールの固定ビデオデータセット上で高次追跡精度(HOTA)の63.48$%のスコアを得る。
論文 参考訳(メタデータ) (2024-06-28T04:49:57Z) - FightLadder: A Benchmark for Competitive Multi-Agent Reinforcement Learning [25.857375787748715]
我々は、リアルタイムの格闘ゲームプラットフォームであるFightLadderを紹介し、競争力のあるMARL研究を促進する。
競争ゲームのための最先端のMARLアルゴリズムの実装と評価指標のセットを提供する。
シングルプレイヤーモードで12文字を連続的に打ち破る汎用エージェントを訓練することにより,このプラットフォームの実現可能性を示す。
論文 参考訳(メタデータ) (2024-06-04T08:04:23Z) - A Black-box Approach for Non-stationary Multi-agent Reinforcement Learning [53.83345471268163]
非定常マルチエージェントシステムにおける平衡の学習について検討する。
単エージェント学習へのブラックボックス還元による様々な平衡の検証方法を示す。
論文 参考訳(メタデータ) (2023-06-12T23:48:24Z) - Centralized control for multi-agent RL in a complex Real-Time-Strategy
game [0.0]
マルチエージェント強化学習(MARL)は、共有環境で共存する複数の学習エージェントの行動を研究する。
MARLはシングルエージェントRLよりも難しい。
このプロジェクトは、Lux AI v2 KaggleコンペティションにRLを適用したエンドツーエンドエクスペリエンスを提供する。
論文 参考訳(メタデータ) (2023-04-25T17:19:05Z) - TiZero: Mastering Multi-Agent Football with Curriculum Learning and
Self-Play [19.98100026335148]
TiZeroは、スクラッチから学習する自己進化型マルチエージェントシステムである。
これは、Google Research Footballの環境において、これまでのシステムよりはるかに優れている。
論文 参考訳(メタデータ) (2023-02-15T08:19:18Z) - On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。
我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。
また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文 参考訳(メタデータ) (2023-01-26T17:25:45Z) - Off-Beat Multi-Agent Reinforcement Learning [62.833358249873704]
オフビート動作が一般的環境におけるモデルフリーマルチエージェント強化学習(MARL)について検討した。
モデルレスMARLアルゴリズムのための新しいエピソードメモリLeGEMを提案する。
我々は,Stag-Hunter Game,Quarry Game,Afforestation Game,StarCraft IIマイクロマネジメントタスクなど,オフビートアクションを伴うさまざまなマルチエージェントシナリオ上でLeGEMを評価する。
論文 参考訳(メタデータ) (2022-05-27T02:21:04Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。