論文の概要: WILD-SCAV: Benchmarking FPS Gaming AI on Unity3D-based Environments
- arxiv url: http://arxiv.org/abs/2210.09026v1
- Date: Fri, 14 Oct 2022 13:39:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 17:05:28.325664
- Title: WILD-SCAV: Benchmarking FPS Gaming AI on Unity3D-based Environments
- Title(参考訳): WILD-SCAV: Unity3Dベースの環境におけるFPSゲームAIのベンチマーク
- Authors: Xi Chen, Tianyu Shi, Qingpeng Zhao, Yuchen Sun, Yunfei Gao, Xiangjun
Wang
- Abstract要約: 深部強化学習(RL)の最近の進歩は,シミュレーション環境における複雑な意思決定能力を示している。
しかしながら、これらは、トレーニングやテストが行われる環境の複雑さやバリエーションが欠如しているため、より複雑な問題はほとんどありません。
我々は,このギャップを埋めるために,3次元オープンワールドFPSゲームに基づく,強力でオープンな環境であるWILD-SCAVを開発した。
エージェントは3D環境を理解し、ナビゲートし、計画し、人間のような方法で競争し、協力することができる。
- 参考スコア(独自算出の注目度): 5.020816812380825
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in deep reinforcement learning (RL) have demonstrated complex
decision-making capabilities in simulation environments such as Arcade Learning
Environment, MuJoCo, and ViZDoom. However, they are hardly extensible to more
complicated problems, mainly due to the lack of complexity and variations in
the environments they are trained and tested on. Furthermore, they are not
extensible to an open-world environment to facilitate long-term exploration
research. To learn realistic task-solving capabilities, we need to develop an
environment with greater diversity and complexity. We developed WILD-SCAV, a
powerful and extensible environment based on a 3D open-world FPS (First-Person
Shooter) game to bridge the gap. It provides realistic 3D environments of
variable complexity, various tasks, and multiple modes of interaction, where
agents can learn to perceive 3D environments, navigate and plan, compete and
cooperate in a human-like manner. WILD-SCAV also supports different
complexities, such as configurable maps with different terrains, building
structures and distributions, and multi-agent settings with cooperative and
competitive tasks. The experimental results on configurable complexity,
multi-tasking, and multi-agent scenarios demonstrate the effectiveness of
WILD-SCAV in benchmarking various RL algorithms, as well as it is potential to
give rise to intelligent agents with generalized task-solving abilities. The
link to our open-sourced code can be found here
https://github.com/inspirai/wilderness-scavenger.
- Abstract(参考訳): 深層強化学習(RL)の最近の進歩は、アーケード学習環境、MuJoCo、ViZDoomなどのシミュレーション環境において複雑な意思決定能力を示している。
しかし、これらはより複雑な問題に対してほとんど拡張できない。主な原因は、トレーニングやテストを行う環境における複雑さとバリエーションの欠如である。
さらに、長期的な探査研究を促進するために、オープンワールド環境に拡張できない。
現実的なタスク解決能力を学ぶためには、より多様性と複雑さのある環境を開発する必要がある。
WILD-SCAVは3次元オープンワールドFPS(First-Person Shooter)ゲームに基づく強力で拡張可能な環境である。
エージェントは3d環境を知覚し、ナビゲートし、計画し、競争し、人間のような方法で協力することを学ぶことができる。
WILD-SCAVは、異なる地形を持つ構成可能なマップ、構築構造と分布、協調的で競争的なタスクを持つマルチエージェント設定など、さまざまな複雑さもサポートしている。
構成可能な複雑性、マルチタスク、マルチエージェントシナリオに関する実験結果は、様々なRLアルゴリズムのベンチマークにおいてWILD-SCAVの有効性を示すとともに、汎用的なタスク解決能力を持つインテリジェントエージェントが生まれる可能性を示している。
オープンソースコードへのリンクはhttps://github.com/inspirai/wilderness-scavengerにあります。
関連論文リスト
- OpenWebVoyager: Building Multimodal Web Agents via Iterative Real-World Exploration, Feedback and Optimization [66.22117723598872]
マルチモーダルWebエージェントの開発を容易にするために設計されたオープンソースフレームワークを紹介する。
まず、基本モデルを模倣学習で訓練し、基礎能力を得る。
次に、エージェントにオープンウェブを探索させ、その軌道に関するフィードバックを収集する。
論文 参考訳(メタデータ) (2024-10-25T15:01:27Z) - Scaling Instructable Agents Across Many Simulated Worlds [70.97268311053328]
私たちのゴールは、シミュレーションされた3D環境で人間ができることを何でも達成できるエージェントを開発することです。
我々のアプローチは、最小限の仮定を示唆しながら、言語駆動の一般性に焦点を当てている。
我々のエージェントは、汎用的なヒューマンライクなインタフェースを使って、リアルタイムで環境と対話する。
論文 参考訳(メタデータ) (2024-03-13T17:50:32Z) - Open-ended search for environments and adapted agents using MAP-Elites [1.4502611532302039]
私たちは地形と仮想生物の地図を作成し、それらを補足します。
グリッドの次元としてノベルティを用いることで、地図は継続的に発展し、新しい環境の探索を促進することができる。
地図に対する手作りの有界次元は、広い環境のより迅速な探索に繋がるが、有界と無界の両方のアプローチは、多様な地形の解決に成功している。
論文 参考訳(メタデータ) (2023-05-02T02:03:51Z) - ArK: Augmented Reality with Knowledge Interactive Emergent Ability [115.72679420999535]
基礎モデルから新しいドメインへの知識記憶の伝達を学習する無限エージェントを開発する。
私たちのアプローチの核心は、Augmented Reality with Knowledge Inference Interaction (ArK)と呼ばれる新しいメカニズムである。
我々のArKアプローチは,大規模な基礎モデルと組み合わせることで,生成された2D/3Dシーンの品質を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-05-01T17:57:01Z) - DIAMBRA Arena: a New Reinforcement Learning Platform for Research and
Experimentation [91.3755431537592]
本研究は、強化学習研究と実験のための新しいプラットフォームであるDIAMBRA Arenaを提示する。
高品質な環境のコレクションが,OpenAI Gym標準に完全に準拠したPython APIを公開している。
これらは、離散的なアクションと観測を生のピクセルと追加の数値で構成したエピソディックなタスクである。
論文 参考訳(メタデータ) (2022-10-19T14:39:10Z) - Harfang3D Dog-Fight Sandbox: A Reinforcement Learning Research Platform
for the Customized Control Tasks of Fighter Aircrafts [0.0]
本研究では,戦闘機用の半現実的な飛行シミュレーション環境であるHarfang3D Dog-Fight Sandboxを提案する。
強化学習を用いた航空研究における主な課題を調査するための柔軟なツールボックスである。
ソフトウェアはまた、ボット航空機の配備とマルチエージェントタスクの開発を可能にする。
論文 参考訳(メタデータ) (2022-10-13T18:18:09Z) - Evaluating Continual Learning Algorithms by Generating 3D Virtual
Environments [66.83839051693695]
連続学習とは、人間や動物が特定の環境で徐々に学習する能力である。
本稿では3次元仮想環境の最近の進歩を活用して,フォトリアリスティックな外観を持つ潜在的に長寿命な動的シーンの自動生成にアプローチすることを提案する。
本論文の新たな要素は、シーンがパラメトリックな方法で記述され、エージェントが知覚する入力ストリームの視覚的複雑さを完全に制御できることである。
論文 参考訳(メタデータ) (2021-09-16T10:37:21Z) - The NetHack Learning Environment [79.06395964379107]
本稿では、強化学習研究のための手続き的に生成されたローグのような環境であるNetHack Learning Environment(NLE)を紹介する。
我々は,NetHackが,探索,計画,技術習得,言語条件付きRLといった問題に対する長期的な研究を促進するのに十分複雑であると主張している。
我々は,分散されたDeep RLベースラインとランダムネットワーク蒸留探索を用いて,ゲームの初期段階における実験的な成功を示す。
論文 参考訳(メタデータ) (2020-06-24T14:12:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。