論文の概要: Minigrid & Miniworld: Modular & Customizable Reinforcement Learning
Environments for Goal-Oriented Tasks
- arxiv url: http://arxiv.org/abs/2306.13831v1
- Date: Sat, 24 Jun 2023 01:16:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-27 18:48:44.274877
- Title: Minigrid & Miniworld: Modular & Customizable Reinforcement Learning
Environments for Goal-Oriented Tasks
- Title(参考訳): Minigrid & Miniworld: 目標指向タスクのためのモジュール型およびカスタマイズ可能な強化学習環境
- Authors: Maxime Chevalier-Boisvert, Bolun Dai, Mark Towers, Rodrigo de Lazcano,
Lucas Willems, Salem Lahlou, Suman Pal, Pablo Samuel Castro, Jordan Terry
- Abstract要約: MinigridおよびMiniworldライブラリは、目標指向の2Dおよび3D環境のスイートを提供する。
デザイン哲学、環境の詳細、およびそれらの世界生成APIについて概説する。
- 参考スコア(独自算出の注目度): 10.995552002845459
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the Minigrid and Miniworld libraries which provide a suite of
goal-oriented 2D and 3D environments. The libraries were explicitly created
with a minimalistic design paradigm to allow users to rapidly develop new
environments for a wide range of research-specific needs. As a result, both
have received widescale adoption by the RL community, facilitating research in
a wide range of areas. In this paper, we outline the design philosophy,
environment details, and their world generation API. We also showcase the
additional capabilities brought by the unified API between Minigrid and
Miniworld through case studies on transfer learning (for both RL agents and
humans) between the different observation spaces. The source code of Minigrid
and Miniworld can be found at https://github.com/Farama-Foundation/{Minigrid,
Miniworld} along with their documentation at https://{minigrid,
miniworld}.farama.org/.
- Abstract(参考訳): 目標指向の2Dおよび3D環境のスイートを提供するMinigridおよびMiniworldライブラリを提示する。
ライブラリは最小限の設計パラダイムで明示的に作成され、ユーザーは幅広い研究固有のニーズのために新しい環境を迅速に開発できる。
その結果、両者はRLコミュニティによって広く採用され、広範囲の研究が促進された。
本稿では,デザイン哲学,環境詳細,および世界生成APIについて概説する。
また、異なる観測空間間の移動学習(RLエージェントと人間の両方)のケーススタディを通じて、MinigridとMiniworldの統一APIによってもたらされる追加機能についても紹介する。
minigridとminiworldのソースコードは、https://github.com/farama-foundation/{minigrid, miniworld}にある。
farama.org/。
関連論文リスト
- NNsight and NDIF: Democratizing Access to Foundation Model Internals [48.27939917017487]
NNsightはオープンソースのPythonパッケージで、グラフを構築することで任意のPyTorchモデルの介入を表現できるシンプルなフレキシブルなAPIを備えている。
NDIFは、NNsight APIを通じて基礎的なLLMへのアクセスを提供する共同研究プラットフォームである。
論文 参考訳(メタデータ) (2024-07-18T17:59:01Z) - Craftium: An Extensible Framework for Creating Reinforcement Learning Environments [0.5461938536945723]
本稿では,リッチな3次元視覚的RL環境を探索・作成するための新しいフレームワークであるCraftiumについて述べる。
Craftiumは、Minetestゲームエンジンと人気のあるGymnasium APIの上に構築されている。
論文 参考訳(メタデータ) (2024-07-04T14:38:02Z) - Mini Honor of Kings: A Lightweight Environment for Multi-Agent Reinforcement Learning [47.06486281116165]
ゲームはマルチエージェント強化学習(MARL)の研究環境として広く利用されている
人気のモバイルゲーム「Honor of Kings」用の地図エディタを初めて公開し、軽量環境「Mini HoK」を設計する。
Mini HoKは非常に効率的で、実験をパーソナルPCやラップトップ上で行うことができるが、既存のMARLアルゴリズムには十分な課題がある。
論文 参考訳(メタデータ) (2024-06-06T11:42:33Z) - XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX [44.084458075924736]
XLand-MiniGridは、メタ強化学習研究のためのツールとグリッドワールド環境のスイートである。
JAXで書かれたXLand-MiniGridは高度にスケーラブルで、GPUやTPUアクセラレータ上で実行することができる。
論文 参考訳(メタデータ) (2023-12-19T10:57:12Z) - CoRL: Environment Creation and Management Focused on System Integration [0.0]
コア強化学習ライブラリ(Core Reinforcement Learning Library, CoRL)は、モジュール式で構成可能で、設定可能な環境作成ツールである。
簡単に読み取れる構成ファイル、ピダンティックバリデータ、およびファクタデザインパターンを使用することで、エージェントの観察、報酬、完了条件の微調整を可能にする。
論文 参考訳(メタデータ) (2023-03-03T19:01:53Z) - VRKitchen2.0-IndoorKit: A Tutorial for Augmented Indoor Scene Building
in Omniverse [77.52012928882928]
INDOORKITはNVIDIA OMNIVERSEの組み込みツールキットである。
屋内シーンビルディング、シーンランダム化、アニメーションコントロールのための柔軟なパイプラインを提供する。
論文 参考訳(メタデータ) (2022-06-23T17:53:33Z) - MiniHack the Planet: A Sandbox for Open-Ended Reinforcement Learning
Research [24.9044606044585]
MiniHackは、新しい深層強化学習環境を簡単に設計するための強力なサンドボックスフレームワークである。
NetHackのエンティティと環境ダイナミクスの完全なセットを活用することで、MiniHackはカスタムのRLテストベッドを設計できる。
さまざまなRLタスクとベースラインに加えて、MiniHackは既存のRLベンチマークをラップし、シームレスに複雑さを追加する方法を提供する。
論文 参考訳(メタデータ) (2021-09-27T17:22:42Z) - An Exploration of Embodied Visual Exploration [97.21890864063872]
身体的コンピュータビジョンは、新しい非構造環境におけるロボットに対する知覚を考慮に入れている。
既存の視覚探索アルゴリズムの分類を提示し、それらをベンチマークするための標準フレームワークを作成する。
次に,提案フレームワークを用いた4つの最先端パラダイムの徹底的な実証的研究を行った。
論文 参考訳(メタデータ) (2020-01-07T17:40:32Z) - MushroomRL: Simplifying Reinforcement Learning Research [60.70556446270147]
MushroomRLはオープンソースのPythonライブラリで、強化学習(RL)実験の実装と実行を簡単にするために開発された。
他の利用可能なライブラリと比較して、MushroomRLは、新しいRL方法論の実装とテストの労力を最小限に抑えるために、包括的で柔軟なフレームワークを提供することを目的として作られた。
論文 参考訳(メタデータ) (2020-01-04T17:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。