論文の概要: DIAMBRA Arena: a New Reinforcement Learning Platform for Research and
Experimentation
- arxiv url: http://arxiv.org/abs/2210.10595v1
- Date: Wed, 19 Oct 2022 14:39:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 13:17:46.023299
- Title: DIAMBRA Arena: a New Reinforcement Learning Platform for Research and
Experimentation
- Title(参考訳): DIAMBRA Arena - 研究と実験のための新しい強化学習プラットフォーム
- Authors: Alessandro Palmas
- Abstract要約: 本研究は、強化学習研究と実験のための新しいプラットフォームであるDIAMBRA Arenaを提示する。
高品質な環境のコレクションが,OpenAI Gym標準に完全に準拠したPython APIを公開している。
これらは、離散的なアクションと観測を生のピクセルと追加の数値で構成したエピソディックなタスクである。
- 参考スコア(独自算出の注目度): 91.3755431537592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent advances in reinforcement learning have led to effective methods
able to obtain above human-level performances in very complex environments.
However, once solved, these environments become less valuable, and new
challenges with different or more complex scenarios are needed to support
research advances. This work presents DIAMBRA Arena, a new platform for
reinforcement learning research and experimentation, featuring a collection of
high-quality environments exposing a Python API fully compliant with OpenAI Gym
standard. They are episodic tasks with discrete actions and observations
composed by raw pixels plus additional numerical values, all supporting both
single player and two players mode, allowing to work on standard reinforcement
learning, competitive multi-agent, human-agent competition, self-play,
human-in-the-loop training and imitation learning. Software capabilities are
demonstrated by successfully training multiple deep reinforcement learning
agents with proximal policy optimization obtaining human-like behavior. Results
confirm the utility of DIAMBRA Arena as a reinforcement learning research tool,
providing environments designed to study some of the most challenging topics in
the field.
- Abstract(参考訳): 最近の強化学習の進歩は、非常に複雑な環境において、人間レベルのパフォーマンスを達成する効果的な方法を生み出した。
しかし、一旦解決すれば、これらの環境の価値は低下し、研究の進歩をサポートするために、異なる、あるいはより複雑なシナリオの新たな挑戦が必要となる。
この研究は、強化学習の研究と実験のための新しいプラットフォームであるDIAMBRA Arenaを紹介し、OpenAI Gym標準に完全に準拠したPython APIを公開する高品質な環境のコレクションを特徴とする。
これらは、個別のアクションと観察を生のピクセルと追加の数値で構成し、それぞれがシングルプレイヤーと2人のプレイヤーモードをサポートし、標準的な強化学習、競合するマルチエージェント、ヒューマンエージェント競技、セルフプレイ、ヒューマン・イン・ザ・ループのトレーニング、模倣学習に取り組むことができる。
ソフトウェア能力は、人間のような振る舞いを得るための近似ポリシー最適化を用いて、複数の深層強化学習エージェントを訓練することで実証される。
その結果、DIAMBRA Arenaの強化学習研究ツールとしての有用性を確認し、この分野で最も困難なトピックのいくつかを研究するために設計された環境を提供する。
関連論文リスト
- FightLadder: A Benchmark for Competitive Multi-Agent Reinforcement Learning [25.857375787748715]
我々は、リアルタイムの格闘ゲームプラットフォームであるFightLadderを紹介し、競争力のあるMARL研究を促進する。
競争ゲームのための最先端のMARLアルゴリズムの実装と評価指標のセットを提供する。
シングルプレイヤーモードで12文字を連続的に打ち破る汎用エージェントを訓練することにより,このプラットフォームの実現可能性を示す。
論文 参考訳(メタデータ) (2024-06-04T08:04:23Z) - Mimicking To Dominate: Imitation Learning Strategies for Success in
Multiagent Competitive Games [13.060023718506917]
我々は、対戦者の次の動きを予測するための新しいマルチエージェント模倣学習モデルを開発する。
また、模倣学習モデルとポリシートレーニングを組み合わせた、新しいマルチエージェント強化学習アルゴリズムを1つのトレーニングプロセスに導入する。
実験結果から,本手法は既存のマルチエージェントRLアルゴリズムと比較して性能が優れていることがわかった。
論文 参考訳(メタデータ) (2023-08-20T07:30:13Z) - Human Decision Makings on Curriculum Reinforcement Learning with
Difficulty Adjustment [52.07473934146584]
我々は,カリキュラム強化学習結果を,人的意思決定プロセスから学ぶことで,難しすぎず,難しすぎるような望ましいパフォーマンスレベルに導く。
本システムは非常に並列化可能であり,大規模強化学習アプリケーションの訓練が可能となる。
強化学習性能は、人間の所望の難易度と同期してうまく調整できることが示される。
論文 参考訳(メタデータ) (2022-08-04T23:53:51Z) - Autonomous Reinforcement Learning: Formalism and Benchmarking [106.25788536376007]
人間や動物が行うような現実世界の具体的学習は、連続的で非エポゾディックな世界にある。
RLの一般的なベンチマークタスクはエピソジックであり、試行錯誤によってエージェントに複数の試行を行う環境がリセットされる。
この相違は、擬似環境向けに開発されたRLアルゴリズムを現実世界のプラットフォーム上で実行しようとする場合、大きな課題となる。
論文 参考訳(メタデータ) (2021-12-17T16:28:06Z) - rSoccer: A Framework for Studying Reinforcement Learning in Small and
Very Small Size Robot Soccer [0.0]
本稿では,強化学習実験に最適化されたIEEE Very Small Size SoccerとSmall Size Leagueのオープンソースシミュレータを紹介する。
また,単一エージェントおよびマルチエージェントロボットサッカースキルを評価するためのベンチマークタスクのセットを用いて,OpenAI Gym環境を作成するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T01:30:21Z) - The AI Arena: A Framework for Distributed Multi-Agent Reinforcement
Learning [0.3437656066916039]
分散マルチエージェント強化学習のための柔軟な抽象化を備えたスケーラブルなフレームワークであるAI Arenaを紹介します。
複数の異なる学習環境において、一般的なRL技術よりも分散マルチエージェント学習アプローチによる性能向上を示す。
論文 参考訳(メタデータ) (2021-03-09T22:16:19Z) - The MineRL 2020 Competition on Sample Efficient Reinforcement Learning
using Human Priors [62.9301667732188]
我々は,MineRLコンペティションの第2イテレーションを提案する。
競争の主な目標は、人間のデモンストレーションを効率的に活用できるアルゴリズムの開発を促進することです。
コンペティションは、データセットと環境のペアバージョンが複数提供される2ラウンドで構成されている。
各ラウンドの終わりに、競合他社はコンテナ化された学習アルゴリズムをaicrowdプラットフォームに提出する。
論文 参考訳(メタデータ) (2021-01-26T20:32:30Z) - Forgetful Experience Replay in Hierarchical Reinforcement Learning from
Demonstrations [55.41644538483948]
本稿では,複雑な視覚環境において,エージェントが低品質な実演を行えるようにするためのアプローチの組み合わせを提案する。
提案した目標指向のリプレイバッファ構築により,エージェントはデモにおいて複雑な階層的タスクを解くためのサブゴールを自動的に強調することができる。
私たちのアルゴリズムに基づくこのソリューションは、有名なMineRLコンペティションのすべてのソリューションを破り、エージェントがMinecraft環境でダイヤモンドをマイニングすることを可能にする。
論文 参考訳(メタデータ) (2020-06-17T15:38:40Z) - Learning from Learners: Adapting Reinforcement Learning Agents to be
Competitive in a Card Game [71.24825724518847]
本稿では,競争力のあるマルチプレイヤーカードゲームの現実的な実装を学習・プレイするために,一般的な強化学習アルゴリズムをどのように適用できるかについて検討する。
本研究は,学習エージェントに対して,エージェントが競争力を持つことの学習方法を評価するための特定のトレーニングと検証ルーチンを提案し,それらが相互の演奏スタイルにどのように適応するかを説明する。
論文 参考訳(メタデータ) (2020-04-08T14:11:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。