論文の概要: Multi-Goal Reinforcement Learning environments for simulated Franka
Emika Panda robot
- arxiv url: http://arxiv.org/abs/2106.13687v1
- Date: Fri, 25 Jun 2021 15:13:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-28 15:34:45.980542
- Title: Multi-Goal Reinforcement Learning environments for simulated Franka
Emika Panda robot
- Title(参考訳): フランク・エミカ・パンダシミュレーションロボットのための多方向強化学習環境
- Authors: Quentin Gallou\'edec, Nicolas Cazin, Emmanuel Dellandr\'ea, Liming
Chen
- Abstract要約: panda-gymは、OpenAI Gymと統合されたFranka Emika Pandaロボットのための強化学習環境である。
5つのタスク: リーチ、プッシュ、スライド、ピック&プレイス、スタック。
オープンソースリサーチを促進するため、オープンソースの物理エンジンであるPyBulletを使用することを選択しました。
- 参考スコア(独自算出の注目度): 4.611412564351357
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This technical report presents panda-gym, a set Reinforcement Learning (RL)
environments for the Franka Emika Panda robot integrated with OpenAI Gym. Five
tasks are included: reach, push, slide, pick & place and stack. They all follow
a Multi-Goal RL framework, allowing to use goal-oriented RL algorithms. To
foster open-research, we chose to use the open-source physics engine PyBullet.
The implementation chosen for this package allows to define very easily new
tasks or new robots. This report also presents a baseline of results obtained
with state-of-the-art model-free off-policy algorithms. panda-gym is
open-source at https://github.com/qgallouedec/panda-gym.
- Abstract(参考訳): 本報告では,openai gym と統合した franka emika panda ロボットの強化学習(rl)環境である panda-gym を提案する。
reach、push、slide、pick & place、stackの5つのタスクが含まれている。
それらはすべてMulti-Goal RLフレームワークに従っており、目標指向のRLアルゴリズムを使用することができる。
オープンリサーチを促進するために、私たちはオープンソースの物理エンジンpybulletを使うことを選択しました。
このパッケージに選択された実装は、非常に簡単に新しいタスクや新しいロボットを定義することができる。
本報告では,最先端のモデルレスオフポリシーアルゴリズムを用いて得られた結果のベースラインを示す。
panda-gymはhttps://github.com/qgallouedec/panda-gymでオープンソースである。
関連論文リスト
- Octo: An Open-Source Generalist Robot Policy [88.14295917143188]
ここでは,Open X-Embodimentデータセットから800kトラジェクトリをトレーニングした,大規模なトランスフォーマーベースのポリシであるOctoを紹介する。
標準のGPUでは数時間以内に、新しいセンサー入力とアクションスペースを備えたロボットセットアップに効果的にカスタマイズできる。
また,アーキテクチャからトレーニングデータに至るまで,Octoモデルの設計決定の詳細な説明を行い,汎用ロボットモデルの構築に関する今後の研究を指導する。
論文 参考訳(メタデータ) (2024-05-20T17:57:01Z) - SERL: A Software Suite for Sample-Efficient Robotic Reinforcement
Learning [85.21378553454672]
筆者らは,報酬の計算と環境のリセットを行う手法とともに,効率的なオフ・ポリティクス・ディープ・RL法を含むライブラリを開発した。
我々は,PCBボードアセンブリ,ケーブルルーティング,オブジェクトの移動に関するポリシを,非常に効率的な学習を実現することができることを発見した。
これらの政策は完全な成功率またはほぼ完全な成功率、摂動下でさえ極端な堅牢性を実現し、突発的な堅牢性回復と修正行動を示す。
論文 参考訳(メタデータ) (2024-01-29T10:01:10Z) - Reinforcement Learning with Foundation Priors: Let the Embodied Agent Efficiently Learn on Its Own [59.11934130045106]
我々は、政策、価値、成功-回帰基盤モデルからのガイダンスとフィードバックを活用するために、RLFP(Reinforcement Learning with Foundation Priors)を提案する。
本フレームワークでは,自動報酬関数を用いてより効率的にエージェントを探索できるファウンデーション誘導型アクター・クリティカル(FAC)アルゴリズムを導入する。
本手法は,実ロボットとシミュレーションの両方において,様々な操作タスクにおいて顕著な性能を実現する。
論文 参考訳(メタデータ) (2023-10-04T07:56:42Z) - DIAMBRA Arena: a New Reinforcement Learning Platform for Research and
Experimentation [91.3755431537592]
本研究は、強化学習研究と実験のための新しいプラットフォームであるDIAMBRA Arenaを提示する。
高品質な環境のコレクションが,OpenAI Gym標準に完全に準拠したPython APIを公開している。
これらは、離散的なアクションと観測を生のピクセルと追加の数値で構成したエピソディックなタスクである。
論文 参考訳(メタデータ) (2022-10-19T14:39:10Z) - VRKitchen2.0-IndoorKit: A Tutorial for Augmented Indoor Scene Building
in Omniverse [77.52012928882928]
INDOORKITはNVIDIA OMNIVERSEの組み込みツールキットである。
屋内シーンビルディング、シーンランダム化、アニメーションコントロールのための柔軟なパイプラインを提供する。
論文 参考訳(メタデータ) (2022-06-23T17:53:33Z) - ARLO: A Framework for Automated Reinforcement Learning [36.91138310444942]
本稿では,AutoRLの自動パイプライン構築のためのフレームワーク,すなわちARLO: Automated Reinforcement Learningを提案する。
我々はそのようなパイプラインのPython実装を提供し、オープンソースライブラリとしてリリースしています。
我々の実装は、実証的なLQGドメインと古典的な MuJoCo 環境でテストされている。
論文 参考訳(メタデータ) (2022-05-20T19:16:04Z) - pymdp: A Python library for active inference in discrete state spaces [52.85819390191516]
pymdpはPythonでアクティブな推論をシミュレートするオープンソースパッケージである。
我々は,POMDPによるアクティブな推論をシミュレートする,最初のオープンソースパッケージを提供する。
論文 参考訳(メタデータ) (2022-01-11T12:18:44Z) - PowerGridworld: A Framework for Multi-Agent Reinforcement Learning in
Power Systems [6.782988908306483]
我々はPowerGridworldソフトウェアパッケージを紹介し、パワーシステムにフォーカスしたマルチエージェントGym環境を構築するための軽量でモジュール化されたカスタマイズ可能なフレームワークをユーザに提供します。
論文 参考訳(メタデータ) (2021-11-10T22:22:07Z) - An Open-Source Multi-Goal Reinforcement Learning Environment for Robotic
Manipulation with Pybullet [38.8947981067233]
この作業は、商用のMujocoエンジンをベースとしたOpenAI Gymマルチゴールロボット操作環境を、オープンソースのPybulletエンジンに再実装する。
ユーザーは、ジョイントコントロールモード、画像観察、ゴールにカスタマイズ可能なカメラと内蔵のカメラでアクセスできる新しいAPIをユーザーに提供します。
また,多段階・多ゴール・長水平・スパース報酬のロボット操作タスクのセットを設計し,これらの課題に対する新たな目標条件強化学習アルゴリズムの創出を目指す。
論文 参考訳(メタデータ) (2021-05-12T21:58:57Z) - NLPGym -- A toolkit for evaluating RL agents on Natural Language
Processing Tasks [2.5760935151452067]
NLPGymはオープンソースのPythonツールキットで、標準のNLPタスクに対してインタラクティブなテキスト環境を提供する。
研究の基盤となるRLアルゴリズムの異なる6つのタスクについて実験を行った。
論文 参考訳(メタデータ) (2020-11-16T20:58:35Z) - Landscape of R packages for eXplainable Artificial Intelligence [4.91155110560629]
この記事は主にRで利用可能なツールに特化していますが、Pythonコードの統合が容易であるため、Pythonから最も人気のあるライブラリの例も紹介します。
論文 参考訳(メタデータ) (2020-09-24T16:54:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。