論文の概要: An Open-Source Multi-Goal Reinforcement Learning Environment for Robotic
Manipulation with Pybullet
- arxiv url: http://arxiv.org/abs/2105.05985v1
- Date: Wed, 12 May 2021 21:58:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-14 13:49:06.804183
- Title: An Open-Source Multi-Goal Reinforcement Learning Environment for Robotic
Manipulation with Pybullet
- Title(参考訳): Pybulletを用いたロボットマニピュレーションのためのオープンソースの多目的強化学習環境
- Authors: Xintong Yang, Ze Ji, Jing Wu, Yu-Kun Lai
- Abstract要約: この作業は、商用のMujocoエンジンをベースとしたOpenAI Gymマルチゴールロボット操作環境を、オープンソースのPybulletエンジンに再実装する。
ユーザーは、ジョイントコントロールモード、画像観察、ゴールにカスタマイズ可能なカメラと内蔵のカメラでアクセスできる新しいAPIをユーザーに提供します。
また,多段階・多ゴール・長水平・スパース報酬のロボット操作タスクのセットを設計し,これらの課題に対する新たな目標条件強化学習アルゴリズムの創出を目指す。
- 参考スコア(独自算出の注目度): 38.8947981067233
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This work re-implements the OpenAI Gym multi-goal robotic manipulation
environment, originally based on the commercial Mujoco engine, onto the
open-source Pybullet engine. By comparing the performances of the Hindsight
Experience Replay-aided Deep Deterministic Policy Gradient agent on both
environments, we demonstrate our successful re-implementation of the original
environment. Besides, we provide users with new APIs to access a joint control
mode, image observations and goals with customisable camera and a built-in
on-hand camera. We further design a set of multi-step, multi-goal, long-horizon
and sparse reward robotic manipulation tasks, aiming to inspire new
goal-conditioned reinforcement learning algorithms for such challenges. We use
a simple, human-prior-based curriculum learning method to benchmark the
multi-step manipulation tasks. Discussions about future research opportunities
regarding this kind of tasks are also provided.
- Abstract(参考訳): この作業は、商用のmujocoエンジンをベースにしたopenai gymのマルチゴールロボット操作環境を、オープンソースのpybulletエンジンに再実装したものだ。
両環境における隠れ体験リプレイ支援Deep Deterministic Policy Gradient エージェントの性能を比較することで,オリジナル環境の再実装に成功したことを実証する。
さらに、ユーザに対して、ジョイントコントロールモードにアクセスするための新しいAPI、カスタマイズ可能なカメラと内蔵オンハンドカメラによる画像観察と目標を提供する。
さらに,多段階,多ゴール,長水平,スパースなロボット操作タスクのセットを設計し,これらの課題に対する新たな目標条件強化学習アルゴリズムの創出を目指す。
マルチステップ操作タスクをベンチマークするために,簡単な,人間優先のカリキュラム学習手法を用いる。
この種の課題に関する今後の研究機会についても論じる。
関連論文リスト
- Dreamitate: Real-World Visuomotor Policy Learning via Video Generation [49.03287909942888]
本研究では,与えられたタスクの人間による実演の映像拡散モデルを微調整するビジュモータポリシー学習フレームワークを提案する。
我々は,新しいシーンの画像に条件付きタスクの実行例を生成し,この合成された実行を直接使用してロボットを制御する。
論文 参考訳(メタデータ) (2024-06-24T17:59:45Z) - MOKA: Open-World Robotic Manipulation through Mark-Based Visual Prompting [97.52388851329667]
我々は,自由形式の言語命令で指定されたロボット操作タスクを解決するために,マーキングオープンワールドキーポイントアフォード(Moka)を導入する。
我々のアプローチの中心は、VLMの観測画像と物理世界におけるロボットの行動に関する予測を橋渡しする、コンパクトな点ベースの可測性表現である。
ツールの使用,変形可能な身体操作,オブジェクト再構成など,さまざまなテーブルトップ操作タスクにおけるMokaの性能評価と解析を行った。
論文 参考訳(メタデータ) (2024-03-05T18:08:45Z) - Learning to Design and Use Tools for Robotic Manipulation [21.18538869008642]
深層学習による形態と制御を共同最適化する最近の技術は, 移動エージェントの設計に有効である。
単一設計ではなく,設計方針の学習を提案する。
このフレームワークは,マルチゴール設定やマルチバリアント設定において,従来の手法よりもサンプリング効率が高いことを示す。
論文 参考訳(メタデータ) (2023-11-01T18:00:10Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Generalizable Long-Horizon Manipulations with Large Language Models [91.740084601715]
本研究は,Large Language Models (LLMs) の機能を活用して,汎用可能な長距離操作のための原始的なタスク条件を生成するフレームワークを導入する。
我々は,Pybulletに基づくロボット操作タスクスイートを作成し,長期作業評価を行う。
論文 参考訳(メタデータ) (2023-10-03T17:59:46Z) - Foundational Policy Acquisition via Multitask Learning for Motor Skill Generation [0.9668407688201356]
本稿では,新しい運動能力を生み出すための基本方針獲得のためのマルチタスク強化学習アルゴリズムを提案する。
人間の感覚運動適応機構に触発されて,新しい運動技術を学ぶのによく用いられるエンコーダ・デコーダネットワークを訓練することを目指す。
論文 参考訳(メタデータ) (2023-08-31T05:26:14Z) - Learning Hierarchical Interactive Multi-Object Search for Mobile
Manipulation [10.21450780640562]
本稿では,ロボットが扉を開けて部屋をナビゲートし,キャビネットや引き出しの中を探索し,対象物を見つける,インタラクティブな多目的探索タスクを提案する。
これらの新たな課題は、探索されていない環境での操作とナビゲーションのスキルを組み合わせる必要がある。
本研究では,探索,ナビゲーション,操作のスキルを習得する階層的強化学習手法であるHIMOSを提案する。
論文 参考訳(メタデータ) (2023-07-12T12:25:33Z) - Augmenting Reinforcement Learning with Behavior Primitives for Diverse
Manipulation Tasks [17.13584584844048]
本研究では,MAnipulation Primitive-augmented reinforcement LEarning (MAPLE)を導入した。
我々は、プリミティブを巻き込み、それらの実行を入力パラメータでインスタンス化する階層的なポリシーを開発する。
我々は、MAPLEが、シミュレーション操作タスクのスイートにおいて、ベースラインアプローチをかなりのマージンで上回ることを示す。
論文 参考訳(メタデータ) (2021-10-07T17:44:33Z) - COG: Connecting New Skills to Past Experience with Offline Reinforcement
Learning [78.13740204156858]
我々は、動的プログラミングによって新しいスキルを拡張するために、事前データを再利用できることを示します。
我々は、新しいタスクを解決するために、以前のデータセットに見られるいくつかの動作をチェーンすることで、アプローチの有効性を実証する。
我々は、高次元画像観察を低レベルのロボット制御コマンドにマッピングし、エンドツーエンドでポリシーを訓練する。
論文 参考訳(メタデータ) (2020-10-27T17:57:29Z) - Learning compositional models of robot skills for task and motion
planning [39.36562555272779]
センサモレータプリミティブを用いて複雑な長距離操作問題を解決することを学ぶ。
能動的学習とサンプリングに最先端の手法を用いる。
我々は,選択した原始行動の質を計測することで,シミュレーションと実世界の双方でアプローチを評価する。
論文 参考訳(メタデータ) (2020-06-08T20:45:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。