論文の概要: A Framework for Efficient Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2012.07975v1
- Date: Mon, 14 Dec 2020 22:18:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 17:01:05.904194
- Title: A Framework for Efficient Robotic Manipulation
- Title(参考訳): 効率的なロボット操作のためのフレームワーク
- Authors: Albert Zhan, Philip Zhao, Lerrel Pinto, Pieter Abbeel, Michael Laskin
- Abstract要約: 単一のロボットアームがピクセルからスパースリワード操作ポリシーを学習できることを示します。
デモは10回しかなく、単一のロボットアームがピクセルからスパースリワード操作のポリシーを学習できることを示しています。
- 参考スコア(独自算出の注目度): 79.10407063260473
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data-efficient learning of manipulation policies from visual observations is
an outstanding challenge for real-robot learning. While deep reinforcement
learning (RL) algorithms have shown success learning policies from visual
observations, they still require an impractical number of real-world data
samples to learn effective policies. However, recent advances in unsupervised
representation learning and data augmentation significantly improved the sample
efficiency of training RL policies on common simulated benchmarks. Building on
these advances, we present a Framework for Efficient Robotic Manipulation
(FERM) that utilizes data augmentation and unsupervised learning to achieve
extremely sample-efficient training of robotic manipulation policies with
sparse rewards. We show that, given only 10 demonstrations, a single robotic
arm can learn sparse-reward manipulation policies from pixels, such as
reaching, picking, moving, pulling a large object, flipping a switch, and
opening a drawer in just 15-50 minutes of real-world training time. We include
videos, code, and additional information on the project website --
https://sites.google.com/view/efficient-robotic-manipulation.
- Abstract(参考訳): データ効率のよい視覚的観察から操作ポリシーの学習は、実ロボット学習において顕著な課題である。
深層強化学習(RL)アルゴリズムは、視覚的な観察から成功した学習方針を示す一方で、効果的な政策を学ぶためには、現実のサンプルを非現実的に必要としている。
しかし、教師なし表現学習とデータ拡張の最近の進歩は、共通のシミュレーションベンチマークにおけるrlポリシーのトレーニングのサンプル効率を大幅に改善した。
これらの進歩に基づいて、データ強化と教師なし学習を利用して、疎報酬を伴うロボット操作ポリシーの極めて効率的なトレーニングを実現するための、効率的なロボット操作フレームワーク(FERM)を提案する。
わずか10回のデモで、ひとつのロボットアームが、手を伸ばし、拾い、移動し、大きな物体を引っ張り、スイッチをひっくり返し、実際のトレーニング時間に15~50分で引き出しを開くといった、スパース・リワード操作のポリシーを、ピクセルから学べることがわかった。
プロジェクトウェブサイト -https://sites.google.com/view/efficient-robotic-manipulation.com にビデオ、コード、追加情報が含まれている。
関連論文リスト
- Precise and Dexterous Robotic Manipulation via Human-in-the-Loop Reinforcement Learning [47.785786984974855]
本稿では,多種多様な操作タスクに対して印象的な性能を示す,ループ内視覚に基づくRLシステムを提案する。
提案手法では,実証と人間の修正,効率的なRLアルゴリズム,その他のシステムレベルの設計選択を統合してポリシを学習する。
提案手法は,再現学習のベースラインと先行RLアプローチを著しく上回り,成功率の平均2倍,実行速度1.8倍に向上した。
論文 参考訳(メタデータ) (2024-10-29T08:12:20Z) - Offline Imitation Learning Through Graph Search and Retrieval [57.57306578140857]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。
本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。
GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文 参考訳(メタデータ) (2024-07-22T06:12:21Z) - SERL: A Software Suite for Sample-Efficient Robotic Reinforcement
Learning [85.21378553454672]
筆者らは,報酬の計算と環境のリセットを行う手法とともに,効率的なオフ・ポリティクス・ディープ・RL法を含むライブラリを開発した。
我々は,PCBボードアセンブリ,ケーブルルーティング,オブジェクトの移動に関するポリシを,非常に効率的な学習を実現することができることを発見した。
これらの政策は完全な成功率またはほぼ完全な成功率、摂動下でさえ極端な堅牢性を実現し、突発的な堅牢性回復と修正行動を示す。
論文 参考訳(メタデータ) (2024-01-29T10:01:10Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - REBOOT: Reuse Data for Bootstrapping Efficient Real-World Dexterous
Manipulation [61.7171775202833]
本稿では,強化学習による巧妙な操作スキルの学習を効率化するシステムを提案する。
我々のアプローチの主な考え方は、サンプル効率のRLとリプレイバッファブートストラップの最近の進歩の統合である。
本システムでは,実世界の学習サイクルを,模倣に基づくピックアップポリシを通じて学習されたリセットを組み込むことで完遂する。
論文 参考訳(メタデータ) (2023-09-06T19:05:31Z) - Self-Supervised Learning of Multi-Object Keypoints for Robotic
Manipulation [8.939008609565368]
本稿では,下流政策学習におけるDense Cor correspondence pretext Taskによる画像キーポイントの学習の有効性を示す。
我々は,多様なロボット操作タスクに対するアプローチを評価し,他の視覚表現学習手法と比較し,その柔軟性と有効性を示した。
論文 参考訳(メタデータ) (2022-05-17T13:15:07Z) - Accelerating Robot Learning of Contact-Rich Manipulations: A Curriculum
Learning Study [4.045850174820418]
本稿では,Domain Randomization(DR)と組み合わせたカリキュラム学習に基づく,コンタクトリッチな操作タスクのロボット学習の高速化に関する研究を行う。
挿入タスクのような位置制御ロボットによる複雑な産業組み立てタスクに対処する。
また,おもちゃのタスクを用いたシミュレーションでのみトレーニングを行う場合においても,現実のロボットに伝達可能なポリシーを学習できることが示唆された。
論文 参考訳(メタデータ) (2022-04-27T11:08:39Z) - Efficient Robotic Manipulation Through Offline-to-Online Reinforcement
Learning and Goal-Aware State Information [5.604859261995801]
本稿では、遷移性能低下を解消するオフラインからオフラインまでの統一的なRLフレームワークを提案する。
目標認識状態情報をRLエージェントに導入することにより,タスクの複雑性を大幅に低減し,政策学習を加速することができる。
本フレームワークは,複数のロボット操作タスクにおける最先端手法と比較して,優れたトレーニング効率と性能を実現する。
論文 参考訳(メタデータ) (2021-10-21T05:34:25Z) - Visual Imitation Made Easy [102.36509665008732]
本稿では,ロボットへのデータ転送を容易にしながら,データ収集プロセスを単純化する,模倣のための代替インターフェースを提案する。
我々は、データ収集装置やロボットのエンドエフェクターとして、市販のリーチ・グラブラー補助具を使用する。
我々は,非包括的プッシュと包括的積み重ねという2つの課題について実験的に評価した。
論文 参考訳(メタデータ) (2020-08-11T17:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。