論文の概要: Meta-Reinforcement Learning for Robotic Industrial Insertion Tasks
- arxiv url: http://arxiv.org/abs/2004.14404v2
- Date: Sat, 23 May 2020 01:42:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 14:37:45.092892
- Title: Meta-Reinforcement Learning for Robotic Industrial Insertion Tasks
- Title(参考訳): ロボット産業導入作業のためのメタ強化学習
- Authors: Gerrit Schoettler, Ashvin Nair, Juan Aparicio Ojea, Sergey Levine,
Eugen Solowjow
- Abstract要約: 本研究では,メタ強化学習を用いてシミュレーションの課題の大部分を解決する方法について検討する。
エージェントを訓練して現実の挿入タスクを成功させる手法を実証する。
- 参考スコア(独自算出の注目度): 70.56451186797436
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic insertion tasks are characterized by contact and friction mechanics,
making them challenging for conventional feedback control methods due to
unmodeled physical effects. Reinforcement learning (RL) is a promising approach
for learning control policies in such settings. However, RL can be unsafe
during exploration and might require a large amount of real-world training
data, which is expensive to collect. In this paper, we study how to use
meta-reinforcement learning to solve the bulk of the problem in simulation by
solving a family of simulated industrial insertion tasks and then adapt
policies quickly in the real world. We demonstrate our approach by training an
agent to successfully perform challenging real-world insertion tasks using less
than 20 trials of real-world experience. Videos and other material are
available at https://pearl-insertion.github.io/
- Abstract(参考訳): ロボットの挿入作業は接触機構と摩擦機構が特徴であり、非モデル化された物理的効果のために従来のフィードバック制御手法では困難である。
強化学習(rl)は、このような環境で制御ポリシーを学ぶための有望なアプローチである。
しかし、RLは探査中は安全ではなく、収集に費用がかかる大量の実世界のトレーニングデータを必要とする可能性がある。
本稿では, メタ強化学習を用いて, 模擬産業挿入タスクのファミリーを解くことで, シミュレーションの課題の大部分を解決し, 実世界での政策を迅速に適応させる方法について検討する。
実世界の経験を20回未満の試行で実世界の挿入作業に挑戦するエージェントを訓練することで,我々のアプローチを実証する。
ビデオやその他の資料はhttps://pearl-insertion.github.io/で入手できる。
関連論文リスト
- REBOOT: Reuse Data for Bootstrapping Efficient Real-World Dexterous
Manipulation [61.7171775202833]
本稿では,強化学習による巧妙な操作スキルの学習を効率化するシステムを提案する。
我々のアプローチの主な考え方は、サンプル効率のRLとリプレイバッファブートストラップの最近の進歩の統合である。
本システムでは,実世界の学習サイクルを,模倣に基づくピックアップポリシを通じて学習されたリセットを組み込むことで完遂する。
論文 参考訳(メタデータ) (2023-09-06T19:05:31Z) - Accelerating Robot Learning of Contact-Rich Manipulations: A Curriculum
Learning Study [4.045850174820418]
本稿では,Domain Randomization(DR)と組み合わせたカリキュラム学習に基づく,コンタクトリッチな操作タスクのロボット学習の高速化に関する研究を行う。
挿入タスクのような位置制御ロボットによる複雑な産業組み立てタスクに対処する。
また,おもちゃのタスクを用いたシミュレーションでのみトレーニングを行う場合においても,現実のロボットに伝達可能なポリシーを学習できることが示唆された。
論文 参考訳(メタデータ) (2022-04-27T11:08:39Z) - Practical Imitation Learning in the Real World via Task Consistency Loss [18.827979446629296]
本稿では,機能レベルと行動予測レベルの両方において,シミュレートと実際のアライメントを促進する自己監督的損失を提案する。
我々は、シミュレートとリアルで遠隔操作されたデモンストレーションを16.2時間しか使っていない10のシーンで80%の成功を達成した。
論文 参考訳(メタデータ) (2022-02-03T21:43:06Z) - Accelerating Robotic Reinforcement Learning via Parameterized Action
Primitives [92.0321404272942]
強化学習は汎用ロボットシステムの構築に使用することができる。
しかし、ロボット工学の課題を解決するためにRLエージェントを訓練することは依然として困難である。
本研究では,ロボット行動プリミティブ(RAPS)のライブラリを手動で指定し,RLポリシーで学習した引数をパラメータ化する。
動作インターフェースへの簡単な変更は、学習効率とタスクパフォーマンスの両方を大幅に改善する。
論文 参考訳(メタデータ) (2021-10-28T17:59:30Z) - Robotic Surgery With Lean Reinforcement Learning [0.8258451067861933]
da vinciスキルシミュレータへの強化学習サポートの追加について述べる。
画像または状態データを使用して、シミュレータ環境でサブタスクを実行するようRLベースのエージェントに教えます。
ハイブリッドバッチ学習(HBL)と呼ばれるシンプルな実装システムを用いてRLのサンプル非効率性に取り組む。
論文 参考訳(メタデータ) (2021-05-03T16:52:26Z) - A Framework for Efficient Robotic Manipulation [79.10407063260473]
単一のロボットアームがピクセルからスパースリワード操作ポリシーを学習できることを示します。
デモは10回しかなく、単一のロボットアームがピクセルからスパースリワード操作のポリシーを学習できることを示しています。
論文 参考訳(メタデータ) (2020-12-14T22:18:39Z) - AWAC: Accelerating Online Reinforcement Learning with Offline Datasets [84.94748183816547]
提案手法は,従来の実演データとオンライン体験を組み合わせることで,スキルの素早い学習を可能にする。
以上の結果から,事前データを組み込むことで,ロボット工学を実践的な時間スケールまで学習するのに要する時間を短縮できることが示唆された。
論文 参考訳(メタデータ) (2020-06-16T17:54:41Z) - Sim2Real for Peg-Hole Insertion with Eye-in-Hand Camera [58.720142291102135]
シミュレーションを用いてペグホール挿入問題を学習し,学習したモデルを実ロボットに転送する。
本稿では,RGB-Dとジョイント情報(プロレセプション)のみを取り入れたトランスファーポリシーが,実際のロボットに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2020-05-29T05:58:54Z) - Deep Adversarial Reinforcement Learning for Object Disentangling [36.66974848126079]
本稿では, 廃棄物の密接化を図り, 対人強化学習(ARL)フレームワークを提案する。
ARLフレームワークは、元のエージェントであるプロタゴニストを挑戦する状態に操るために訓練された敵を利用する。
本手法は,ロボット制御のためのエンドツーエンドシステムを用いて,難易度の高い物体分離タスクを学習することにより,シナリオの学習からテストまでを一般化できることを示す。
論文 参考訳(メタデータ) (2020-03-08T13:20:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。