論文の概要: A Hybrid Approach for Learning to Shift and Grasp with Elaborate Motion
Primitives
- arxiv url: http://arxiv.org/abs/2111.01510v1
- Date: Tue, 2 Nov 2021 11:29:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-03 19:13:50.523384
- Title: A Hybrid Approach for Learning to Shift and Grasp with Elaborate Motion
Primitives
- Title(参考訳): 協調動作プリミティブを用いたシフトとグレープ学習のためのハイブリッドアプローチ
- Authors: Zohar Feldman and Hanna Ziesche and Ngo Anh Vien and Dotan Di Castro
- Abstract要約: 我々は、特にビンピッキングアプリケーションに焦点をあてて、ロボットが把握できるようにする努力に貢献する。
ソフトアクター・クリティック(SAC)のハイブリッド型離散連続適応に基づく完全自己教師付き強化学習手法を提案する。
我々は,運動の押圧・把持にパラメタライズド・モーション・プリミティブを用いて,我々が考慮する困難な設定に柔軟に適応可能な動作を可能にする。
- 参考スコア(独自算出の注目度): 3.104019670546254
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many possible fields of application of robots in real world settings hinge on
the ability of robots to grasp objects. As a result, robot grasping has been an
active field of research for many years. With our publication we contribute to
the endeavor of enabling robots to grasp, with a particular focus on bin
picking applications. Bin picking is especially challenging due to the often
cluttered and unstructured arrangement of objects and the often limited
graspability of objects by simple top down grasps. To tackle these challenges,
we propose a fully self-supervised reinforcement learning approach based on a
hybrid discrete-continuous adaptation of soft actor-critic (SAC). We employ
parametrized motion primitives for pushing and grasping movements in order to
enable a flexibly adaptable behavior to the difficult setups we consider.
Furthermore, we use data augmentation to increase sample efficiency. We
demonnstrate our proposed method on challenging picking scenarios in which
planar grasp learning or action discretization methods would face a lot of
difficulties
- Abstract(参考訳): 現実世界におけるロボットの応用の多くの可能性分野は、ロボットが物体をつかむ能力にかかっている。
その結果、ロボットの把握は長年にわたって研究の活発な分野であった。
私たちの出版物では、特にビンピッキングアプリケーションに焦点をあてて、ロボットが把握できるように努力しています。
ビンピッキングは、しばしば乱雑で構造化されていないオブジェクトの配置と、単純なトップダウンによるオブジェクトの把握性が制限されるため、特に難しい。
これらの課題に対処するために,ソフトアクター・クリティック(SAC)のハイブリッド型離散連続適応に基づく完全自己教師付き強化学習手法を提案する。
パラメトリドモーションプリミティブ(parametrized motion primitives)を動作のプッシュと把持に使用することで,検討する困難な設定に対して柔軟に適応可能な動作を可能にする。
さらに,サンプル効率を向上させるためにデータ拡張を用いる。
我々は,平面把持学習や行動判別手法が多くの困難に直面するような選択シナリオに対する提案手法を実証する。
関連論文リスト
- A Meta-Engine Framework for Interleaved Task and Motion Planning using Topological Refinements [51.54559117314768]
タスク・アンド・モーション・プランニング(タスク・アンド・モーション・プランニング、TAMP)は、自動化された計画問題の解決策を見つけるための問題である。
本稿では,TAMP問題のモデル化とベンチマークを行うための,汎用的でオープンソースのフレームワークを提案する。
移動エージェントと複数のタスク状態依存障害を含むTAMP問題を解決する革新的なメタ技術を導入する。
論文 参考訳(メタデータ) (2024-08-11T14:57:57Z) - Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。
現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。
本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文 参考訳(メタデータ) (2024-07-02T21:00:30Z) - Guided Decoding for Robot On-line Motion Generation and Adaption [44.959409835754634]
本稿では,ロボットアームに高い自由度を持つ新たな動作生成手法を提案する。
本研究では,実演として使用する擬似軌道の大規模データセットに基づいて,条件付き変分オートエンコーダに基づくトランスフォーマーアーキテクチャを訓練する。
本モデルでは, 異なる初期点と目標点からの運動をうまく生成し, 異なるロボットプラットフォームを横断する複雑なタスクをナビゲートする軌道を生成可能であることを示す。
論文 参考訳(メタデータ) (2024-03-22T14:32:27Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - AlphaBlock: Embodied Finetuning for Vision-Language Reasoning in Robot
Manipulation [50.737355245505334]
本稿では,ロボット操作タスクにおける高レベル認知能力を学習するための新しいフレームワークを提案する。
得られたデータセットAlphaBlockは、多段階のテキストプランとペア観測による35の包括的なハイレベルタスクで構成されている。
論文 参考訳(メタデータ) (2023-05-30T09:54:20Z) - Active Exploration for Robotic Manipulation [40.39182660794481]
本稿では,スパース・リワード型ロボット操作作業における効率的な学習を可能にするモデルに基づく能動探索手法を提案する。
我々は,提案アルゴリズムをシミュレーションおよび実ロボットで評価し,スクラッチから本手法を訓練した。
論文 参考訳(メタデータ) (2022-10-23T18:07:51Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z) - Reward Conditioned Neural Movement Primitives for Population Based
Variational Policy Optimization [4.559353193715442]
本稿では,教師あり学習における報酬に基づく政策探索問題について考察する。
本手法は, 最先端のロボット強化学習法と比較して, 学習の進歩と, サンプル効率の大幅な向上を図っている。
論文 参考訳(メタデータ) (2020-11-09T09:53:37Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z) - Learning compositional models of robot skills for task and motion
planning [39.36562555272779]
センサモレータプリミティブを用いて複雑な長距離操作問題を解決することを学ぶ。
能動的学習とサンプリングに最先端の手法を用いる。
我々は,選択した原始行動の質を計測することで,シミュレーションと実世界の双方でアプローチを評価する。
論文 参考訳(メタデータ) (2020-06-08T20:45:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。