論文の概要: Robot Skill Adaptation via Soft Actor-Critic Gaussian Mixture Models
- arxiv url: http://arxiv.org/abs/2111.13129v1
- Date: Thu, 25 Nov 2021 15:36:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-29 16:09:16.315866
- Title: Robot Skill Adaptation via Soft Actor-Critic Gaussian Mixture Models
- Title(参考訳): ソフトアクタ-クリティックガウス混合モデルによるロボットスキル適応
- Authors: Iman Nematollahi, Erick Rosete-Beas, Adrian R\"ofer, Tim Welschehold,
Abhinav Valada, Wolfram Burgard
- Abstract要約: 現実の世界で行動する自律的エージェントにとっての中核的な課題は、その騒々しい知覚とダイナミクスに対処するために、そのスキルのレパートリーを適応させることである。
ロングホライズンタスクにスキルの学習を拡大するためには、ロボットは学習し、その後、構造化された方法でスキルを洗練する必要がある。
SAC-GMMは,動的システムを通じてロボットのスキルを学習し,学習したスキルを自身の軌道分布空間に適応させる,新しいハイブリッドアプローチである。
- 参考スコア(独自算出の注目度): 29.34375999491465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A core challenge for an autonomous agent acting in the real world is to adapt
its repertoire of skills to cope with its noisy perception and dynamics. To
scale learning of skills to long-horizon tasks, robots should be able to learn
and later refine their skills in a structured manner through trajectories
rather than making instantaneous decisions individually at each time step. To
this end, we propose the Soft Actor-Critic Gaussian Mixture Model (SAC-GMM), a
novel hybrid approach that learns robot skills through a dynamical system and
adapts the learned skills in their own trajectory distribution space through
interactions with the environment. Our approach combines classical robotics
techniques of learning from demonstration with the deep reinforcement learning
framework and exploits their complementary nature. We show that our method
utilizes sensors solely available during the execution of preliminarily learned
skills to extract relevant features that lead to faster skill refinement.
Extensive evaluations in both simulation and real-world environments
demonstrate the effectiveness of our method in refining robot skills by
leveraging physical interactions, high-dimensional sensory data, and sparse
task completion rewards. Videos, code, and pre-trained models are available at
\url{http://sac-gmm.cs.uni-freiburg.de}.
- Abstract(参考訳): 現実の世界で行動する自律的エージェントにとっての中核的な課題は、その騒々しい知覚とダイナミクスに対処するためにスキルのレパートリーを適用することである。
ロングホライズンタスクにスキルの学習を拡大するためには、ロボットは各ステップで瞬間的な決定を行うのではなく、軌跡を通じて、そのスキルを学習し、後に構造化された方法で洗練することができるべきである。
そこで本研究では,動的システムを通じてロボットのスキルを学習し,環境との相互作用を通じて学習スキルを自身の軌道分布空間に適応させるハイブリッド手法であるSoft Actor-Critic Gaussian Mixture Model (SAC-GMM)を提案する。
本手法は,実演から学習する古典的なロボット技術と深層強化学習フレームワークを組み合わせることで,その相補的性質を活用できる。
本手法は,事前学習したスキルの実行時にのみ利用可能なセンサを用いて,より高速な技術向上につながる関連特徴を抽出する。
シミュレーション環境と実環境の両方における広範囲な評価は,身体的インタラクション,高次元感覚データ,スパースタスク完了報酬を活用し,ロボットスキルの洗練に効果があることを実証する。
ビデオ、コード、事前訓練されたモデルは \url{http://sac-gmm.cs.uni-freiburg.de} で入手できる。
関連論文リスト
- RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation [68.70755196744533]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。
我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文 参考訳(メタデータ) (2023-11-02T17:59:21Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Robot Skill Generalization via Keypoint Integrated Soft Actor-Critic
Gaussian Mixture Models [21.13906762261418]
ロボット操作システムの長年の課題は、取得したモータースキルを、目に見えない環境に適応させ、一般化することだ。
我々は、模倣と強化のパラダイムを統合するハイブリッドスキルモデルを用いて、この課題に取り組む。
提案手法は,ロボットが新規環境への大幅なゼロショット一般化を実現し,目標環境におけるスキルをスクラッチから学習するよりも早く洗練することができることを示す。
論文 参考訳(メタデータ) (2023-10-23T16:03:23Z) - Dexterous Manipulation from Images: Autonomous Real-World RL via Substep
Guidance [71.36749876465618]
本稿では,ユーザが新しいタスクを定義するための"プログラミング不要"なアプローチを提供する,視覚に基づくデクスタラスな操作システムについて述べる。
本システムには,最終タスクと中間タスクを画像例で定義するためのフレームワークが組み込まれている。
実世界における多段階物体操作の4指ロボットハンドラーによる実験結果
論文 参考訳(メタデータ) (2022-12-19T22:50:40Z) - SAGCI-System: Towards Sample-Efficient, Generalizable, Compositional,
and Incremental Robot Learning [41.19148076789516]
上記の4つの要件を満たすために,SAGCIシステムと呼ばれる体系的な学習フレームワークを導入する。
本システムはまず,ロボットの手首に搭載されたカメラによって収集された生点雲を入力とし,URDFに代表される周囲環境の初期モデリングを生成する。
そのロボットは、対話的な知覚を利用して環境と対話し、URDFのオンライン検証と修正を行う。
論文 参考訳(メタデータ) (2021-11-29T16:53:49Z) - Bottom-Up Skill Discovery from Unsegmented Demonstrations for
Long-Horizon Robot Manipulation [55.31301153979621]
我々は,実世界の長距離ロボット操作作業に,スキル発見による取り組みを行う。
未解決のデモンストレーションから再利用可能なスキルのライブラリを学ぶためのボトムアップアプローチを提案する。
提案手法は,多段階操作タスクにおける最先端の模倣学習手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-09-28T16:18:54Z) - SKID RAW: Skill Discovery from Raw Trajectories [23.871402375721285]
すべてのスキルではなく、完全なタスクの実行を示すことが望ましい。
軌跡を反復パターンに分割することを同時に学習する新しい手法を提案する。
このアプローチは、スキルのシーケンスを理解するのに使用できるスキルコンディショニングを学習する。
論文 参考訳(メタデータ) (2021-03-26T17:27:13Z) - Cognitive architecture aided by working-memory for self-supervised
multi-modal humans recognition [54.749127627191655]
人間パートナーを認識する能力は、パーソナライズされた長期的な人間とロボットの相互作用を構築するための重要な社会的スキルです。
ディープラーニングネットワークは最先端の結果を達成し,そのような課題に対処するための適切なツールであることが実証された。
1つの解決策は、ロボットに自己スーパービジョンで直接の感覚データから学習させることである。
論文 参考訳(メタデータ) (2021-03-16T13:50:24Z) - Learning and Sequencing of Object-Centric Manipulation Skills for
Industrial Tasks [16.308562047398542]
本稿では,オブジェクト中心の隠れセミマルコフモデルを用いて,ロボットのスキルシーケンスを高速に符号化するアルゴリズムを提案する。
学習したスキルモデルは、多モーダルな(時間的および空間的な)軌道分布を符号化することができる。
本研究では,産業用組立作業用ロボットアーム7台について実演する。
論文 参考訳(メタデータ) (2020-08-24T14:20:05Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。