論文の概要: OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation
- arxiv url: http://arxiv.org/abs/2110.00704v1
- Date: Sat, 2 Oct 2021 01:21:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-05 15:45:36.924189
- Title: OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation
- Title(参考訳): OSCAR:適応型・ロバストなロボット操作のためのデータ駆動操作空間制御
- Authors: Josiah Wong, Viktor Makoviychuk, Anima Anandkumar, Yuke Zhu
- Abstract要約: オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
- 参考スコア(独自算出の注目度): 50.59541802645156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning performant robot manipulation policies can be challenging due to
high-dimensional continuous actions and complex physics-based dynamics. This
can be alleviated through intelligent choice of action space. Operational Space
Control (OSC) has been used as an effective task-space controller for
manipulation. Nonetheless, its strength depends on the underlying modeling
fidelity, and is prone to failure when there are modeling errors. In this work,
we propose OSC for Adaptation and Robustness (OSCAR), a data-driven variant of
OSC that compensates for modeling errors by inferring relevant dynamics
parameters from online trajectories. OSCAR decomposes dynamics learning into
task-agnostic and task-specific phases, decoupling the dynamics dependencies of
the robot and the extrinsics due to its environment. This structure enables
robust zero-shot performance under out-of-distribution and rapid adaptation to
significant domain shifts through additional finetuning. We evaluate our method
on a variety of simulated manipulation problems, and find substantial
improvements over an array of controller baselines. For more results and
information, please visit https://cremebrule.github.io/oscar-web/.
- Abstract(参考訳): ロボット操作の学習は、高次元の連続動作と複雑な物理学に基づくダイナミクスのために難しい。
これはアクション空間のインテリジェントな選択によって緩和できる。
オペレーショナルスペースコントロール(osc)は、操作のための効果的なタスクスペースコントローラとして使われてきた。
それでも、その強みは基礎となるモデリングの忠実さに依存しており、モデリングエラーがある場合には失敗しがちです。
本研究はOSC for Adaptation and Robustness(OSCAR)を提案する。これはOSCのデータ駆動型であり、オンライントラジェクトリから関連する動的パラメータを推定することでエラーをモデル化する。
OSCARは、動的学習をタスク非依存とタスク固有のフェーズに分解し、ロボットの動的依存と環境による外部依存を分離する。
この構造により、アウトオブディストリビューション下でのロバストなゼロショットパフォーマンスと、追加の微調整による重要なドメインシフトへの迅速な適応が可能になる。
本手法は,様々なシミュレート操作問題に対して評価を行い,コントローラベースラインの配列よりも大幅に改善した。
詳細はhttps://cremebrule.github.io/oscar-web/を参照。
関連論文リスト
- Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Context-Conditional Navigation with a Learning-Based Terrain- and Robot-Aware Dynamics Model [11.800678688260081]
我々は,TRADYNと呼ばれる新しい確率的,地形的,ロボット対応のフォワードダイナミクスモデルを開発した。
本研究では,一輪式ロボットと空間的に異なる摩擦係数を持つ異なる地形配置を備えた2次元ナビゲーション環境において,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-07-18T12:42:59Z) - Domain Randomization for Robust, Affordable and Effective Closed-loop
Control of Soft Robots [10.977130974626668]
ソフトロボットは、コンタクトや適応性に対する本質的な安全性によって人気を集めている。
本稿では、ソフトロボットのRLポリシーを強化することにより、ドメインランダム化(DR)がこの問題を解決する方法を示す。
本稿では,変形可能なオブジェクトに対する動的パラメータの自動推論のための,従来の適応的領域ランダム化手法に対する新しいアルゴリズム拡張を提案する。
論文 参考訳(メタデータ) (2023-03-07T18:50:00Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - GEM: Group Enhanced Model for Learning Dynamical Control Systems [78.56159072162103]
サンプルベースの学習が可能な効果的なダイナミクスモデルを構築します。
リー代数ベクトル空間上のダイナミクスの学習は、直接状態遷移モデルを学ぶよりも効果的であることを示す。
この研究は、ダイナミクスの学習とリー群の性質の関連性を明らかにし、新たな研究の方向への扉を開く。
論文 参考訳(メタデータ) (2021-04-07T01:08:18Z) - Meta-Reinforcement Learning for Adaptive Motor Control in Changing Robot
Dynamics and Environments [3.5309638744466167]
この研究は、ロバストな移動のための異なる条件に制御ポリシーを適応させるメタラーニングアプローチを開発した。
提案手法は, インタラクションモデルを更新し, 推定された状態-作用軌道のアクションをサンプル化し, 最適なアクションを適用し, 報酬を最大化する。
論文 参考訳(メタデータ) (2021-01-19T12:57:12Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Smooth Exploration for Robotic Reinforcement Learning [11.215352918313577]
強化学習(Reinforcement Learning, RL)は、ロボットが現実世界との対話からスキルを学ぶことを可能にする。
実際には、Deep RLで使用される非構造的なステップベースの探索は、実際のロボットにジャーキーな動きパターンをもたらす。
本稿では、状態依存探索(SDE)を現在のDeep RLアルゴリズムに適応させることにより、これらの問題に対処する。
論文 参考訳(メタデータ) (2020-05-12T12:28:25Z) - Model-Based Meta-Reinforcement Learning for Flight with Suspended
Payloads [69.21503033239985]
吊り下げられたペイロードの輸送は、自律的な航空車両にとって困難である。
接続後飛行データから数秒以内に変化力学のモデルを学習するメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2020-04-23T17:43:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。