論文の概要: Deep Whole-Body Control: Learning a Unified Policy for Manipulation and
Locomotion
- arxiv url: http://arxiv.org/abs/2210.10044v1
- Date: Tue, 18 Oct 2022 17:59:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 13:10:21.923527
- Title: Deep Whole-Body Control: Learning a Unified Policy for Manipulation and
Locomotion
- Title(参考訳): 深層体制御 : 操作と移動の統一政策を学ぶ
- Authors: Zipeng Fu, Xuxin Cheng, Deepak Pathak
- Abstract要約: 装着されたアームは、移動操作タスクへの脚付きロボットの適用性を著しく向上させることができる。
このような手足のマニピュレータのための標準的な階層制御パイプラインは、コントローラを操作と移動のものと分離することである。
我々は、強化学習を用いて、足のマニピュレータの全身制御のための統一的なポリシーを学習する。
- 参考スコア(独自算出の注目度): 25.35885216505385
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An attached arm can significantly increase the applicability of legged robots
to several mobile manipulation tasks that are not possible for the wheeled or
tracked counterparts. The standard hierarchical control pipeline for such
legged manipulators is to decouple the controller into that of manipulation and
locomotion. However, this is ineffective. It requires immense engineering to
support coordination between the arm and legs, and error can propagate across
modules causing non-smooth unnatural motions. It is also biological implausible
given evidence for strong motor synergies across limbs. In this work, we
propose to learn a unified policy for whole-body control of a legged
manipulator using reinforcement learning. We propose Regularized Online
Adaptation to bridge the Sim2Real gap for high-DoF control, and Advantage
Mixing exploiting the causal dependency in the action space to overcome local
minima during training the whole-body system. We also present a simple design
for a low-cost legged manipulator, and find that our unified policy can
demonstrate dynamic and agile behaviors across several task setups. Videos are
at https://maniploco.github.io
- Abstract(参考訳): 装着されたアームは、車輪付きまたは追跡済みのロボットには不可能であるいくつかの移動操作タスクに脚付きロボットの適用性を大幅に向上させることができる。
このような脚付きマニピュレータの標準的な階層制御パイプラインは、コントローラを操作とロコモーションのものに分離する。
しかし、これは効果がない。
腕と脚の調整をサポートするために膨大なエンジニアリングが必要であり、エラーは不自然な動きを引き起こすモジュールをまたいで伝播する。
また、四肢間の強い運動シナジーの証拠が与えられれば、生物学的には不可能である。
本研究では,強化学習を用いて脚部マニピュレータの全身制御のための統一的な方針を学ぶことを提案する。
我々は,高DoF制御のためのSim2Realギャップを橋渡しする正規化オンライン適応法と,身体システム全体のトレーニング中に局所的なミニマを克服するために,アクション空間における因果依存性を利用したアドバンテージ・ミキシングを提案する。
また、低コストの脚型マニピュレータのためのシンプルな設計を示し、我々の統一ポリシーがいくつかのタスク設定で動的かつアジャイルな振る舞いを実証できることを見出します。
ビデオはhttps://maniploco.github.ioにある。
関連論文リスト
- Learning Force Control for Legged Manipulation [18.894304288225385]
本稿では,力覚へのアクセスを必要とせず,直接力制御のためのRLポリシーを訓練する方法を提案する。
腕を持つ四足ロボットの全身制御プラットフォーム上で本手法を実証する。
足のマニピュレータに学習した全身力制御を初めて導入し、より汎用的で適応可能な脚ロボットの道を歩む。
論文 参考訳(メタデータ) (2024-05-02T15:53:43Z) - Visual Whole-Body Control for Legged Loco-Manipulation [22.50054654508986]
そこで本研究では,ロボットアームを用いた移動操作の問題点について検討する。
視覚的観察により全身制御を自律的に行うことのできる枠組みを提案する。
論文 参考訳(メタデータ) (2024-03-25T17:26:08Z) - DexDribbler: Learning Dexterous Soccer Manipulation via Dynamic Supervision [26.9579556496875]
移動物体の協調操作と,サッカーなどの足による移動は,学習コミュニティにおいて目立たない注目を集める。
出力をダイナミックな関節レベル移動監視として使用し,必要な身体レベルの動きを正確に計算するフィードバック制御ブロックを提案する。
我々は,我々の学習手法が政策ネットワークをより早く収束させるだけでなく,サッカーロボットが高度な操作を行うことを可能にすることを観察した。
論文 参考訳(メタデータ) (2024-03-21T11:16:28Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。