論文の概要: Learning Torque Control for Quadrupedal Locomotion
- arxiv url: http://arxiv.org/abs/2203.05194v1
- Date: Thu, 10 Mar 2022 07:09:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 15:34:55.197136
- Title: Learning Torque Control for Quadrupedal Locomotion
- Title(参考訳): 四足歩行における学習トルク制御
- Authors: Shuxiao Chen, Bike Zhang, Mark W. Mueller, Akshara Rai and Koushil
Sreenath
- Abstract要約: 本稿では,四足歩行のための学習トルク制御フレームワークを提案する。
高周波で関節トルクを直接予測するRLポリシーを訓練し、PDコントローラの使用を回避している。
我々の知る限り、これはエンドツーエンドの単一ニューラルネットワークで四足歩行のトルク制御を学習する最初の試みである。
- 参考スコア(独自算出の注目度): 22.415419916292187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning (RL) is a promising tool for developing controllers
for quadrupedal locomotion. The design of most learning-based locomotion
controllers adopts the joint position-based paradigm, wherein a low-frequency
RL policy outputs target joint positions that are then tracked by a
high-frequency proportional-derivative (PD) controller that outputs joint
torques. However, the low frequency of such a policy hinders the advancement of
highly dynamic locomotion behaviors. Moreover, determining the PD gains for
optimal tracking performance is laborious and dependent on the task at hand. In
this paper, we introduce a learning torque control framework for quadrupedal
locomotion, which trains an RL policy that directly predicts joint torques at a
high frequency, thus circumventing the use of PD controllers. We validate the
proposed framework with extensive experiments where the robot is able to both
traverse various terrains and resist external pushes, given user-specified
commands. To our knowledge, this is the first attempt of learning torque
control for quadrupedal locomotion with an end-to-end single neural network
that has led to successful real-world experiments among recent research on
learning-based quadrupedal locomotion which is mostly position-based.
- Abstract(参考訳): 強化学習(rl)は四足歩行のための制御器を開発するための有望なツールである。
ほとんどの学習ベースのロコモーションコントローラの設計は、低周波rlポリシーがターゲットジョイント位置を出力するジョイント位置に基づくパラダイムを採用し、その後、ジョイントトルクを出力する高周波比例導出(pd)コントローラによって追跡される。
しかし、そのような政策の低頻度は、非常にダイナミックな移動行動の進行を妨げる。
また、最適なトラッキング性能のためにpdゲインを決定することは手間がかかり、手元のタスクに依存する。
本稿では,四足歩行のための学習トルク制御フレームワークを提案する。このフレームワークは,関節トルクを高周波で直接予測するrlポリシーを訓練し,pdコントローラの使用を回避している。
我々は,ロボットが様々な地形を横断し,外部からのプッシュに抵抗できるような広範な実験を行い,提案手法を検証した。
我々の知る限り、これは四足歩行のトルク制御をエンドツーエンドの単一ニューラルネットワークで学習する最初の試みであり、主に位置ベースである学習に基づく四足歩行に関する最近の研究の中で、実世界の実験に成功している。
関連論文リスト
- Offline Adaptation of Quadruped Locomotion using Diffusion Models [59.882275766745295]
本稿では,複数のスキル間の相互補間と学習の限界に同時に対処する,四足歩行への拡散に基づくアプローチを提案する。
これらの機能は、マルチスキルポリシーと互換性があり、ほとんど変更することなく、最小限の計算オーバーヘッドで適用可能であることを示す。
ANYmal四重奏プラットフォーム上でのハードウェア実験によるアプローチの有効性を検証する。
論文 参考訳(メタデータ) (2024-11-13T18:12:15Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - TLControl: Trajectory and Language Control for Human Motion Synthesis [68.09806223962323]
本稿では,人間のリアルな動き合成のための新しい手法であるTLControlを提案する。
低レベルのTrajectoryと高レベルのLanguage semanticsコントロールが組み込まれている。
インタラクティブで高品質なアニメーション生成には実用的である。
論文 参考訳(メタデータ) (2023-11-28T18:54:16Z) - End-to-End Reinforcement Learning for Torque Based Variable Height
Hopping [5.34772724436823]
足の移動は自然または非構造地形を扱うのに最も適しており、多用途であることは間違いない。
本稿では,ジャンプ位相を暗黙的に検出するエンド・ツー・エンドのRL型トルクコントローラを提案する。
また、学習した制御器がリッチな動的タスクに接触できるように、シミュレーション手法を拡張し、ロボットへの展開を成功させる。
論文 参考訳(メタデータ) (2023-07-31T13:51:29Z) - Learning Low-Frequency Motion Control for Robust and Dynamic Robot
Locomotion [10.838285018473725]
実ANYmal C四重極上で8Hzの低速動作を行う学習モーションコントローラを用いて,ロバストでダイナミックな移動を実演する。
このロボットは、1.5m/sの高速度を頑健かつ反復的に達成し、不均一な地形を横切ることができ、予期せぬ外乱に抵抗することができる。
論文 参考訳(メタデータ) (2022-09-29T15:55:33Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - GLiDE: Generalizable Quadrupedal Locomotion in Diverse Environments with
a Centroidal Model [18.66472547798549]
四足歩行のロバスト制御ポリシを生成するために,遠心モデルを用いてモデルフリー強化学習を効果的に利用できることを示す。
本手法は, ステップストーン移動, 2脚のインプレースバランス, バランスビーム移動, sim-to-real移動を, さらなる適応を伴わずに実現可能であることを示す。
論文 参考訳(メタデータ) (2021-04-20T05:55:13Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Efficient Learning of Control Policies for Robust Quadruped Bounding
using Pretrained Neural Networks [15.09037992110481]
境界は, 交渉上の障害に対して, 四足歩行において重要な局面の1つである。
著者らはロバストなバウンディングゲイトをより効率的に学習できる効果的なアプローチを提案した。
著者らは、Jueying Miniの四足歩行ロボットが不均一な地形に接することによる、効率的な計算と良好な移動結果を示す。
論文 参考訳(メタデータ) (2020-11-01T08:06:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。