論文の概要: Dynamics Aware Quadrupedal Locomotion via Intrinsic Dynamics Head
- arxiv url: http://arxiv.org/abs/2605.01227v1
- Date: Sat, 02 May 2026 03:50:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.652112
- Title: Dynamics Aware Quadrupedal Locomotion via Intrinsic Dynamics Head
- Title(参考訳): 内因性ダイナミクスヘッドによる四足歩行のダイナミクス
- Authors: Aman Arora, Nalini Ratha,
- Abstract要約: 本研究では,制御政策が物理力学の理解と推論を可能にする四足歩行訓練フレームワークを提案する。
シミュレーションでは,制御ポリシとともに状態とトルクのダイナミクスを学習する内在的ダイナミクス(ID)ヘッドを同時に訓練する。
この機構は, より効率的でスムーズなポリシーを導出し, 四足歩行報酬を多岐にわたる標準的四足歩行報酬にまたがる収束を促進させることを示す。
- 参考スコア(独自算出の注目度): 0.5672132510411465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quadrupedal locomotion plays a critical role in enabling agile, versatile movement across complex terrains. Understanding and estimating the underlying physical dynamics are essential for achieving efficient and stable quadrupedal locomotion. We propose a novel training framework for quadrupedal locomotion that enables the Control Policy to understand and reason about physical dynamics. In simulation, we concurrently train an Intrinsic Dynamics (ID) Head that learns state-to-torque dynamics alongside the Control Policy, and we define a dynamics reward enabled by the ID Head that encourages the Policy toward more predictable dynamical behavior. We also provide a mechanism to tune the learned dynamics in the resulting Policy by controlling the training coefficients of the ID Head. Our simulation experiments show that this mechanism drives convergence to better optima across a wide range of standard quadrupedal locomotion rewards, yielding more efficient and smoother policies. Our real-robot experiments demonstrate sim-to-real transfer of these improvements, with significant gains in torque efficiency (16.8%), action rate (18.6%), and mechanical power (12.8%), while improving safe torque occupancy by 6.4%.
- Abstract(参考訳): 四足歩行は、複雑な地形を横断するアジャイルで多目的な運動を可能にする上で重要な役割を担っている。
基礎となる物理力学の理解と推定は、効率的で安定した四足歩行を実現するために不可欠である。
本研究では,制御政策が物理力学の理解と推論を可能にする,四足歩行のための新しいトレーニングフレームワークを提案する。
シミュレーションでは,制御ポリシとともに状態とトルクのダイナミクスを学習する内在的ダイナミクス(ID)ヘッドを同時に訓練し,より予測可能な動的行動に向けてポリシーを奨励するIDヘッドによって実現される動的報酬を定義する。
また,IDヘッドのトレーニング係数を制御し,学習した力学を学習ポリシーで調整する機構も提供する。
シミュレーション実験により, この機構は, より効率よく, よりスムーズなポリシーを導出し, 四足歩行の報奨を多岐にわたって, より優れた最適化に導いてくれることが示された。
我々の実ロボット実験は、トルク効率(16.8%)、アクションレート(18.6%)、メカニカルパワー(12.8%)の大幅な向上とともに、安全トルク占有率を6.4%向上させながら、これらの改善をシミュレート・トゥ・リアルに伝達することを示した。
関連論文リスト
- Articulated-Body Dynamics Network: Dynamics-Grounded Prior for Robot Learning [14.046146512352315]
本稿では,フォワードダイナミクスの計算構造を基盤とした新しいグラフニューラルネットワークアーキテクチャであるArticulated-Body Dynamics Network (ABD-Net)を提案する。
提案手法は, 変圧器ベースラインやGNNベースラインと比較して, サンプル効率の向上と動的シフトへの一般化を示す。
さらに、実際のUnitree G1およびGo2ロボット、最先端のヒューマノイド、四足歩行プラットフォームに関する学習ポリシーを検証する。
論文 参考訳(メタデータ) (2026-03-19T16:06:49Z) - X-Loco: Towards Generalist Humanoid Locomotion Control via Synergetic Policy Distillation [50.0220259870317]
X-Locoは、視覚に基づく一般人型ロコモーションポリシーを訓練するためのフレームワークである。
X-ロコは複数のオラクル・スペシャリスト・ポリシーを訓練し、ケース・アダプティブ・スペシャリストの選択機構を備えたシナジー・ポリシー・蒸留を採用する。
この設計により、学生は広い範囲の運動能力を得ることができる。
論文 参考訳(メタデータ) (2026-03-04T05:07:05Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Exploring Model Transferability through the Lens of Potential Energy [78.60851825944212]
トランスファーラーニングは、事前訓練されたディープラーニングモデルが広く利用可能であることから、コンピュータビジョンタスクにおいて重要になっている。
既存のトレーニング済みモデルの転送可能性の測定方法は、符号化された静的特徴とタスクラベルの間の統計的相関に依存する。
我々はこれらの課題に対処するために,PEDという物理に着想を得たアプローチを提案する。
論文 参考訳(メタデータ) (2023-08-29T07:15:57Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Learning Low-Frequency Motion Control for Robust and Dynamic Robot
Locomotion [10.838285018473725]
実ANYmal C四重極上で8Hzの低速動作を行う学習モーションコントローラを用いて,ロバストでダイナミックな移動を実演する。
このロボットは、1.5m/sの高速度を頑健かつ反復的に達成し、不均一な地形を横切ることができ、予期せぬ外乱に抵抗することができる。
論文 参考訳(メタデータ) (2022-09-29T15:55:33Z) - Learning to Exploit Elastic Actuators for Quadruped Locomotion [7.9585932082270014]
足の移動におけるスプリングベースのアクチュエータは、エネルギー効率と性能の向上を提供するが、コントローラ設計の難しさは増す。
実ロボットでモデルフリーのコントローラを直接学習することを提案する。
提案手法をDLR弾性四重項ベルトに適用した。
論文 参考訳(メタデータ) (2022-09-15T09:43:17Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。