論文の概要: A Physical Imitation Learning Pipeline for Energy-Efficient Quadruped Locomotion Assisted by Parallel Elastic Joint
- arxiv url: http://arxiv.org/abs/2604.00611v1
- Date: Wed, 01 Apr 2026 08:13:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.903126
- Title: A Physical Imitation Learning Pipeline for Energy-Efficient Quadruped Locomotion Assisted by Parallel Elastic Joint
- Title(参考訳): パラレル弾性継手を用いたエネルギー効率の良い四足歩行のための物理模倣学習パイプライン
- Authors: Huyue Ma, Yurui Jin, Helmut Hauser, Rui Wu,
- Abstract要約: 本稿では、強化学習(RL)制御ポリシーを物理的に実装可能な身体応答に活用する物理模倣学習(PIL)を紹介する。
その結果,PEJへのコントロールポリシの一部をアウトソーシングすることで,全体のエネルギー消費を削減した。
- 参考スコア(独自算出の注目度): 1.5385430249576606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to brain-body co-evolution, animals' intrinsic body dynamics play a crucial role in energy-efficient locomotion, which shares control effort between active muscles and passive body dynamics -- a principle known as Embodied Physical Intelligence. In contrast, robot bodies are often designed with one centralised controller that typically suppress the intrinsic body dynamics instead of exploiting it. We introduce Physical Imitation Learning (PIL), which distils a Reinforcement Learning (RL) control policy into physically implementable body responses that can be directly offloaded to passive Parallel Elastic Joints (PEJs), enabling therefore the body to imitate part of the controlled behaviour. Meanwhile, the residual policy commands the motors to recover the RL policy's performance. The results is an overall reduced energy consumption thanks to outsourcing parts of the control policy to the PEJs. Here we show in simulated quadrupeds, that our PIL approach can offloads up to 87% of mechanical power to PEJs on flat terrain and 18% on rough terrain. Because the body design is distilled from -- rather than jointly optimised with -- the control policy, PIL realises brain-body co-design without expanding the search space with body design parameters, providing a computationally efficient route to task-specific Embodied Physical Intelligence applicable to a wide range of joint-based robot morphologies.
- Abstract(参考訳): 脳と身体の共進化により、動物の内因性体動はエネルギー効率のよい移動において重要な役割を担っている。活動筋と受動体動の制御の労力を共用する。これは、身体知能(Embodied Physical Intelligence)として知られる原理だ。ロボット体は、通常、それを利用する代わりに内因性体動を抑える1つの中央制御器で設計されることが多い。強化学習(RL)制御ポリシーを、受動並列弾性関節(PEJ)に直接オフロードできる物理的に実装可能な身体反応に置き換える物理模倣学習(PIL)を導入する。これにより、身体は、制御された動作の一部を模倣することができる。一方、後続ポリシーは、RLポリシーを回復させるためにモーターを指令する。この結果、全体的なエネルギーの消費を削減し、PILの4分の1の電力を消費する。
関連論文リスト
- Scaling Whole-Body Human Musculoskeletal Behavior Emulation for Specificity and Diversity [11.002363474183683]
バイオメカニカルに接地した全身運動再生のための大規模並列筋骨格計算フレームワークを提案する。
ダンス、カートホイール、バックフリップなどの高度なダイナミックなタスクに対して、高い関節角度の精度と身体位置のアライメントを実現する。
この研究は、人間の運動の具体的制御の根底にある特異性と多様性を分析するための、抽出可能な計算経路を確立する。
論文 参考訳(メタデータ) (2026-03-31T06:55:10Z) - PhysMoDPO: Physically-Plausible Humanoid Motion with Preference Optimization [55.25800735159481]
Whole-Body Controller (WBC) は拡散生成運動を実行可能な軌道に変換する。
WBC軌道は物理学に準拠するが、元の運動からはかなり逸脱する可能性がある。
直接参照最適化フレームワークであるPhysMoDPOを提案する。
PhysMoDPOは、シミュレーションにおけるゼロショットモーション転送や、G1ヒューマノイドロボットへの実環境展開に適用した場合、大幅に改善される。
論文 参考訳(メタデータ) (2026-03-13T17:59:59Z) - HybridMimic: Hybrid RL-Centroidal Control for Humanoid Motion Mimicking [3.446278503007937]
HybridMimicは、学習ポリシーがセントロイドモデルベースのコントローラを動的に変調するフレームワークである。
最先端のRLベースラインと比較して平均ベース位置追跡誤差を13%削減する。
論文 参考訳(メタデータ) (2026-03-06T17:58:02Z) - Interaction-Aware Whole-Body Control for Compliant Object Transport [33.233203393813376]
本稿では,人工小脳として機能する対話指向型全身制御(IO-WBC)を提案する。
IO-WBCは上流(スキルレベル)のコマンドを、接触中の安定した物理的に一貫した全身動作に変換する。
論文 参考訳(メタデータ) (2026-03-04T05:50:40Z) - CHIP: Adaptive Compliance for Humanoid Control through Hindsight Perturbation [70.5382178207975]
hIsight Perturbation (CHIP)は、制御可能なエンドエフェクタ剛性を実現するプラグイン・アンド・プレイモジュールである。
CHIPの実装は簡単で、データ拡張も追加の報酬チューニングも必要ありません。
そこで本研究では,CHIPでトレーニングした汎用モーショントラッキングコントローラが,多種多様な操作タスクを実行できることを示す。
論文 参考訳(メタデータ) (2025-12-16T18:56:04Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Grow Your Limits: Continuous Improvement with Real-World RL for Robotic
Locomotion [66.69666636971922]
本稿では,ロボットの学習過程における探索を調節するポリシー正規化フレームワークであるAPRLを提案する。
APRLは四足歩行ロボットを、数分で完全に現実世界を歩けるように効率よく学習する。
論文 参考訳(メタデータ) (2023-10-26T17:51:46Z) - Low-Rank Modular Reinforcement Learning via Muscle Synergy [25.120547719120765]
モジュール強化学習(RL)は、アクチュエータごとに学習ポリシーを学習することで、多関節ロボットの制御を分散化する。
ロボット制御におけるDoFの冗長性を利用したSOLAR(Synergy-Oriented LeARning)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-26T16:01:31Z) - DMAP: a Distributed Morphological Attention Policy for Learning to
Locomote with a Changing Body [126.52031472297413]
本稿では,生物学的に着想を得たポリシーネットワークアーキテクチャであるDMAPを紹介する。
主観的状態に基づく制御ポリシは,高度に可変な身体構成では不十分であることを示す。
DMAPは、すべての考慮された環境において、全体的な一致またはオラクルエージェントのパフォーマンスを超越して、エンドツーエンドで訓練することができる。
論文 参考訳(メタデータ) (2022-09-28T16:45:35Z) - An Energy-Saving Snake Locomotion Gait Policy Using Deep Reinforcement
Learning [0.0]
この研究では、エネルギー効率の高い制御のための深層強化学習(DRL)を介してヘビの移動歩行政策を開発する。
角速度でパラメータ化された各関節モータに近位政策最適化(ppo)を適用し,drlエージェントは各時間ステップで標準サーペノイド曲線を学習する。
従来の制御戦略と比較して、訓練されたppoエージェントによって制御されたスネークロボットは、より速く動き、よりエネルギー効率の良い歩行を実現できる。
論文 参考訳(メタデータ) (2021-03-08T02:06:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。