論文の概要: Data-Driven Physics Embedded Dynamics with Predictive Control and Reinforcement Learning for Quadrupeds
- arxiv url: http://arxiv.org/abs/2603.14333v1
- Date: Sun, 15 Mar 2026 11:52:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.754748
- Title: Data-Driven Physics Embedded Dynamics with Predictive Control and Reinforcement Learning for Quadrupeds
- Title(参考訳): 予測制御と強化学習を用いた四足歩行のためのデータ駆動物理埋め込みダイナミクス
- Authors: Prakrut Kotecha, Aditya Shirwatkar, Shishir Kolathaya,
- Abstract要約: モデル予測制御(MPC)と強化学習(RL)を統合した4次手法の現状
ラグランジアンニューラルネットワーク(LNN)をRL MPCフレームワークに統合することで、これらの問題に対処する。
サンプル効率の向上,長軸誤差の低減,非構造的ニューラルダイナミクスよりも高速なリアルタイム計画法を示す。
- 参考スコア(独自算出の注目度): 2.85987101794478
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State of the art quadrupedal locomotion approaches integrate Model Predictive Control (MPC) with Reinforcement Learning (RL), enabling complex motion capabilities with planning and terrain adaptive behaviors. However, they often face compounding errors over long horizons and have limited interpretability due to the absence of physical inductive biases. We address these issues by integrating Lagrangian Neural Networks (LNNs) into an RL MPC framework, enabling physically consistent dynamics learning. At deployment, our inverse dynamics infinite horizon MPC scheme avoids costly matrix inversions, improving computational efficiency by up to 4x with minimal loss of task performance. We validate our framework through multiple ablations of the proposed LNN and its variants. We show improved sample efficiency, reduced long-horizon error, and faster real time planning compared to unstructured neural dynamics. Lastly, we also test our framework on the Unitree Go1 robot to show real world viability.
- Abstract(参考訳): State of the art quadrupedal locomotion approachは、モデル予測制御(MPC)と強化学習(RL)を統合し、計画と地形適応行動を伴う複雑な動き機能を実現する。
しかし、長い地平線上で複雑な誤差に直面し、物理的帰納バイアスがないため、解釈可能性に制限がある。
ラグランジアンニューラルネットワーク(LNN)をRL MPCフレームワークに統合し、物理的に一貫した動的学習を可能にすることで、これらの課題に対処する。
本手法は, 計算効率を最大4倍に向上し, タスク性能の損失を最小限に抑える。
我々は,提案するLNNとその変種を複数組み合わせて検証する。
サンプル効率の向上,長軸誤差の低減,非構造的ニューラルダイナミクスよりも高速なリアルタイム計画法を示す。
最後に,Unitree Go1ロボット上で,現実の生存可能性を示すフレームワークをテストした。
関連論文リスト
- Investigating Lagrangian Neural Networks for Infinite Horizon Planning in Quadrupedal Locomotion [1.3167173258708438]
ラグランジアンニューラルネットワーク(LNN)は、帰納的バイアスを利用してシステムダイナミクスを学ぶための原則的で解釈可能なフレームワークである。
この研究は、4つの力学モデルによる四足歩行ロボットの無限水平計画のためのLNNを評価する。
実験により、LNNはサンプル効率(10倍)と予測精度(2~10倍)をベースライン法と比較して改善することが示された。
論文 参考訳(メタデータ) (2025-06-19T07:04:24Z) - PIP-Loco: A Proprioceptive Infinite Horizon Planning Framework for Quadrupedal Robot Locomotion [1.123472110161393]
四足歩行におけるモデル予測制御(MPC)の強みは、制約を強制する能力である。
自己受容型計画と強化学習(RL)を統合した枠組みを提案する。
デプロイ中、Dreamerモジュールは無限水平MPC問題を解決する。
論文 参考訳(メタデータ) (2024-09-14T13:51:37Z) - Auto-Train-Once: Controller Network Guided Automatic Network Pruning from Scratch [72.26822499434446]
オートトレインオース (Auto-Train-Once, ATO) は、DNNの計算コストと記憶コストを自動的に削減するために設計された、革新的なネットワークプルーニングアルゴリズムである。
総合的な収束解析と広範な実験を行い,本手法が様々なモデルアーキテクチャにおける最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2024-03-21T02:33:37Z) - Complex Locomotion Skill Learning via Differentiable Physics [30.868690308658174]
微分物理学は、ニューラルネットワーク(NN)コントローラの効率的な最適化を可能にする。
本稿では,複雑度と多様性を著しく向上したタスクが可能な統一NNコントローラを出力する実践的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-06T04:01:12Z) - Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文 参考訳(メタデータ) (2022-04-09T22:07:34Z) - Real-time Neural-MPC: Deep Learning Model Predictive Control for
Quadrotors and Agile Robotic Platforms [59.03426963238452]
モデル予測制御パイプライン内の動的モデルとして,大規模で複雑なニューラルネットワークアーキテクチャを効率的に統合するフレームワークであるReal-time Neural MPCを提案する。
ニューラルネットワークを使わずに、最先端のMPCアプローチと比較して、位置追跡誤差を最大82%削減することで、実世界の問題に対する我々のフレームワークの実現可能性を示す。
論文 参考訳(メタデータ) (2022-03-15T09:38:15Z) - Efficient Learning of Control Policies for Robust Quadruped Bounding
using Pretrained Neural Networks [15.09037992110481]
境界は, 交渉上の障害に対して, 四足歩行において重要な局面の1つである。
著者らはロバストなバウンディングゲイトをより効率的に学習できる効果的なアプローチを提案した。
著者らは、Jueying Miniの四足歩行ロボットが不均一な地形に接することによる、効率的な計算と良好な移動結果を示す。
論文 参考訳(メタデータ) (2020-11-01T08:06:46Z) - First Steps: Latent-Space Control with Semantic Constraints for
Quadruped Locomotion [73.37945453998134]
従来の四重化制御のアプローチでは、単純化された手作りのモデルが採用されている。
これにより、有効な運動範囲が縮小されているため、ロボットの能力が大幅に低下する。
この研究において、これらの課題は、構造化潜在空間における最適化として四重化制御をフレーミングすることによって解決される。
深い生成モデルは、実現可能な関節構成の統計的表現を捉え、一方、複雑な動的および終端的制約は高レベルな意味的指標によって表現される。
実世界とシミュレーションの両方で最適化された移動軌跡の実現可能性を検証する。
論文 参考訳(メタデータ) (2020-07-03T07:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。