論文の概要: HALO:Closing Sim-to-Real Gap for Heavy-loaded Humanoid Agile Motion Skills via Differentiable Simulation
- arxiv url: http://arxiv.org/abs/2603.15084v1
- Date: Mon, 16 Mar 2026 10:38:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.856795
- Title: HALO:Closing Sim-to-Real Gap for Heavy-loaded Humanoid Agile Motion Skills via Differentiable Simulation
- Title(参考訳): HALO:Sim-to-Real Gap for Heavy-loaded Humanoid Agile Motion Skills via Differentiable Simulation
- Authors: Xingyi Wang, Chenyun Zhang, Weiji Xie, Chao Yu, Wei Song, Chenjia Bai, Shiqiang Zhu,
- Abstract要約: 微分可能シミュレータ MuJoCo XLA 上に構築した2段階勾配システム同定フレームワークを提案する。
第1段階は、実世界のデータを用いて名目ロボットモデルを校正し、本質的なシミュレートの相違を低減させる。
第2段階は、未知のペイロードの質量分布をさらに特定する。
- 参考スコア(独自算出の注目度): 22.6954724792851
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Humanoid robots deployed in real-world scenarios often need to carry unknown payloads, which introduce significant mismatch and degrade the effectiveness of simulation-to-reality reinforcement learning methods. To address this challenge, we propose a two-stage gradient-based system identification framework built on the differentiable simulator MuJoCo XLA. The first stage calibrates the nominal robot model using real-world data to reduce intrinsic sim-to-real discrepancies, while the second stage further identifies the mass distribution of the unknown payload. By explicitly reducing structured model bias prior to policy training, our approach enables zero-shot transfer of reinforcement learning policies to hardware under heavy-load conditions. Extensive simulation and real-world experiments demonstrate more precise parameter identification, improved motion tracking accuracy, and substantially enhanced agility and robustness compared to existing baselines. Project Page: https://mwondering.github.io/halo-humanoid/
- Abstract(参考訳): 実世界のシナリオに展開されるヒューマノイドロボットは、しばしば未知のペイロードを運ぶ必要がある。
この課題に対処するために,差別化可能なシミュレータ MuJoCo XLA 上に構築された2段階の勾配に基づくシステム識別フレームワークを提案する。
第1段は、実世界のデータを用いて名目ロボットモデルを校正し、本質的なシミュレートの相違を低減し、第2段はさらに未知のペイロードの質量分布を同定する。
ポリシトレーニング前に構造モデルバイアスを明示的に低減することにより,重負荷条件下でのハードウェアへの強化学習ポリシーのゼロショット転送を可能にする。
大規模なシミュレーションと実世界の実験により、より正確なパラメータ同定、モーショントラッキングの精度の向上、既存のベースラインに比べてアジリティとロバスト性を大幅に向上した。
Project Page: https://mwondering.github.io/halo- Humanoid/
関連論文リスト
- Simulation Distillation: Pretraining World Models in Simulation for Rapid Real-World Adaptation [46.80452332618188]
シミュレーション蒸留(SimDist)は、シミュレータから潜在世界モデルに構造的事前を蒸留するフレームワークである。
報酬モデルと価値モデルをシミュレーションから直接転送することで、SimDistは生の知覚から密集した計画信号を提供する。
SimDistは、データ効率、安定性、最終的なパフォーマンスにおいて、従来の方法よりも大幅に優れています。
論文 参考訳(メタデータ) (2026-03-16T18:00:23Z) - D-REX: Differentiable Real-to-Sim-to-Real Engine for Learning Dexterous Grasping [66.22412592525369]
本稿では,ガウスのSplat表現を生かした実--sim-to-realエンジンを導入し,実-sim-to-realエンジンについて述べる。
提案エンジンは, 各種物体の形状と質量値のマス識別において, 高精度かつロバストな性能を実現していることを示す。
これらの最適化された質量値は、力覚的なポリシー学習を促進し、オブジェクトの把握において優れた、高いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-03-01T15:32:04Z) - Bridging the Sim-to-Real Gap with Bayesian Inference [53.61496586090384]
データからロボットダイナミクスを学習するためのSIM-FSVGDを提案する。
我々は、ニューラルネットワークモデルのトレーニングを規則化するために、低忠実度物理プリエンスを使用します。
高性能RCレースカーシステムにおけるSIM-to-realギャップのブリッジ化におけるSIM-FSVGDの有効性を実証する。
論文 参考訳(メタデータ) (2024-03-25T11:29:32Z) - Learning Quadruped Locomotion Using Differentiable Simulation [31.80380408663424]
微分可能シミュレーションは、高速収束と安定した訓練を約束する。
本研究はこれらの課題を克服するための新しい微分可能シミュレーションフレームワークを提案する。
我々のフレームワークは並列化なしで数分で四足歩行を学習できる。
論文 参考訳(メタデータ) (2024-03-21T22:18:59Z) - Learning to navigate efficiently and precisely in real environments [14.52507964172957]
Embodied AIの文献は、HabitatやAI-Thorといったシミュレータで訓練されたエンドツーエンドエージェントに焦点を当てている。
本研究では,sim2realのギャップを最小限に抑えたシミュレーションにおけるエージェントのエンドツーエンドトレーニングについて検討する。
論文 参考訳(メタデータ) (2024-01-25T17:50:05Z) - Reinforcement Learning with Human Feedback for Realistic Traffic
Simulation [53.85002640149283]
効果的なシミュレーションの鍵となる要素は、人間の知識と整合した現実的な交通モデルの導入である。
本研究では,現実主義に対する人間の嗜好のニュアンスを捉えることと,多様な交通シミュレーションモデルを統合することの2つの主な課題を明らかにする。
論文 参考訳(メタデータ) (2023-09-01T19:29:53Z) - Residual Physics Learning and System Identification for Sim-to-real
Transfer of Policies on Buoyancy Assisted Legged Robots [14.760426243769308]
本研究では,BALLUロボットのシステム識別による制御ポリシのロバストなシミュレートを実演する。
標準的な教師あり学習の定式化に頼るのではなく、深層強化学習を利用して外部力政策を訓練する。
シミュレーショントラジェクトリと実世界のトラジェクトリを比較することで,改良されたシミュレーション忠実度を解析する。
論文 参考訳(メタデータ) (2023-03-16T18:49:05Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。