論文の概要: Sim-to-Real of Humanoid Locomotion Policies via Joint Torque Space Perturbation Injection
- arxiv url: http://arxiv.org/abs/2603.21853v2
- Date: Wed, 25 Mar 2026 12:06:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 14:25:25.979239
- Title: Sim-to-Real of Humanoid Locomotion Policies via Joint Torque Space Perturbation Injection
- Title(参考訳): 関節トルク空間摂動注入によるヒューマノイドロコモーション反応のシミュレート
- Authors: Junhyeok Rui Cha, Woohyun Cha, Jaeyong Shin, Donghyeon Kim, Jaeheung Park,
- Abstract要約: 提案手法は前方シミュレーション中に入力関節トルクに状態依存性の摂動を注入する。
これらの摂動は、標準パラメータのランダム化よりも幅広い現実のギャップをシミュレートするように設計されている。
- 参考スコア(独自算出の注目度): 8.888645031096754
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper proposes a novel alternative to existing sim-to-real methods for training control policies with simulated experiences. Unlike prior methods that typically rely on domain randomization over a fixed finite set of parameters, the proposed approach injects state-dependent perturbations into the input joint torque during forward simulation. These perturbations are designed to simulate a broader spectrum of reality gaps than standard parameter randomization without requiring additional training. By using neural networks as flexible perturbation generators, the proposed method can represent complex, state-dependent uncertainties, such as nonlinear actuator dynamics and contact compliance, that parametric randomization cannot capture. Experimental results demonstrate that the proposed approach enables humanoid locomotion policies to achieve superior robustness against complex, unseen reality gaps in both simulation and real-world deployment.
- Abstract(参考訳): 本稿では,既存のシミュレート・トゥ・リアル手法の代替として,シミュレートされた経験を持つ制御ポリシーの学習方法を提案する。
固定有限のパラメータ集合に対する領域ランダム化に依存する従来の手法とは異なり、提案手法は前方シミュレーション中に入力関節トルクに状態依存の摂動を注入する。
これらの摂動は、追加の訓練を必要とせず、標準パラメータのランダム化よりも幅広い現実のギャップをシミュレートするように設計されている。
ニューラルネットワークをフレキシブルな摂動発生器として使用することにより、非線形アクチュエータダイナミクスや接触コンプライアンスなど、複雑で状態に依存しない不確実性を表現することができ、パラメトリックランダム化では捕捉できない。
実験により,提案手法により,シミュレーションと実世界展開の両方において,複雑で見えない現実的ギャップに対して優れたロバスト性を実現することができることが示された。
関連論文リスト
- LoopSR: Looping Sim-and-Real for Lifelong Policy Adaptation of Legged Robots [20.715834172041763]
デプロイ後の段階において、RLポリシーを継続的に洗練する、生涯にわたるポリシー適応フレームワークであるLoopSRを提案する。
LoopSRはトランスフォーマーベースのエンコーダを使用して、現実世界の軌道を潜在空間にマッピングする。
オートエンコーダアーキテクチャとコントラスト学習手法を採用し、実世界のダイナミクスの特徴抽出を強化する。
論文 参考訳(メタデータ) (2024-09-26T16:02:25Z) - All-in-one simulation-based inference [19.41881319338419]
我々は、現在の制限を克服する新しい償却推論手法、Simformerを提案する。
Simformerは、ベンチマークタスクにおける現在の最先端の償却推論アプローチより優れています。
関数値パラメータを持つモデルに適用することができ、欠落または非構造化データによる推論シナリオを処理でき、パラメータとデータの合同分布の任意の条件をサンプリングすることができる。
論文 参考訳(メタデータ) (2024-04-15T10:12:33Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Learning non-Markovian Decision-Making from State-only Sequences [57.20193609153983]
非マルコフ決定過程(nMDP)を用いた状態のみ列のモデルに基づく模倣を開発する。
非マルコフ制約をもつ経路計画課題において提案手法の有効性を示す。
論文 参考訳(メタデータ) (2023-06-27T02:26:01Z) - Likelihood-Free Inference in State-Space Models with Unknown Dynamics [71.94716503075645]
本研究では、状態空間モデルにおいて、観測をシミュレートすることしかできず、遷移ダイナミクスが不明な潜在状態の推測と予測を行う手法を提案する。
本研究では,限られた数のシミュレーションで状態予測と状態予測を行う手法を提案する。
論文 参考訳(メタデータ) (2021-11-02T12:33:42Z) - DISCO: Double Likelihood-free Inference Stochastic Control [29.84276469617019]
確率自由推論のためのベイズ統計学における現代シミュレータのパワーと最近の技術を活用することを提案する。
シミュレーションパラメータの後方分布は、システムの潜在的非解析モデルによって伝播される。
実験により、制御器の提案により、古典的な制御やロボット工学のタスクにおいて、優れた性能と堅牢性が得られることが示された。
論文 参考訳(メタデータ) (2020-02-18T05:29:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。