論文の概要: General Humanoid Whole-Body Control via Pretraining and Fast Adaptation
- arxiv url: http://arxiv.org/abs/2602.11929v1
- Date: Thu, 12 Feb 2026 13:26:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.395618
- Title: General Humanoid Whole-Body Control via Pretraining and Fast Adaptation
- Title(参考訳): 事前学習と適応による一般ヒューマノイド全体制御
- Authors: Zepeng Wang, Jiangxing Wang, Shiqing Yao, Yu Zhang, Ziluo Ding, Ming Yang, Yuxuan Wang, Haobin Jiang, Chao Ma, Xiaochuan Shi, Zongqing Lu,
- Abstract要約: 本稿では,FAST(Fast Adaptation and Staable Motion Tracking)とFAST(Fast Adaptation and Staable Motion Tracking)を併用した汎用ヒューマノイド全身制御フレームワーク)を提案する。
FASTはParseval-Guided Residual Policy AdaptationとCenter-of-Mass-Aware Controlを導入した。
シミュレーションと実世界の展開の実験では、FASTはロバスト性、適応効率、一般化において、最先端のベースラインを一貫して上回っている。
- 参考スコア(独自算出の注目度): 36.02965821695238
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning a general whole-body controller for humanoid robots remains challenging due to the diversity of motion distributions, the difficulty of fast adaptation, and the need for robust balance in high-dynamic scenarios. Existing approaches often require task-specific training or suffer from performance degradation when adapting to new motions. In this paper, we present FAST, a general humanoid whole-body control framework that enables Fast Adaptation and Stable Motion Tracking. FAST introduces Parseval-Guided Residual Policy Adaptation, which learns a lightweight delta action policy under orthogonality and KL constraints, enabling efficient adaptation to out-of-distribution motions while mitigating catastrophic forgetting. To further improve physical robustness, we propose Center-of-Mass-Aware Control, which incorporates CoM-related observations and objectives to enhance balance when tracking challenging reference motions. Extensive experiments in simulation and real-world deployment demonstrate that FAST consistently outperforms state-of-the-art baselines in robustness, adaptation efficiency, and generalization.
- Abstract(参考訳): ヒューマノイドロボットのための一般的な全身制御系を学習することは、運動分布の多様性、高速適応の難しさ、高ダイナミックなシナリオにおける堅牢なバランスの必要性により、依然として困難である。
既存のアプローチでは、しばしばタスク固有のトレーニングを必要としたり、新しい動きに適応する際にパフォーマンス劣化に悩まされる。
本稿では,高速適応と安定動作追跡を可能にする汎用ヒューマノイド全体制御フレームワークであるFASTを提案する。
FASTはParseval-Guided Residual Policy Adaptationを導入し、直交性とKL制約の下で軽量なデルタアクションポリシーを学習し、破滅的な忘れを軽減しつつ、配布外動作への効率的な適応を可能にする。
本研究では,CoM関連観測を取り入れたCenter-of-Mass-Aware Controlを提案する。
シミュレーションと実世界の展開における大規模な実験により、FASTはロバスト性、適応効率、一般化において最先端のベースラインを一貫して上回っていることが示された。
関連論文リスト
- HybridMimic: Hybrid RL-Centroidal Control for Humanoid Motion Mimicking [3.446278503007937]
HybridMimicは、学習ポリシーがセントロイドモデルベースのコントローラを動的に変調するフレームワークである。
最先端のRLベースラインと比較して平均ベース位置追跡誤差を13%削減する。
論文 参考訳(メタデータ) (2026-03-06T17:58:02Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - CHIP: Adaptive Compliance for Humanoid Control through Hindsight Perturbation [70.5382178207975]
hIsight Perturbation (CHIP)は、制御可能なエンドエフェクタ剛性を実現するプラグイン・アンド・プレイモジュールである。
CHIPの実装は簡単で、データ拡張も追加の報酬チューニングも必要ありません。
そこで本研究では,CHIPでトレーニングした汎用モーショントラッキングコントローラが,多種多様な操作タスクを実行できることを示す。
論文 参考訳(メタデータ) (2025-12-16T18:56:04Z) - Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.8665000676562]
従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。
データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。
本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文 参考訳(メタデータ) (2025-05-23T03:28:25Z) - World Models as Reference Trajectories for Rapid Motor Adaptation [0.0]
リフレクティブ・ワールド・モデル(Reflexive World Models、RWM)は、世界モデル予測を暗黙の基準軌跡として使用し、迅速な適応を行うための二重制御フレームワークである。
本手法は、強化学習とロバストモータ実行により、制御問題を長期報酬に分離する。
論文 参考訳(メタデータ) (2025-05-21T14:46:41Z) - SATA: Safe and Adaptive Torque-Based Locomotion Policies Inspired by Animal Learning [10.138425472807368]
SATAは、動物の移動で観察される重要な生体力学的原理と適応学習機構を模倣する生体に触発されたフレームワークである。
本手法は,早期探索を著しく改善し,トルクベースの政策を学習する上での課題を効果的に解決する。
実験結果から,SATAは,挑戦的環境においても,顕著なコンプライアンスと安全性を示すことが明らかとなった。
論文 参考訳(メタデータ) (2025-02-18T09:25:37Z) - Adaptive Inertia: Disentangling the Effects of Adaptive Learning Rate
and Momentum [97.84312669132716]
我々は,アダム力学の適応学習率とモメンタムがサドルポイントエスケープおよびフラットミニマ選択に与える影響を解消する。
提案手法は,SGD法や従来の適応勾配法よりも大幅に一般化可能であることを示す。
論文 参考訳(メタデータ) (2020-06-29T05:21:02Z) - Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。
このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-01T05:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。