論文の概要: HiWET: Hierarchical World-Frame End-Effector Tracking for Long-Horizon Humanoid Loco-Manipulation
- arxiv url: http://arxiv.org/abs/2602.06341v1
- Date: Fri, 06 Feb 2026 03:11:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.219373
- Title: HiWET: Hierarchical World-Frame End-Effector Tracking for Long-Horizon Humanoid Loco-Manipulation
- Title(参考訳): HiWET: 長軸ヒューマノイドロコマニピュレーションのための階層的世界フレームエンドエフェクタトラッキング
- Authors: Zhanxiang Cao, Liyun Yan, Yang Zhang, Sirui Chen, Jianming Ma, Tianyue Zhan, Shengcheng Fu, Yufei Jia, Cewu Lu, Yue Gao,
- Abstract要約: 我々は、ヒューマノイドのロコ操作におけるエンドエフェクタトラッキングとしてこの問題を再考する。
動的実行からグローバルな推論を分離する階層的強化学習フレームワークであるHiWETを提案する。
我々は,HuWETが長期のワールドフレームタスクにおいて,高精度かつ安定したエンドエフェクタトラッキングを実現することを示す。
- 参考スコア(独自算出の注目度): 43.43128572722804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humanoid loco-manipulation requires executing precise manipulation tasks while maintaining dynamic stability amid base motion and impacts. Existing approaches typically formulate commands in body-centric frames, fail to inherently correct cumulative world-frame drift induced by legged locomotion. We reformulate the problem as world-frame end-effector tracking and propose HiWET, a hierarchical reinforcement learning framework that decouples global reasoning from dynamic execution. The high-level policy generates subgoals that jointly optimize end-effector accuracy and base positioning in the world frame, while the low-level policy executes these commands under stability constraints. We introduce a Kinematic Manifold Prior (KMP) that embeds the manipulation manifold into the action space via residual learning, reducing exploration dimensionality and mitigating kinematically invalid behaviors. Extensive simulation and ablation studies demonstrate that HiWET achieves precise and stable end-effector tracking in long-horizon world-frame tasks. We validate zero-shot sim-to-real transfer of the low-level policy on a physical humanoid, demonstrating stable locomotion under diverse manipulation commands. These results indicate that explicit world-frame reasoning combined with hierarchical control provides an effective and scalable solution for long-horizon humanoid loco-manipulation.
- Abstract(参考訳): ヒューマノイド・ロコ・マニピュレーションは、基礎運動と衝撃の中で動的安定性を維持しながら、正確な操作タスクを実行する必要がある。
既存のアプローチは通常、体中心のフレームでコマンドを定式化するが、足の移動によって引き起こされる累積的な世界フレームのドリフトを本質的に補正することができない。
本研究では,グローバルな推論を動的実行から切り離す階層的な強化学習フレームワークであるHiWETを提案する。
高レベルポリシーは、世界のフレームにおけるエンドエフェクタの精度とベース位置を共同で最適化するサブゴールを生成し、低レベルポリシーは安定性の制約の下でこれらのコマンドを実行する。
KMP(Kinematic Manifold Prior)を導入し、操作多様体を残留学習により動作空間に埋め込み、探索次元を減らし、運動論的に無効な振る舞いを緩和する。
大規模なシミュレーションとアブレーション研究により、HiWETは長距離世界フレームタスクにおいて高精度で安定したエンドエフェクタトラッキングを実現することが示された。
低レベルのポリシーを物理的ヒューマノイド上でゼロショット・シム・トゥ・リアルに転送し、多様な操作コマンドの下で安定な移動を示す。
これらの結果から, 階層制御を併用した明示的世界枠推論が, 長軸ヒューマノイドのロコ操作に有効かつスケーラブルな解をもたらすことが示唆された。
関連論文リスト
- REFINE-DP: Diffusion Policy Fine-tuning for Humanoid Loco-manipulation via Reinforcement Learning [23.094280494500214]
本稿では,DP高レベルプランナとRLに基づく低レベルロコ操作制御を協調的に最適化する階層型フレームワークであるREFINE-DPを提案する。
REFINE-DPは、事前訓練されたデータに見られない配布外ケースであっても、シミュレーションで90%以上の成功率を達成する。
論文 参考訳(メタデータ) (2026-03-14T02:21:19Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - CLOT: Closed-Loop Global Motion Tracking for Whole-Body Humanoid Teleoperation [54.7399209456857]
閉ループグローバルモーショントラッキングを実現する,リアルタイムな人型遠隔操作システムCLOTを提案する。
CLOTはオペレータとロボットのポーズをクローズドループで同期させ、長時間のタイムホライズン上でドリフトフリーな人間-人間-ヒューマノイドの模倣を可能にする。
本研究では,報奨評価から観測軌道を分離し,スムーズで安定した大域的補正を可能にするデータ駆動ランダム化手法を提案する。
論文 参考訳(メタデータ) (2026-02-13T12:03:13Z) - HAIC: Humanoid Agile Object Interaction Control via Dynamics-Aware World Model [56.4392302336014]
本稿では,外部状態推定を伴わない多種多様なオブジェクトダイナミクス間のロバストな相互作用のためのフレームワークであるHAICを提案する。
我々の重要な貢献は、主観的歴史のみから高次対象状態(速度、加速度)を推定するダイナミクス予測器である。
ヒューマノイドロボットの実験では、HAICはアジャイルタスクで高い成功率を達成する。
論文 参考訳(メタデータ) (2026-02-12T09:34:35Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。