論文の概要: Heracles: Bridging Precise Tracking and Generative Synthesis for General Humanoid Control
- arxiv url: http://arxiv.org/abs/2603.27756v2
- Date: Tue, 31 Mar 2026 07:05:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:02.36282
- Title: Heracles: Bridging Precise Tracking and Generative Synthesis for General Humanoid Control
- Title(参考訳): Heracles: 汎用ヒューマノイド制御のためのブリッジング精密追跡と生成合成
- Authors: Zelin Tao, Zeran Su, Peiran Liu, Jingkai Sun, Wenqiang Que, Jiahao Ma, Jialin Yu, Jiahang Cao, Pihai Sun, Hao Liang, Gang Han, Wen Zhao, Zhiyuan Xu, Jian Tang, Qiang Zhang, Yijie Guo,
- Abstract要約: 現在の一般的な制御装置は、厳格な基準追従問題としてモーションコントロールを定式化している。
ヘラクレスは、正確な運動追跡と生成合成を橋渡しする新しい状態条件拡散である。
本フレームワークは, 生成前兆を制御ループに組み込むことで, 極端な摂動に対するロバスト性を大幅に向上させることを示す。
- 参考スコア(独自算出の注目度): 35.756113194514974
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Achieving general-purpose humanoid control requires a delicate balance between the precise execution of commanded motions and the flexible, anthropomorphic adaptability needed to recover from unpredictable environmental perturbations. Current general controllers predominantly formulate motion control as a rigid reference-tracking problem. While effective in nominal conditions, these trackers often exhibit brittle, non-anthropomorphic failure modes under severe disturbances, lacking the generative adaptability inherent to human motor control. To overcome this limitation, we propose Heracles, a novel state-conditioned diffusion middleware that bridges precise motion tracking and generative synthesis. Rather than relying on rigid tracking paradigms or complex explicit mode-switching, Heracles operates as an intermediary layer between high-level reference motions and low-level physics trackers. By conditioning on the robot's real-time state, the diffusion model implicitly adapts its behavior: it approximates an identity map when the state closely aligns with the reference, preserving zero-shot tracking fidelity. Conversely, when encountering significant state deviations, it seamlessly transitions into a generative synthesizer to produce natural, anthropomorphic recovery trajectories. Our framework demonstrates that integrating generative priors into the control loop not only significantly enhances robustness against extreme perturbations but also elevates humanoid control from a rigid tracking paradigm to an open-ended, generative general-purpose architecture.
- Abstract(参考訳): 汎用的なヒューマノイド制御を実現するには、指示運動の正確な実行と予測不可能な環境摂動から回復するために必要な柔軟で人為的適応性との微妙なバランスが必要である。
現在の一般的な制御装置は、厳格な基準追従問題としてモーションコントロールを定式化している。
名目上の条件では有効であるが、これらのトラッカーは深刻な障害の下で脆弱で非人為的障害モードを示すことが多く、ヒトの運動制御に固有の生成的適応性は欠如している。
この制限を克服するため,我々は,高精度なモーショントラッキングと生成合成を橋渡しする新しい状態条件拡散ミドルウェアHeraclesを提案する。
厳格な追跡パラダイムや複雑な明示的なモードスイッチングに頼るのではなく、ヘラクレスは高レベルの参照モーションと低レベルの物理トラッカーの間の中間層として機能する。
ロボットのリアルタイム状態を条件付けすることで、拡散モデルはその振る舞いを暗黙的に適応させる。
逆に、大きな状態ずれに遭遇すると、生成合成器にシームレスに遷移し、自然で人為的な回復軌道を生成する。
本フレームワークは, 生成前処理を制御ループに組み込むことで, 極端な摂動に対する堅牢性を高めるだけでなく, 厳密な追跡パラダイムから開放的で汎用的なアーキテクチャへのヒューマノイド制御を向上することを示す。
関連論文リスト
- RoboForge: Physically Optimized Text-guided Whole-Body Locomotion for Humanoids [20.796118584632904]
自然言語と全身移動を橋渡しする統合潜在駆動型フレームワークを提案する。
我々のフレームワークは、テキスト誘導型ヒューマノイドインテリジェンスをデプロイするための実践的なパスを提供する。
論文 参考訳(メタデータ) (2026-03-18T17:02:56Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - OmniTrack: General Motion Tracking via Physics-Consistent Reference [54.256312586493415]
OmniTrackは、一般的なモーショントラッキングから物理的実現可能性を明確に分離する一般的なトラッキングフレームワークである。
実験により、OmniTrackは追跡精度を向上し、目に見えない動きに対して強力な一般化を示すことが示された。
実世界のテストでは、OmniTrackは、フリップやカートホイールのような複雑なアクロバティックな動きを含む、1時間の長さ、一貫性、安定したトラッキングを実現している。
論文 参考訳(メタデータ) (2026-02-27T09:12:15Z) - Robust and Generalized Humanoid Motion Tracking [17.58241987932198]
一般的なヒューマノイド全体制御器の学習は、ロボット領域に移動された後、実用的な参照動作がノイズや不整合を示す可能性があるため、困難である。
本稿では,因果的時間的エンコーダを用いた動的条件付きコマンドアグリゲーションフレームワークの提案と,コンテキストウィンドウを選択的に集約するマルチヘッド・クロスアテンション・コマンドエンコーダを提案する。
提案手法は多種多様な参照入力と挑戦的な動作条件の下で評価され,無見えない動作へのゼロショット転送と,物理的ヒューマノイドロボットへのロバストなシミュレート・トゥ・リアル転送が実証された。
論文 参考訳(メタデータ) (2026-01-30T15:27:43Z) - AdaMorph: Unified Motion Retargeting via Embodiment-Aware Adaptive Transformers [49.796014934503184]
本研究では、単一モデルで多様なロボット形態に人間の動きを適応させることができる統一型ニューラルネットワークフレームワークを提案する。
12個の異なるヒューマノイドロボットの実験結果から、AdaMorphが異種トポロジにわたって効果的に制御できることが示されている。
論文 参考訳(メタデータ) (2026-01-12T07:39:38Z) - AERMANI-Diffusion: Regime-Conditioned Diffusion for Dynamics Learning in Aerial Manipulators [2.376629619475859]
空力マニピュレータは、慣性結合力と空力の迅速かつ構成に依存した変化を行う。
条件付き拡散プロセスと軽量時間エンコーダを用いて残留力の完全な分布をモデル化する状態条件拡散フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-11T16:10:32Z) - From Language to Locomotion: Retargeting-free Humanoid Control via Motion Latent Guidance [55.31807046722006]
既存の言語誘導型ヒューマノイドパイプラインは面倒で信頼できない。
本稿では,言語を基盤とした動作潜伏者に対してヒューマノイドポリシーを規定する言語フリーフレームワークであるRoboGhostを紹介する。
我々は,RoboGhostがデプロイメントの遅延を大幅に低減し,成功率と精度を向上し,スムーズでセマンティックに整合したヒューマノイドを生成することを示す。
論文 参考訳(メタデータ) (2025-10-16T17:57:47Z) - BoDiffusion: Diffusing Sparse Observations for Full-Body Human Motion
Synthesis [14.331548412833513]
複合現実感アプリケーションは、没入感のある体験を可能にするために、ユーザのフルボディの動きを追跡する必要がある。
本稿では,この非拘束的再構成問題に対処するために,運動合成のための生成拡散モデルであるBoDiffusionを提案する。
本稿では,スムーズで現実的なフルボディモーションシーケンスを生成しつつ,スパーストラッキング入力をBoDiffusionが活用できる時間空間調和方式を提案する。
論文 参考訳(メタデータ) (2023-04-21T16:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。