論文の概要: RoboForge: Physically Optimized Text-guided Whole-Body Locomotion for Humanoids
- arxiv url: http://arxiv.org/abs/2603.17927v2
- Date: Thu, 19 Mar 2026 08:42:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.957145
- Title: RoboForge: Physically Optimized Text-guided Whole-Body Locomotion for Humanoids
- Title(参考訳): RoboForge: ヒューマノイドのための物理的に最適化されたテキストガイド付き全体ロコモーション
- Authors: Xichen Yuan, Zhe Li, Bofan Lyu, Kuangji Zuo, Yanshuo Lu, Gen Li, Jianfei Yang,
- Abstract要約: 自然言語と全身移動を橋渡しする統合潜在駆動型フレームワークを提案する。
我々のフレームワークは、テキスト誘導型ヒューマノイドインテリジェンスをデプロイするための実践的なパスを提供する。
- 参考スコア(独自算出の注目度): 20.796118584632904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While generative models have become effective at producing human-like motions from text, transferring these motions to humanoid robots for physical execution remains challenging. Existing pipelines are often limited by retargeting, where kinematic quality is undermined by physical infeasibility, contact-transition errors, and the high cost of real-world dynamical data. We present a unified latent-driven framework that bridges natural language and whole-body humanoid locomotion through a retarget-free, physics-optimized pipeline. Rather than treating generation and control as separate stages, our key insight is to couple them bidirectionally under physical constraints.We introduce a Physical Plausibility Optimization (PP-Opt) module as the coupling interface. In the forward direction, PP-Opt refines a teacher-student distillation policy with a plausibility-centric reward to suppress artifacts such as floating, skating, and penetration. In the backward direction, it converts reward-optimized simulation rollouts into high-quality explicit motion data, which is used to fine-tune the motion generator toward a more physically plausible latent distribution. This bidirectional design forms a self-improving cycle: the generator learns a physically grounded latent space, while the controller learns to execute latent-conditioned behaviors with dynamical integrity.Extensive experiments on the Unitree G1 humanoid show that our bidirectional optimization improves tracking accuracy and success rates. Across IsaacLab and MuJoCo, the implicit latent-driven pipeline consistently outperforms conventional explicit retargeting baselines in both precision and stability. By coupling diffusion-based motion generation with physical plausibility optimization, our framework provides a practical path toward deployable text-guided humanoid intelligence.
- Abstract(参考訳): 生成モデルはテキストから人間のような動きを生成するのに有効になっているが、これらの動きを人型ロボットに転送して物理的に実行することは依然として困難である。
既存のパイプラインはリターゲティングによって制限されることが多く、キネマティックな品質は物理的不実現性、接触遷移エラー、現実世界の動的データの高コストによって損なわれる。
本稿では,自然言語と全身のヒューマノイド移動をリターゲットフリーで物理最適化されたパイプラインを通してブリッジする潜在駆動型統合フレームワークを提案する。
生成と制御を別々の段階として扱うのではなく、物理的制約の下で双方向に結合させることが重要な洞察であり、結合インターフェースとしてPhysical Plausibility Optimization(PP-Opt)モジュールを導入する。
前向きには、PP-Optは教師の学生による蒸留政策を洗練し、確率中心の報酬で浮かび、スケート、浸透などの人工物を抑制する。
後方方向では、報酬最適化されたシミュレーションロールアウトを高品質な明示的な動きデータに変換する。
この双方向設計は自己改善サイクルを形成し、ジェネレータは物理的に接地された潜在空間を学習し、コントローラは動的整合性で潜在条件付き動作を実行することを学習する。
暗黙の潜在駆動パイプラインであるIsaacLabとMuJoCoは、精度と安定性の両面で、従来の明示的なリターゲットベースラインを上回っている。
拡散に基づく運動生成と物理可視性最適化を結合することにより、本フレームワークは、テキスト誘導型ヒューマノイドインテリジェンスをデプロイするための実践的な経路を提供する。
関連論文リスト
- PhysMoDPO: Physically-Plausible Humanoid Motion with Preference Optimization [55.25800735159481]
Whole-Body Controller (WBC) は拡散生成運動を実行可能な軌道に変換する。
WBC軌道は物理学に準拠するが、元の運動からはかなり逸脱する可能性がある。
直接参照最適化フレームワークであるPhysMoDPOを提案する。
PhysMoDPOは、シミュレーションにおけるゼロショットモーション転送や、G1ヒューマノイドロボットへの実環境展開に適用した場合、大幅に改善される。
論文 参考訳(メタデータ) (2026-03-13T17:59:59Z) - SPARK: Skeleton-Parameter Aligned Retargeting on Humanoid Robots with Kinodynamic Trajectory Optimization [9.553570391005257]
人間の動きは、汎用的なヒューマノイド制御ポリシーを訓練するための豊富な事前情報を提供するが、生のデモンストレーションはロボットの運動学や力学と相容れないことが多い。
タスク空間の人的データから自然および動的に実行可能な動作参照を生成するための2段階パイプラインを提案する。
論文 参考訳(メタデータ) (2026-03-12T03:03:14Z) - From Language to Locomotion: Retargeting-free Humanoid Control via Motion Latent Guidance [55.31807046722006]
既存の言語誘導型ヒューマノイドパイプラインは面倒で信頼できない。
本稿では,言語を基盤とした動作潜伏者に対してヒューマノイドポリシーを規定する言語フリーフレームワークであるRoboGhostを紹介する。
我々は,RoboGhostがデプロイメントの遅延を大幅に低減し,成功率と精度を向上し,スムーズでセマンティックに整合したヒューマノイドを生成することを示す。
論文 参考訳(メタデータ) (2025-10-16T17:57:47Z) - KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills [58.73043119128804]
そこで本研究では,Kungfuやダンスなどの人体動作を高度に制御することを目的とした,物理学に基づくヒューマノイド制御フレームワークを提案する。
動作処理では,運動の抽出,フィルタリング,修正,再ターゲティングを行うパイプラインを設計し,物理的制約の遵守を確実にする。
動作模倣では、二段階最適化問題を定式化し、追従精度の許容度を動的に調整する。
実験では,高ダイナミックな動作のセットを模倣するために全身制御ポリシーを訓練する。
論文 参考訳(メタデータ) (2025-06-15T13:58:53Z) - RL from Physical Feedback: Aligning Large Motion Models with Humanoid Control [32.37239524019001]
本稿では,テキスト駆動型人間動作をヒューマノイドロボットの実行可能な動作に変換することに焦点を当てた。
既存のテキスト・トゥ・モーション生成手法は、実世界の展開には適さない運動を運動的にも身体的にも生成する。
本稿では,物理認識型動作評価とテキスト条件付き動作生成を統合した新しいフレームワークである物理フィードバックからの強化学習を提案する。
論文 参考訳(メタデータ) (2025-06-15T08:39:49Z) - PhysiInter: Integrating Physical Mapping for High-Fidelity Human Interaction Generation [35.563978243352764]
人間のインタラクション生成パイプライン全体に統合された物理マッピングを導入する。
具体的には、物理に基づくシミュレーション環境での運動模倣は、ターゲットの動きを物理的に有効な空間に投影するために使用される。
実験の結果,人間の運動の質は3%~89%向上した。
論文 参考訳(メタデータ) (2025-06-09T06:04:49Z) - ReCoM: Realistic Co-Speech Motion Generation with Recurrent Embedded Transformer [58.49950218437718]
音声に同期した高忠実で一般化可能な人体動作を生成するための効率的なフレームワークであるReCoMを提案する。
Recurrent Embedded Transformer (RET)は、動的埋め込み正規化(DER)をViT(Vit)コアアーキテクチャに統合する。
モデルロバスト性を高めるため,ノイズ抵抗とクロスドメイン一般化の二重性を持つモデルに,提案したDER戦略を取り入れた。
論文 参考訳(メタデータ) (2025-03-27T16:39:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。