論文の概要: PhysMoDPO: Physically-Plausible Humanoid Motion with Preference Optimization
- arxiv url: http://arxiv.org/abs/2603.13228v2
- Date: Mon, 16 Mar 2026 16:25:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 18:28:57.783943
- Title: PhysMoDPO: Physically-Plausible Humanoid Motion with Preference Optimization
- Title(参考訳): PhysMoDPO: 優先度最適化による物理的に証明可能なヒューマノイド運動
- Authors: Yangsong Zhang, Anujith Muraleedharan, Rikhat Akizhanov, Abdul Ahad Butt, Gül Varol, Pascal Fua, Fabio Pizzati, Ivan Laptev,
- Abstract要約: Whole-Body Controller (WBC) は拡散生成運動を実行可能な軌道に変換する。
WBC軌道は物理学に準拠するが、元の運動からはかなり逸脱する可能性がある。
直接参照最適化フレームワークであるPhysMoDPOを提案する。
PhysMoDPOは、シミュレーションにおけるゼロショットモーション転送や、G1ヒューマノイドロボットへの実環境展開に適用した場合、大幅に改善される。
- 参考スコア(独自算出の注目度): 55.25800735159481
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent progress in text-conditioned human motion generation has been largely driven by diffusion models trained on large-scale human motion data. Building on this progress, recent methods attempt to transfer such models for character animation and real robot control by applying a Whole-Body Controller (WBC) that converts diffusion-generated motions into executable trajectories. While WBC trajectories become compliant with physics, they may expose substantial deviations from original motion. To address this issue, we here propose PhysMoDPO, a Direct Preference Optimization framework. Unlike prior work that relies on hand-crafted physics-aware heuristics such as foot-sliding penalties, we integrate WBC into our training pipeline and optimize diffusion model such that the output of WBC becomes compliant both with physics and original text instructions. To train PhysMoDPO we deploy physics-based and task-specific rewards and use them to assign preference to synthesized trajectories. Our extensive experiments on text-to-motion and spatial control tasks demonstrate consistent improvements of PhysMoDPO in both physical realism and task-related metrics on simulated robots. Moreover, we demonstrate that PhysMoDPO results in significant improvements when applied to zero-shot motion transfer in simulation and for real-world deployment on a G1 humanoid robot.
- Abstract(参考訳): テキスト条件付き人の動き生成の最近の進歩は、大規模な人の動きデータに基づいて訓練された拡散モデルによって大きく推進されている。
この進歩に基づいて、近年の手法は、拡散生成運動を実行可能な軌跡に変換するWBC(Whole-Body Controller)を適用して、キャラクターアニメーションやリアルロボット制御のためのそのようなモデルを転送しようとするものである。
WBC軌道は物理学に適合するが、元の運動からはかなり逸脱する可能性がある。
この問題に対処するため、我々は直接参照最適化フレームワークであるPhysMoDPOを提案する。
WBCをトレーニングパイプラインに統合し,WBCの出力が物理と原文の両方に適合するように拡散モデルを最適化する。
PhysMoDPOのトレーニングには、物理とタスク固有の報酬をデプロイし、それらを合成された軌道に割り当てる。
テキスト・トゥ・モーション・タスクと空間制御タスクに関する広範な実験により、シミュレーションロボットにおける物理リアリズムとタスク関連メトリクスの両方において、PhysMoDPOの一貫性のある改善が示された。
さらに,PhysMoDPOは,シミュレーションにおけるゼロショットモーショントランスファーや,G1ヒューマノイドロボットへの実環境展開において,大幅な改善をもたらすことを示した。
関連論文リスト
- PhysWorld: From Real Videos to World Models of Deformable Objects via Physics-Aware Demonstration Synthesis [52.905353023326306]
物理的に妥当で多様な実演を合成し、効率的な世界モデルを学ぶためのフレームワークであるPhysWorldを提案する。
実験により、PhysWorldは、最新の最先端手法、すなわちPhysTwinよりも47倍高速な推論速度を実現しつつ、競争性能を持つことが示された。
論文 参考訳(メタデータ) (2025-10-24T13:25:39Z) - KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills [58.73043119128804]
そこで本研究では,Kungfuやダンスなどの人体動作を高度に制御することを目的とした,物理学に基づくヒューマノイド制御フレームワークを提案する。
動作処理では,運動の抽出,フィルタリング,修正,再ターゲティングを行うパイプラインを設計し,物理的制約の遵守を確実にする。
動作模倣では、二段階最適化問題を定式化し、追従精度の許容度を動的に調整する。
実験では,高ダイナミックな動作のセットを模倣するために全身制御ポリシーを訓練する。
論文 参考訳(メタデータ) (2025-06-15T13:58:53Z) - RL from Physical Feedback: Aligning Large Motion Models with Humanoid Control [32.37239524019001]
本稿では,テキスト駆動型人間動作をヒューマノイドロボットの実行可能な動作に変換することに焦点を当てた。
既存のテキスト・トゥ・モーション生成手法は、実世界の展開には適さない運動を運動的にも身体的にも生成する。
本稿では,物理認識型動作評価とテキスト条件付き動作生成を統合した新しいフレームワークである物理フィードバックからの強化学習を提案する。
論文 参考訳(メタデータ) (2025-06-15T08:39:49Z) - PhysiInter: Integrating Physical Mapping for High-Fidelity Human Interaction Generation [35.563978243352764]
人間のインタラクション生成パイプライン全体に統合された物理マッピングを導入する。
具体的には、物理に基づくシミュレーション環境での運動模倣は、ターゲットの動きを物理的に有効な空間に投影するために使用される。
実験の結果,人間の運動の質は3%~89%向上した。
論文 参考訳(メタデータ) (2025-06-09T06:04:49Z) - Morph: A Motion-free Physics Optimization Framework for Human Motion Generation [28.009524143770076]
現在の運動生成は、物理学的な制約を無視し、物理的に不可解な運動をもたらす。
雑音の多い動きデータを用いて有効な運動物理学を訓練するためのフレームワークである textbfMorph を提案する。
我々のフレームワークは、身体的可視性を大幅に向上させながら、最先端の運動品質を実現する。
論文 参考訳(メタデータ) (2024-11-22T14:09:56Z) - DiffuseBot: Breeding Soft Robots With Physics-Augmented Generative
Diffusion Models [102.13968267347553]
本稿では,様々なタスクにおいて優れたソフトロボット形態を生成する物理拡張拡散モデルであるDiffuseBotを提案する。
我々は、その能力とともに、シミュレーションされた、そして製造された様々なロボットを紹介します。
論文 参考訳(メタデータ) (2023-11-28T18:58:48Z) - PhysDiff: Physics-Guided Human Motion Diffusion Model [101.1823574561535]
既存の運動拡散モデルは、拡散過程における物理学の法則をほとんど無視する。
PhysDiffは拡散過程に物理的制約を組み込む。
提案手法は,最先端の動作品質を実現し,身体的可視性を大幅に向上させる。
論文 参考訳(メタデータ) (2022-12-05T18:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。