論文の概要: PAMD: Plausibility-Aware Motion Diffusion Model for Long Dance Generation
- arxiv url: http://arxiv.org/abs/2505.20056v1
- Date: Mon, 26 May 2025 14:44:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.521164
- Title: PAMD: Plausibility-Aware Motion Diffusion Model for Long Dance Generation
- Title(参考訳): PAMD:長期ダンス生成のための可塑性対応運動拡散モデル
- Authors: Hongsong Wang, Yin Zhu, Qiuxia Lai, Yang Zhang, Guo-Sen Xie, Xin Geng,
- Abstract要約: Plausibility-Aware Motion Diffusion (PAMD)は、音楽的に整列し、物理的に現実的なダンスを生成するためのフレームワークである。
生成時により効果的なガイダンスを提供するために、プリエント・モーション・ガイダンス(PMG)を取り入れる。
実験により、PAMDは音楽のアライメントを著しく改善し、生成した動きの物理的妥当性を高めることが示された。
- 参考スコア(独自算出の注目度): 51.2555550979386
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational dance generation is crucial in many areas, such as art, human-computer interaction, virtual reality, and digital entertainment, particularly for generating coherent and expressive long dance sequences. Diffusion-based music-to-dance generation has made significant progress, yet existing methods still struggle to produce physically plausible motions. To address this, we propose Plausibility-Aware Motion Diffusion (PAMD), a framework for generating dances that are both musically aligned and physically realistic. The core of PAMD lies in the Plausible Motion Constraint (PMC), which leverages Neural Distance Fields (NDFs) to model the actual pose manifold and guide generated motions toward a physically valid pose manifold. To provide more effective guidance during generation, we incorporate Prior Motion Guidance (PMG), which uses standing poses as auxiliary conditions alongside music features. To further enhance realism for complex movements, we introduce the Motion Refinement with Foot-ground Contact (MRFC) module, which addresses foot-skating artifacts by bridging the gap between the optimization objective in linear joint position space and the data representation in nonlinear rotation space. Extensive experiments show that PAMD significantly improves musical alignment and enhances the physical plausibility of generated motions. This project page is available at: https://mucunzhuzhu.github.io/PAMD-page/.
- Abstract(参考訳): 計算ダンス生成は、芸術、人間とコンピュータの相互作用、仮想現実、デジタルエンターテイメントなど多くの分野で重要であり、特にコヒーレントで表現力のあるロングダンスシーケンスを生成するために重要である。
拡散に基づく音楽間距離生成は大きな進歩を遂げているが、既存の手法では物理的に可算な動きを作り出すのに苦戦している。
そこで我々は,音楽的アライメントと身体的リアルなダンスを生成するためのフレームワークであるPlausibility-Aware Motion Diffusion (PAMD)を提案する。
PAMDの中核はPlausible Motion Constraint(PMC)にあり、NDF(Neural Distance Fields)を利用して実際のポーズ多様体をモデル化し、生成した動きを物理的に有効なポーズ多様体へと導く。
生成時により効果的なガイダンスを提供するため,音楽特徴と並んで立位ポーズを補助条件として利用する先行動作誘導(PMG)を取り入れた。
複雑な運動に対する現実性をさらに高めるため,線形関節位置空間における最適化目標と非線形回転空間におけるデータ表現とのギャップを埋めることで,足場接触による運動再構成(MRFC)モジュールを導入する。
広汎な実験により、PAMDは音楽のアライメントを著しく改善し、生成した動きの物理的可視性を向上することが示された。
プロジェクトページは、https://mucunzhuzhu.github.io/PAMD-page/.com/で公開されている。
関連論文リスト
- VLIPP: Towards Physically Plausible Video Generation with Vision and Language Informed Physical Prior [88.51778468222766]
近年,映像拡散モデル (VDM) が大幅に進歩し,映像のリアル化が進んでいる。
VDMは物理の理解の欠如のため、物理的にもっともらしいビデオを作ることができないことが多い。
本稿では,物理を視覚と言語に明示的に組み込んだ新しい2段階画像・映像生成フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-30T09:03:09Z) - X-Dancer: Expressive Music to Human Dance Video Generation [26.544761204917336]
X-Dancerはゼロショット音楽駆動の画像アニメーションパイプラインである。
単一の静止画像から、多種多様で長い範囲の人間のダンスビデオを生成する。
論文 参考訳(メタデータ) (2025-02-24T18:47:54Z) - InterDance:Reactive 3D Dance Generation with Realistic Duet Interactions [67.37790144477503]
動きの質、データスケール、さまざまなダンスジャンルを大幅に向上させる大規模なデュエットダンスデータセットであるInterDanceを提案する。
本稿では,対話のリアリズムを段階的に最適化するためのインタラクション改善指導戦略を備えた拡散型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-22T11:53:51Z) - Spectral Motion Alignment for Video Motion Transfer using Diffusion Models [54.32923808964701]
スペクトル運動アライメント(英: Spectral Motion Alignment、SMA)は、フーリエ変換とウェーブレット変換を用いて運動ベクトルを洗練・整列するフレームワークである。
SMAは周波数領域の正規化を取り入れて動きパターンを学習し、全体フレームのグローバルな動きのダイナミクスの学習を容易にする。
大規模な実験は、様々なビデオカスタマイズフレームワーク間の計算効率と互換性を維持しながら、モーション転送を改善するSMAの有効性を示す。
論文 参考訳(メタデータ) (2024-03-22T14:47:18Z) - Bidirectional Autoregressive Diffusion Model for Dance Generation [26.449135437337034]
本稿では,双方向自己回帰拡散モデル(BADM)を提案する。
生成したダンスが前方方向と後方方向の両方で調和することを強制するために、双方向エンコーダが構築される。
生成したダンス動作をよりスムーズにするため、局所運動強調のための局所情報デコーダを構築する。
論文 参考訳(メタデータ) (2024-02-06T19:42:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。