論文の概要: MotionWavelet: Human Motion Prediction via Wavelet Manifold Learning
- arxiv url: http://arxiv.org/abs/2411.16964v2
- Date: Wed, 27 Nov 2024 01:55:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-28 15:25:13.716916
- Title: MotionWavelet: Human Motion Prediction via Wavelet Manifold Learning
- Title(参考訳): Motion Wavelet: Wavelet Manifold Learningによる人間の動作予測
- Authors: Yuming Feng, Zhiyang Dou, Ling-Hao Chen, Yuan Liu, Tianyu Li, Jingbo Wang, Zeyu Cao, Wenping Wang, Taku Komura, Lingjie Liu,
- Abstract要約: MotionWaveletは、空間周波数領域における人間の動きパターンを研究する人間の動き予測フレームワークである。
ウェーブレット拡散モデルでは、動作データにウェーブレット変換を適用することでウェーブレット多様体を学習する。
ウェーブレット空間形状誘導機構は、デノナイジングプロセスを洗練し、多様体構造との整合性を改善する。
- 参考スコア(独自算出の注目度): 57.078168638373874
- License:
- Abstract: Modeling temporal characteristics and the non-stationary dynamics of body movement plays a significant role in predicting human future motions. However, it is challenging to capture these features due to the subtle transitions involved in the complex human motions. This paper introduces MotionWavelet, a human motion prediction framework that utilizes Wavelet Transformation and studies human motion patterns in the spatial-frequency domain. In MotionWavelet, a Wavelet Diffusion Model (WDM) learns a Wavelet Manifold by applying Wavelet Transformation on the motion data therefore encoding the intricate spatial and temporal motion patterns. Once the Wavelet Manifold is built, WDM trains a diffusion model to generate human motions from Wavelet latent vectors. In addition to the WDM, MotionWavelet also presents a Wavelet Space Shaping Guidance mechanism to refine the denoising process to improve conformity with the manifold structure. WDM also develops Temporal Attention-Based Guidance to enhance prediction accuracy. Extensive experiments validate the effectiveness of MotionWavelet, demonstrating improved prediction accuracy and enhanced generalization across various benchmarks. Our code and models will be released upon acceptance.
- Abstract(参考訳): 身体運動の時間的特性と非定常ダイナミクスをモデル化することは、人間の将来の動きを予測する上で重要な役割を果たす。
しかし、複雑な人間の動きにまつわる微妙な変化のため、これらの特徴を捉えることは困難である。
本稿では、ウェーブレット変換を利用した人間の動き予測フレームワークであるMotionWaveletを紹介し、空間周波数領域における人間の動きパターンを研究する。
Motion Waveletにおいて、ウェーブレット拡散モデル(WDM)は、ウェーブレット変換を動作データに適用することによりウェーブレットマニフォールドを学習し、複雑な空間的および時間的動きパターンを符号化する。
ウェーブレット・マニフォールドが構築されると、WDMは拡散モデルを訓練し、ウェーブレット潜在ベクトルから人間の動きを生成する。
WDMに加えて、モーションウェーブレットにはウェーブレット空間形状誘導機構があり、デノナイジングプロセスを洗練し、多様体構造との整合性を改善する。
WDMはまた、予測精度を高めるための時間的注意に基づくガイダンスも開発した。
広範囲な実験により、MotionWaveletの有効性が検証され、予測精度が向上し、様々なベンチマークにおける一般化が強化された。
私たちのコードとモデルは受け入れ次第リリースされます。
関連論文リスト
- MDMP: Multi-modal Diffusion for supervised Motion Predictions with uncertainty [7.402769693163035]
本稿では,運動予測のための多モード拡散モデルを提案する。
骨格データと行動のテキスト記述を統合し、定量性のある不確実性を伴う洗練された長期動作予測を生成する。
我々のモデルは、長期動作を正確に予測する上で、既存の生成技術よりも一貫して優れている。
論文 参考訳(メタデータ) (2024-10-04T18:49:00Z) - DivDiff: A Conditional Diffusion Model for Diverse Human Motion Prediction [9.447439259813112]
本研究では,より多様で現実的な人間の動きを予測するために,DivDiffと呼ばれる条件拡散に基づく生成モデルを提案する。
具体的には、DivDiffはDDPMをバックボーンとして使用し、離散コサイン変換(DCT)とトランスフォーマー機構を組み込んでいます。
本研究では,人体運動に対する人間の骨格制約を強制するために,多種多様な強化サンプリング機能 (DRSF) を設計する。
論文 参考訳(メタデータ) (2024-08-16T04:51:32Z) - Spectral Motion Alignment for Video Motion Transfer using Diffusion Models [54.32923808964701]
スペクトル運動アライメント(英: Spectral Motion Alignment、SMA)は、フーリエ変換とウェーブレット変換を用いて運動ベクトルを洗練・整列するフレームワークである。
SMAは周波数領域の正規化を取り入れて動きパターンを学習し、全体フレームのグローバルな動きのダイナミクスの学習を容易にする。
大規模な実験は、様々なビデオカスタマイズフレームワーク間の計算効率と互換性を維持しながら、モーション転送を改善するSMAの有効性を示す。
論文 参考訳(メタデータ) (2024-03-22T14:47:18Z) - TransFusion: A Practical and Effective Transformer-based Diffusion Model
for 3D Human Motion Prediction [1.8923948104852863]
本研究では,3次元動作予測のための革新的で実用的な拡散モデルであるTransFusionを提案する。
我々のモデルは、浅い層と深い層の間の長いスキップ接続を持つバックボーンとしてTransformerを活用している。
クロスアテンションや適応層正規化のような余分なモジュールを利用する従来の拡散モデルとは対照的に、条件を含む全ての入力をトークンとして扱い、より軽量なモデルを作成する。
論文 参考訳(メタデータ) (2023-07-30T01:52:07Z) - Towards Accurate Human Motion Prediction via Iterative Refinement [9.910719309846128]
FreqMRNは人体の運動構造と運動の時間的滑らかさの両方を考慮に入れている。
我々は,Human3.6M,AMASS,3DPWなど,いくつかの標準ベンチマークデータセット上でFreqMRNを評価する。
論文 参考訳(メタデータ) (2023-05-08T03:43:51Z) - Executing your Commands via Motion Diffusion in Latent Space [51.64652463205012]
本研究では,動作遅延に基づく拡散モデル(MLD)を提案し,条件付き入力に対応する鮮明な動き列を生成する。
我々のMDDは、広範囲な人体運動生成タスクにおいて、最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-12-08T03:07:00Z) - PhysDiff: Physics-Guided Human Motion Diffusion Model [101.1823574561535]
既存の運動拡散モデルは、拡散過程における物理学の法則をほとんど無視する。
PhysDiffは拡散過程に物理的制約を組み込む。
提案手法は,最先端の動作品質を実現し,身体的可視性を大幅に向上させる。
論文 参考訳(メタデータ) (2022-12-05T18:59:52Z) - MotionAug: Augmentation with Physical Correction for Human Motion
Prediction [19.240717471864723]
本稿では,動き合成を取り入れた動きデータ拡張手法を提案する。
提案手法は,リカレントニューラルネットワークとグラフ畳み込みネットワークを併用した人間の動き予測モデルにおいて,従来の雑音に基づく動き増進手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-03-17T06:53:15Z) - Generating Smooth Pose Sequences for Diverse Human Motion Prediction [90.45823619796674]
本稿では,多様な動作予測と制御可能な動作予測のための統合された深部生成ネットワークを提案する。
標準ベンチマークデータセットであるHuman3.6MとHumanEva-Iの2つの実験は、我々のアプローチがサンプルの多様性と精度の両方において最先端のベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2021-08-19T00:58:00Z) - Motion Prediction Using Temporal Inception Module [96.76721173517895]
人間の動作を符号化するTIM(Temporal Inception Module)を提案する。
本フレームワークは,異なる入力長に対して異なるカーネルサイズを用いて,畳み込み層を用いて入力埋め込みを生成する。
標準的な動き予測ベンチマークデータセットであるHuman3.6MとCMUのモーションキャプチャデータセットの実験結果から,我々の手法は一貫して技術手法の状態を上回ります。
論文 参考訳(メタデータ) (2020-10-06T20:26:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。