論文の概要: DivDiff: A Conditional Diffusion Model for Diverse Human Motion Prediction
- arxiv url: http://arxiv.org/abs/2409.00014v1
- Date: Fri, 16 Aug 2024 04:51:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-08 15:50:41.125990
- Title: DivDiff: A Conditional Diffusion Model for Diverse Human Motion Prediction
- Title(参考訳): DivDiff: 多様な人間の動作予測のための条件付き拡散モデル
- Authors: Hua Yu, Yaqing Hou, Wenbin Pei, Qiang Zhang,
- Abstract要約: 本研究では,より多様で現実的な人間の動きを予測するために,DivDiffと呼ばれる条件拡散に基づく生成モデルを提案する。
具体的には、DivDiffはDDPMをバックボーンとして使用し、離散コサイン変換(DCT)とトランスフォーマー機構を組み込んでいます。
本研究では,人体運動に対する人間の骨格制約を強制するために,多種多様な強化サンプリング機能 (DRSF) を設計する。
- 参考スコア(独自算出の注目度): 9.447439259813112
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diverse human motion prediction (HMP) aims to predict multiple plausible future motions given an observed human motion sequence. It is a challenging task due to the diversity of potential human motions while ensuring an accurate description of future human motions. Current solutions are either low-diversity or limited in expressiveness. Recent denoising diffusion models (DDPM) hold potential generative capabilities in generative tasks. However, introducing DDPM directly into diverse HMP incurs some issues. Although DDPM can increase the diversity of the potential patterns of human motions, the predicted human motions become implausible over time because of the significant noise disturbances in the forward process of DDPM. This phenomenon leads to the predicted human motions being hard to control, seriously impacting the quality of predicted motions and restricting their practical applicability in real-world scenarios. To alleviate this, we propose a novel conditional diffusion-based generative model, called DivDiff, to predict more diverse and realistic human motions. Specifically, the DivDiff employs DDPM as our backbone and incorporates Discrete Cosine Transform (DCT) and transformer mechanisms to encode the observed human motion sequence as a condition to instruct the reverse process of DDPM. More importantly, we design a diversified reinforcement sampling function (DRSF) to enforce human skeletal constraints on the predicted human motions. DRSF utilizes the acquired information from human skeletal as prior knowledge, thereby reducing significant disturbances introduced during the forward process. Extensive results received in the experiments on two widely-used datasets (Human3.6M and HumanEva-I) demonstrate that our model obtains competitive performance on both diversity and accuracy.
- Abstract(参考訳): 横型人間の動き予測(英: Diverse Human Motion Prediction、HMP)は、観察された人間の動きの順序から複数の可視な将来の動きを予測することを目的としている。
これは、将来の人間の動きの正確な記述を確保しながら、潜在的な人間の動きの多様性のために難しい課題である。
現在の解は低多様性か表現性に制限がある。
最近の denoising diffusion model (DDPM) は、生成タスクにおいて潜在的な生成能力を保っている。
しかし、DDPMを多様なHMPに直接導入することはいくつかの問題を引き起こす。
DDPMは人間の動きの潜在的なパターンの多様性を高めることができるが、DDPMの進行過程における大きなノイズ障害のため、予測された人間の動きは時間とともに不明瞭になる。
この現象は、予測された人間の動きを制御しにくくし、予測された動きの品質に深刻な影響を与え、現実のシナリオにおける実用性を制限する。
そこで本研究では,より多様で現実的な人間の動きを予測するために,DivDiffと呼ばれる条件拡散に基づく新しい生成モデルを提案する。
具体的には、DivDiffはDDPMをバックボーンとして使用し、DCTとトランスフォーマー機構を組み込んで観察されたヒトの動作シーケンスを符号化し、DDPMの逆過程を指示する。
より重要なことは、予測された人間の動作に対する人間の骨格的制約を強制するために、多角化強化サンプリング機能(DRSF)を設計することである。
DRSFは、人骨格から取得した情報を事前知識として利用し、前方プロセスで導入された重大な障害を減らす。
Human3.6MとHumanEva-Iの2つの広く使われているデータセットで得られた実験の結果は、我々のモデルが多様性と精度の両面で競合性能を得ることを示した。
関連論文リスト
- MoManifold: Learning to Measure 3D Human Motion via Decoupled Joint Acceleration Manifolds [20.83684434910106]
我々は、連続した高次元運動空間における可塑性人間の動きをモデル化した、新しい人間の動きであるMoManifoldを提案する。
具体的には、既存の限られた動きデータから人間の力学をモデル化する新しい結合加速法を提案する。
大規模な実験により、MoManifoldはいくつかの下流タスクにおいて既存のSOTAよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-09-01T15:00:16Z) - COIN: Control-Inpainting Diffusion Prior for Human and Camera Motion Estimation [98.05046790227561]
COINは、人間の動きとカメラの動きを細粒度に制御できる、コントロール・インパインティング・モーション拡散である。
COINは、グローバルな人間の動き推定とカメラの動き推定という観点から、最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2024-08-29T10:36:29Z) - Multi-Condition Latent Diffusion Network for Scene-Aware Neural Human Motion Prediction [46.309401205546656]
現実世界の人間の動きはゴール指向であり、周囲のシーンの空間的レイアウトの影響を強く受けている。
本稿では,多条件共同推論問題として人間の動作予測タスクを再構成するマルチコンディション遅延拡散ネットワーク(MCLD)を提案する。
我々のネットワークは、現実的かつ多様な予測において最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-05-29T02:21:31Z) - AdvMT: Adversarial Motion Transformer for Long-term Human Motion
Prediction [2.837740438355204]
本稿では,AdvMT(Adversarial Motion Transformer)について述べる。
逆行訓練では,予測の不要な成果物を効果的に削減し,より現実的で流動的な人間の動作の学習を確実にする。
論文 参考訳(メタデータ) (2024-01-10T09:15:50Z) - TransFusion: A Practical and Effective Transformer-based Diffusion Model
for 3D Human Motion Prediction [1.8923948104852863]
本研究では,3次元動作予測のための革新的で実用的な拡散モデルであるTransFusionを提案する。
我々のモデルは、浅い層と深い層の間の長いスキップ接続を持つバックボーンとしてTransformerを活用している。
クロスアテンションや適応層正規化のような余分なモジュールを利用する従来の拡散モデルとは対照的に、条件を含む全ての入力をトークンとして扱い、より軽量なモデルを作成する。
論文 参考訳(メタデータ) (2023-07-30T01:52:07Z) - Executing your Commands via Motion Diffusion in Latent Space [51.64652463205012]
本研究では,動作遅延に基づく拡散モデル(MLD)を提案し,条件付き入力に対応する鮮明な動き列を生成する。
我々のMDDは、広範囲な人体運動生成タスクにおいて、最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-12-08T03:07:00Z) - A Neural Active Inference Model of Perceptual-Motor Learning [62.39667564455059]
アクティブ推論フレームワーク(英: active inference framework、AIF)は、現代の神経科学を基盤とした、有望な新しい計算フレームワークである。
本研究では,ヒトの視覚行動指導において,AIFが期待する役割を捉える能力をテストする。
本稿では,多次元世界状態から自由エネルギーの一次元分布にマッピングする先行関数の新たな定式化について述べる。
論文 参考訳(メタデータ) (2022-11-16T20:00:38Z) - Investigating Pose Representations and Motion Contexts Modeling for 3D
Motion Prediction [63.62263239934777]
歴史的ポーズシーケンスから人間の動きを予測することは、機械が人間と知的な相互作用を成功させるために不可欠である。
本研究では,様々なポーズ表現に関する詳細な研究を行い,その動作予測課題に対する効果に着目した。
AHMR(Attentive Hierarchical Motion Recurrent Network)と呼ばれる新しいRNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-30T10:45:22Z) - Learning to Predict Diverse Human Motions from a Single Image via
Mixture Density Networks [9.06677862854201]
本研究では,混合密度ネットワーク(MDN)モデルを用いて,単一画像から将来の人間の動きを予測する新しい手法を提案する。
MDNのマルチモーダルな性質は、既存のディープヒューマンモーション予測アプローチとは対照的に、様々な将来のモーション仮説の生成を可能にしている。
訓練されたモデルでは、入力として画像を直接取り、与えられた条件を満たす複数の可視運動を生成する。
論文 参考訳(メタデータ) (2021-09-13T08:49:33Z) - Generating Smooth Pose Sequences for Diverse Human Motion Prediction [90.45823619796674]
本稿では,多様な動作予測と制御可能な動作予測のための統合された深部生成ネットワークを提案する。
標準ベンチマークデータセットであるHuman3.6MとHumanEva-Iの2つの実験は、我々のアプローチがサンプルの多様性と精度の両方において最先端のベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2021-08-19T00:58:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。