論文の概要: Nonisotropic Gaussian Diffusion for Realistic 3D Human Motion Prediction
- arxiv url: http://arxiv.org/abs/2501.06035v1
- Date: Fri, 10 Jan 2025 15:13:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-13 15:27:18.046013
- Title: Nonisotropic Gaussian Diffusion for Realistic 3D Human Motion Prediction
- Title(参考訳): 非等方的ガウス拡散によるリアルな3次元人間の動作予測
- Authors: Cecilia Curreli, Dominik Muhle, Abhishek Saroha, Zhenzhang Ye, Riccardo Marin, Daniel Cremers,
- Abstract要約: スケルトン拡散(Skeleton Diffusion)は、人体に明らかな誘導バイアスを埋め込む潜伏拡散モデルである。
手足の歪みのような人工物を避けながら、一貫して現実的な予測を生成する。
3つの実世界のデータセットに新しいベンチマークを設定する。
- 参考スコア(独自算出の注目度): 36.0214360692653
- License:
- Abstract: Probabilistic human motion prediction aims to forecast multiple possible future movements from past observations. While current approaches report high diversity and realism, they often generate motions with undetected limb stretching and jitter. To address this, we introduce SkeletonDiffusion, a latent diffusion model that embeds an explicit inductive bias on the human body within its architecture and training. Our model is trained with a novel nonisotropic Gaussian diffusion formulation that aligns with the natural kinematic structure of the human skeleton. Results show that our approach outperforms conventional isotropic alternatives, consistently generating realistic predictions while avoiding artifacts such as limb distortion. Additionally, we identify a limitation in commonly used diversity metrics, which may inadvertently favor models that produce inconsistent limb lengths within the same sequence. SkeletonDiffusion sets a new benchmark on three real-world datasets, outperforming various baselines across multiple evaluation metrics. Visit our project page: https://ceveloper.github.io/publications/skeletondiffusion/
- Abstract(参考訳): 確率的人間の動き予測は、過去の観測から複数の将来の動きを予測することを目的としている。
現在のアプローチでは高い多様性とリアリズムが報告されているが、検出されていない手足の伸展とジッタによる動きがしばしば発生する。
これを解決するために、アーキテクチャとトレーニングに人体に明示的な帰納バイアスを埋め込む潜在拡散モデルであるSkeletonDiffusionを導入する。
我々のモデルは、ヒト骨格の自然運動構造と整合する新しい非等方的ガウス拡散定式化を用いて訓練されている。
その結果,本手法は従来の等方的代替品よりも優れており,手足の歪みなどのアーティファクトを回避しつつ,常に現実的な予測を生成できることが示唆された。
さらに、一般的に使用されている多様性指標の制限を識別し、同じシーケンス内で不整合な手足の長さを生成するモデルに不注意に好む可能性がある。
SkeletonDiffusionは3つの実世界のデータセットに新しいベンチマークを設定し、複数の評価指標でさまざまなベースラインを上回ります。
https://ceveloper.github.io/publications/skeletondiffusion/
関連論文リスト
- Towards Generalizable and Interpretable Motion Prediction: A Deep
Variational Bayes Approach [54.429396802848224]
本稿では,分布外ケースに対する頑健な一般化性を有する動き予測のための解釈可能な生成モデルを提案する。
このモデルでは, 長期目的地の空間分布を推定することにより, 目標駆動動作予測を実現する。
動き予測データセットの実験は、適合したモデルが解釈可能で一般化可能であることを検証した。
論文 参考訳(メタデータ) (2024-03-10T04:16:04Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - TransFusion: A Practical and Effective Transformer-based Diffusion Model
for 3D Human Motion Prediction [1.8923948104852863]
本研究では,3次元動作予測のための革新的で実用的な拡散モデルであるTransFusionを提案する。
我々のモデルは、浅い層と深い層の間の長いスキップ接続を持つバックボーンとしてTransformerを活用している。
クロスアテンションや適応層正規化のような余分なモジュールを利用する従来の拡散モデルとは対照的に、条件を含む全ての入力をトークンとして扱い、より軽量なモデルを作成する。
論文 参考訳(メタデータ) (2023-07-30T01:52:07Z) - Uncertainty-Aware Pedestrian Trajectory Prediction via Distributional Diffusion [26.715578412088327]
モデルに依存しない不確実性を考慮した歩行者軌道予測手法を提案する。
従来の研究とは異なり、予測性は明示的な分布に変換され、予測可能な将来の軌道を生成することができる。
私たちのフレームワークは、さまざまなニューラルネットアーキテクチャと互換性があります。
論文 参考訳(メタデータ) (2023-03-15T04:58:43Z) - Can We Use Diffusion Probabilistic Models for 3D Motion Prediction? [10.808563617061846]
本稿では, 拡散確率モデルを用いて, 先述の動作から将来の3次元人間の動きを予測することを提案する。
我々は,Human 3.6MとHumanEva-Iデータセットに基づいて,拡散確率モデルが単一(決定論的)かつ複数(確率的)な3次元動作予測タスクと競合することを示す。
論文 参考訳(メタデータ) (2023-02-28T11:34:55Z) - BeLFusion: Latent Diffusion for Behavior-Driven Human Motion Prediction [26.306489700180627]
本研究では,人間の動作予測(HMP)における潜伏拡散モデルを利用して,行動がポーズや動きから切り離されている潜伏空間からサンプルを採取するモデルであるBeLFusionを提案する。
サンプルの動作を進行中の動作に転送する能力のおかげで、Belfusion氏の予測は、芸術の状況よりもはるかに現実的なさまざまな行動を示す。
論文 参考訳(メタデータ) (2022-11-25T18:59:03Z) - Human Joint Kinematics Diffusion-Refinement for Stochastic Motion
Prediction [22.354538952573158]
MotionDiffは、人間の関節のキネマティクスを加熱粒子として扱う拡散確率モデルである。
MotionDiffは、多種多様な可塑性運動を生成する空間時間変換器ベースの拡散ネットワークと、出力をさらに洗練するためのグラフ畳み込みネットワークの2つの部分で構成されている。
論文 参考訳(メタデータ) (2022-10-12T07:38:33Z) - A generic diffusion-based approach for 3D human pose prediction in the
wild [68.00961210467479]
3D人間のポーズ予測、すなわち、過去の観察されたポーズのシーケンスが与えられた後の人間の3Dポーズのシーケンスを予測することは、困難な時間課題である。
本稿では,不完全な要素(予測や観測に関係しない)をノイズとして扱える統一的な定式化法を提案し,それらを認知し,妥当なポーズを予測する条件拡散モデルを提案する。
本研究は,4つの標準データセットについて検討し,現状よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-10-11T17:59:54Z) - Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。
我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。
スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文 参考訳(メタデータ) (2022-03-25T16:59:08Z) - Generating Smooth Pose Sequences for Diverse Human Motion Prediction [90.45823619796674]
本稿では,多様な動作予測と制御可能な動作予測のための統合された深部生成ネットワークを提案する。
標準ベンチマークデータセットであるHuman3.6MとHumanEva-Iの2つの実験は、我々のアプローチがサンプルの多様性と精度の両方において最先端のベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2021-08-19T00:58:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。