論文の概要: Human Joint Kinematics Diffusion-Refinement for Stochastic Motion
Prediction
- arxiv url: http://arxiv.org/abs/2210.05976v1
- Date: Wed, 12 Oct 2022 07:38:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 14:48:26.154715
- Title: Human Joint Kinematics Diffusion-Refinement for Stochastic Motion
Prediction
- Title(参考訳): 確率運動予測のための人関節運動の拡散補正
- Authors: Dong Wei, Huaijiang Sun, Bin Li, Jianfeng Lu, Weiqing Li, Xiaoning
Sun, Shengxiang Hu
- Abstract要約: MotionDiffは、人間の関節のキネマティクスを加熱粒子として扱う拡散確率モデルである。
MotionDiffは、多種多様な可塑性運動を生成する空間時間変換器ベースの拡散ネットワークと、出力をさらに洗練するためのグラフ畳み込みネットワークの2つの部分で構成されている。
- 参考スコア(独自算出の注目度): 22.354538952573158
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stochastic human motion prediction aims to forecast multiple plausible future
motions given a single pose sequence from the past. Most previous works focus
on designing elaborate losses to improve the accuracy, while the diversity is
typically characterized by randomly sampling a set of latent variables from the
latent prior, which is then decoded into possible motions. This joint training
of sampling and decoding, however, suffers from posterior collapse as the
learned latent variables tend to be ignored by a strong decoder, leading to
limited diversity. Alternatively, inspired by the diffusion process in
nonequilibrium thermodynamics, we propose MotionDiff, a diffusion probabilistic
model to treat the kinematics of human joints as heated particles, which will
diffuse from original states to a noise distribution. This process offers a
natural way to obtain the "whitened" latents without any trainable parameters,
and human motion prediction can be regarded as the reverse diffusion process
that converts the noise distribution into realistic future motions conditioned
on the observed sequence. Specifically, MotionDiff consists of two parts: a
spatial-temporal transformer-based diffusion network to generate diverse yet
plausible motions, and a graph convolutional network to further refine the
outputs. Experimental results on two datasets demonstrate that our model yields
the competitive performance in terms of both accuracy and diversity.
- Abstract(参考訳): 確率的人間の運動予測は、過去から1つのポーズシーケンスを与えられた複数の妥当な将来の動きを予測することを目的としている。
これまでのほとんどの研究は、精度を向上させるために精巧な損失を設計することに重点を置いており、多様性は典型的には潜伏変数のセットをランダムにサンプリングし、それによって起こりうる動きへとデコードする。
しかし、このサンプリングと復号の合同トレーニングは、学習された潜伏変数が強い復号器によって無視される傾向があるため、後続の崩壊に悩まされる。
あるいは、非平衡熱力学における拡散過程に着想を得て、人間の関節のキネマティクスを加熱粒子として扱う拡散確率モデルであるMotionDiffを提案する。
このプロセスは、訓練可能なパラメータをもたずに「白く」潜伏音を得る自然な方法を提供し、人間の運動予測は、観測されたシーケンスで条件付けられたノイズ分布を現実的な将来の動きに変換する逆拡散過程と見なすことができる。
特に、MotionDiffは、多種多様な可塑性運動を生成する空間時間変換器ベースの拡散ネットワークと、出力をさらに洗練するためのグラフ畳み込みネットワークの2つの部分から構成される。
2つのデータセットの実験結果から,モデルの精度と多様性の両面での競合性能が示された。
関連論文リスト
- Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion [61.03681839276652]
拡散強制(Diffusion Forcing)は、拡散モデルをトレーニングし、トークンの集合に独立した音レベルを付与する、新たなトレーニングパラダイムである。
因果的次トーケン予測モデルを訓練して1つまたは複数の未来のトークンを生成することで、シーケンス生成モデルに拡散強制を適用する。
論文 参考訳(メタデータ) (2024-07-01T15:43:25Z) - TransFusion: A Practical and Effective Transformer-based Diffusion Model
for 3D Human Motion Prediction [1.8923948104852863]
本研究では,3次元動作予測のための革新的で実用的な拡散モデルであるTransFusionを提案する。
我々のモデルは、浅い層と深い層の間の長いスキップ接続を持つバックボーンとしてTransformerを活用している。
クロスアテンションや適応層正規化のような余分なモジュールを利用する従来の拡散モデルとは対照的に、条件を含む全ての入力をトークンとして扱い、より軽量なモデルを作成する。
論文 参考訳(メタデータ) (2023-07-30T01:52:07Z) - R2-Diff: Denoising by diffusion as a refinement of retrieved motion for
image-based motion prediction [8.104557130048407]
画像に基づく動き予測において、拡散モデルは、画像コンテキストに基づいてランダムノイズを段階的に denoising することによって、文脈的に適切な動きを予測する。
R2-Diffでは、画像類似性に基づいてデータセットから取得した動きをランダムノイズの代わりに拡散モデルに入力する。
R2-Diffは、ロボット操作における最近の最先端モデルと比較して、適切な動作を正確に予測し、高いタスク成功率を達成する。
論文 参考訳(メタデータ) (2023-06-15T20:27:06Z) - Uncertainty-Aware Pedestrian Trajectory Prediction via Distributional Diffusion [26.715578412088327]
モデルに依存しない不確実性を考慮した歩行者軌道予測手法を提案する。
従来の研究とは異なり、予測性は明示的な分布に変換され、予測可能な将来の軌道を生成することができる。
私たちのフレームワークは、さまざまなニューラルネットアーキテクチャと互換性があります。
論文 参考訳(メタデータ) (2023-03-15T04:58:43Z) - Modiff: Action-Conditioned 3D Motion Generation with Denoising Diffusion
Probabilistic Models [58.357180353368896]
本稿では,現実的で多様な3D骨格に基づく運動生成問題に対処するために,拡散確率モデル(DDPM)の利点を生かした条件付きパラダイムを提案する。
我々はDDPMを用いてカテゴリ的動作で条件付けられた動作列の可変数を合成する先駆的な試みである。
論文 参考訳(メタデータ) (2023-01-10T13:15:42Z) - Bi-Noising Diffusion: Towards Conditional Diffusion Models with
Generative Restoration Priors [64.24948495708337]
本研究では,事前訓練した非条件拡散モデルを用いて,予測サンプルをトレーニングデータ多様体に導入する手法を提案する。
我々は,超解像,着色,乱流除去,画像劣化作業におけるアプローチの有効性を実証するための総合的な実験を行った。
論文 参考訳(メタデータ) (2022-12-14T17:26:35Z) - Executing your Commands via Motion Diffusion in Latent Space [51.64652463205012]
本研究では,動作遅延に基づく拡散モデル(MLD)を提案し,条件付き入力に対応する鮮明な動き列を生成する。
我々のMDDは、広範囲な人体運動生成タスクにおいて、最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-12-08T03:07:00Z) - Diffusion Models in Vision: A Survey [80.82832715884597]
拡散モデルは、前方拡散段階と逆拡散段階の2つの段階に基づく深層生成モデルである。
拡散モデルは、既知の計算負荷にもかかわらず、生成したサンプルの品質と多様性に対して広く評価されている。
論文 参考訳(メタデータ) (2022-09-10T22:00:30Z) - Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。
我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。
スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文 参考訳(メタデータ) (2022-03-25T16:59:08Z) - Learning to Predict Diverse Human Motions from a Single Image via
Mixture Density Networks [9.06677862854201]
本研究では,混合密度ネットワーク(MDN)モデルを用いて,単一画像から将来の人間の動きを予測する新しい手法を提案する。
MDNのマルチモーダルな性質は、既存のディープヒューマンモーション予測アプローチとは対照的に、様々な将来のモーション仮説の生成を可能にしている。
訓練されたモデルでは、入力として画像を直接取り、与えられた条件を満たす複数の可視運動を生成する。
論文 参考訳(メタデータ) (2021-09-13T08:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。