論文の概要: Towards Globally Consistent Stochastic Human Motion Prediction via
Motion Diffusion
- arxiv url: http://arxiv.org/abs/2305.12554v1
- Date: Sun, 21 May 2023 19:31:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-23 19:48:15.864910
- Title: Towards Globally Consistent Stochastic Human Motion Prediction via
Motion Diffusion
- Title(参考訳): 動き拡散による世界的確率的人間の動き予測に向けて
- Authors: Jiarui Sun, Girish Chowdhary
- Abstract要約: DiffMotionは拡散に基づく人間の動き予測フレームワークである。
人間の身体の運動構造と、世界的時間的に一貫した運動の性質の両方を考える。
ベンチマーク分析の結果,DiffMotionは従来の手法よりも精度と忠実度が高いことがわかった。
- 参考スコア(独自算出の注目度): 9.910719309846128
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stochastic human motion prediction aims to predict multiple possible upcoming
pose sequences based on past human motion trajectories. Prior works focused
heavily on generating diverse motion samples, leading to inconsistent, abnormal
predictions from the immediate past observations. To address this issue, in
this work, we propose DiffMotion, a diffusion-based stochastic human motion
prediction framework that considers both the kinematic structure of the human
body and the globally temporally consistent nature of motion. Specifically,
DiffMotion consists of two modules: 1) a transformer-based network for
generating an initial motion reconstruction from corrupted motion, and 2) a
multi-stage graph convolutional network to iteratively refine the generated
motion based on past observations. Facilitated by the proposed direct target
prediction objective and the variance scheduler, our method is capable of
predicting accurate, realistic and consistent motion with an appropriate level
of diversity. Our results on benchmark datasets demonstrate that DiffMotion
outperforms previous methods by large margins in terms of accuracy and fidelity
while demonstrating superior robustness.
- Abstract(参考訳): 確率的人間の動き予測は、過去の人間の動きの軌跡に基づいて、複数の起こりうるポーズ列を予測することを目的としている。
先行研究は多様な動作サンプルの生成に重点を置いており、過去の観測結果から不一致で異常な予測を導いた。
そこで本研究では,人体の運動構造と世界的時間的一貫した運動の性質の両方を考慮した,拡散に基づく確率的人間の動作予測フレームワークであるDiffMotionを提案する。
具体的には、DiffMotionは2つのモジュールから構成される。
1)破損した動きから初期動作再構成を生成する変圧器ベースのネットワーク
2)過去の観測に基づいて生成した動きを反復的に洗練する多段階グラフ畳み込みネットワーク。
提案手法は,提案する直接目標予測目標と分散スケジューラにより,適切なレベルの多様性で,正確で現実的な,一貫性のある動きを予測できる。
ベンチマークデータセットを用いた結果から,ディファクションは従来の方法よりも精度と忠実性において大きなマージンで優れており,ロバスト性も優れていることが示された。
関連論文リスト
- Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.24539704456791]
都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。
最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。
我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文 参考訳(メタデータ) (2024-07-18T15:44:23Z) - AMP: Autoregressive Motion Prediction Revisited with Next Token Prediction for Autonomous Driving [59.94343412438211]
本稿では,GPT方式の次のトークン動作予測を動作予測に導入する。
同種単位-ワードからなる言語データとは異なり、運転シーンの要素は複雑な空間的・時間的・意味的な関係を持つ可能性がある。
そこで本稿では,情報集約と位置符号化スタイルの異なる3つの因子化アテンションモジュールを用いて,それらの関係を捉えることを提案する。
論文 参考訳(メタデータ) (2024-03-20T06:22:37Z) - TransFusion: A Practical and Effective Transformer-based Diffusion Model
for 3D Human Motion Prediction [1.8923948104852863]
本研究では,3次元動作予測のための革新的で実用的な拡散モデルであるTransFusionを提案する。
我々のモデルは、浅い層と深い層の間の長いスキップ接続を持つバックボーンとしてTransformerを活用している。
クロスアテンションや適応層正規化のような余分なモジュールを利用する従来の拡散モデルとは対照的に、条件を含む全ての入力をトークンとして扱い、より軽量なモデルを作成する。
論文 参考訳(メタデータ) (2023-07-30T01:52:07Z) - Uncovering the Missing Pattern: Unified Framework Towards Trajectory
Imputation and Prediction [60.60223171143206]
軌道予測は、観測されたシーケンスから実体運動や人間の行動を理解する上で重要な作業である。
現在の方法では、観測されたシーケンスが完了したと仮定し、欠落した値の可能性を無視する。
本稿では,グラフに基づく条件変動リカレントニューラルネットワーク (GC-VRNN) の統一フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-28T14:27:27Z) - An Energy-Based Prior for Generative Saliency [62.79775297611203]
本稿では,情報的エネルギーベースモデルを事前分布として採用する,新たな生成正当性予測フレームワークを提案する。
生成サリエンシモデルを用いて,画像から画素単位の不確実性マップを得ることができ,サリエンシ予測におけるモデル信頼度を示す。
実験結果から, エネルギーベース先行モデルを用いた生成塩分率モデルでは, 精度の高い塩分率予測だけでなく, 人間の知覚と整合した信頼性の高い不確実性マップを実現できることが示された。
論文 参考訳(メタデータ) (2022-04-19T10:51:00Z) - Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。
我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。
スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文 参考訳(メタデータ) (2022-03-25T16:59:08Z) - Learning to Predict Diverse Human Motions from a Single Image via
Mixture Density Networks [9.06677862854201]
本研究では,混合密度ネットワーク(MDN)モデルを用いて,単一画像から将来の人間の動きを予測する新しい手法を提案する。
MDNのマルチモーダルな性質は、既存のディープヒューマンモーション予測アプローチとは対照的に、様々な将来のモーション仮説の生成を可能にしている。
訓練されたモデルでは、入力として画像を直接取り、与えられた条件を満たす複数の可視運動を生成する。
論文 参考訳(メタデータ) (2021-09-13T08:49:33Z) - Generating Smooth Pose Sequences for Diverse Human Motion Prediction [90.45823619796674]
本稿では,多様な動作予測と制御可能な動作予測のための統合された深部生成ネットワークを提案する。
標準ベンチマークデータセットであるHuman3.6MとHumanEva-Iの2つの実験は、我々のアプローチがサンプルの多様性と精度の両方において最先端のベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2021-08-19T00:58:00Z) - Multitask Non-Autoregressive Model for Human Motion Prediction [33.98939145212708]
非auToregressive Model (NAT) は、文脈エンコーダと位置エンコードモジュールと同様に、完全な非自己回帰復号方式で提案される。
提案手法はHuman3.6MとCMU-Mocapのベンチマークで評価され,最先端の自己回帰手法よりも優れている。
論文 参考訳(メタデータ) (2020-07-13T15:00:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。