論文の概要: Dynamic Multiscale Graph Neural Networks for 3D Skeleton-Based Human
Motion Prediction
- arxiv url: http://arxiv.org/abs/2003.08802v1
- Date: Tue, 17 Mar 2020 02:49:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 20:29:17.349446
- Title: Dynamic Multiscale Graph Neural Networks for 3D Skeleton-Based Human
Motion Prediction
- Title(参考訳): 3次元骨格に基づく人の動き予測のための動的マルチスケールグラフニューラルネットワーク
- Authors: Maosen Li, Siheng Chen, Yangheng Zhao, Ya Zhang, Yanfeng Wang, Qi Tian
- Abstract要約: 本研究では3次元骨格に基づく人体動作を予測するために,新しい動的マルチスケールグラフニューラルネットワーク(DMGNN)を提案する。
モデルはアクションカテゴリに依存しないもので、エンコーダ/デコーダフレームワークに従う。
提案したDMGNNは,短期および長期の予測において最先端の手法より優れている。
- 参考スコア(独自算出の注目度): 102.9787019197379
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose novel dynamic multiscale graph neural networks (DMGNN) to predict
3D skeleton-based human motions. The core idea of DMGNN is to use a multiscale
graph to comprehensively model the internal relations of a human body for
motion feature learning. This multiscale graph is adaptive during training and
dynamic across network layers. Based on this graph, we propose a multiscale
graph computational unit (MGCU) to extract features at individual scales and
fuse features across scales. The entire model is action-category-agnostic and
follows an encoder-decoder framework. The encoder consists of a sequence of
MGCUs to learn motion features. The decoder uses a proposed graph-based gate
recurrent unit to generate future poses. Extensive experiments show that the
proposed DMGNN outperforms state-of-the-art methods in both short and long-term
predictions on the datasets of Human 3.6M and CMU Mocap. We further investigate
the learned multiscale graphs for the interpretability. The codes could be
downloaded from https://github.com/limaosen0/DMGNN.
- Abstract(参考訳): 本研究では3次元骨格に基づく人体動作を予測するために,新しい動的マルチスケールグラフニューラルネットワーク(DMGNN)を提案する。
DMGNNの中核となる考え方は、運動特徴学習のための人体の内部関係を包括的にモデル化するために、マルチスケールグラフを使用することである。
この多スケールグラフは、トレーニング中に適応し、ネットワーク層をまたいで動的である。
このグラフに基づいて,個々のスケールの特徴を抽出し,スケールにまたがる特徴を融合する多スケールグラフ計算ユニット(mgcu)を提案する。
モデル全体がアクションカテゴリに依存しず、エンコーダ/デコーダフレームワークに従う。
エンコーダは動きの特徴を学習するための一連のMGCUから構成される。
デコーダは、グラフベースのゲートリカレントユニットを使用して将来のポーズを生成する。
大規模な実験により、提案されたDMGNNはHuman 3.6MとCMU Mocapのデータセットの短期的および長期的予測において最先端の手法よりも優れていた。
さらに,解析可能なマルチスケールグラフについても検討する。
コードはhttps://github.com/limaosen0/DMGNNからダウンロードできる。
関連論文リスト
- Graph Spring Neural ODEs for Link Sign Prediction [49.71046810937725]
本稿では,春の力によってモデル化されたグラフスプリングネットワーク(GSN)と呼ばれる新しいメッセージパッシング層アーキテクチャを提案する。
提案手法は,大規模グラフ上で最大28,000のノード生成時間高速化係数を持つ最先端手法に近い精度を実現する。
論文 参考訳(メタデータ) (2024-12-17T13:50:20Z) - Multiscale Residual Learning of Graph Convolutional Sequence Chunks for
Human Motion Prediction [23.212848643552395]
時間的および空間的依存関係の学習による人間の動作予測のための新しい手法を提案する。
提案手法は,動作予測のためのシーケンス情報を効果的にモデル化し,他の手法よりも優れ,新しい最先端の手法を設定できる。
論文 参考訳(メタデータ) (2023-08-31T15:23:33Z) - Multi-Graph Convolution Network for Pose Forecasting [0.8057006406834467]
本稿では,3次元ポーズ予測のための多グラフ畳み込みネットワーク(MGCN)を提案する。
MGCNは、ポーズシーケンスのための拡張グラフを導入することで、空間情報と時間情報を同時にキャプチャする。
評価では,MGCNはポーズ予測において最先端の予測よりも優れていた。
論文 参考訳(メタデータ) (2023-04-11T03:59:43Z) - Skeleton-Parted Graph Scattering Networks for 3D Human Motion Prediction [120.08257447708503]
体-関節関係をモデル化するグラフ畳み込みネットワークに基づく手法は,最近3次元骨格に基づく人間の動作予測において大きな可能性を示唆している。
骨格分割グラフ散乱ネットワーク(SPGSN)を提案する。
SPGSNは、Human3.6M、CMU Mocap、および3DPWデータセット上で、関節位置誤差(MPJPE)当たりの3D平均の13.8%、9.3%、および2.7%の差で最先端の手法を上回っている。
論文 参考訳(メタデータ) (2022-07-31T05:51:39Z) - DMS-GCN: Dynamic Mutiscale Spatiotemporal Graph Convolutional Networks
for Human Motion Prediction [8.142947808507365]
動作予測のためのフィードフォワードディープニューラルネットワークを提案する。
モデル全体がすべてのアクションに適合し、エンコーダ・デコーダのフレームワークに従う。
提案手法は,Human3.6MとCMU Mocapのデータセット上でSOTA法より優れている。
論文 参考訳(メタデータ) (2021-12-20T07:07:03Z) - Skeleton-Graph: Long-Term 3D Motion Prediction From 2D Observations
Using Deep Spatio-Temporal Graph CNNs [67.29552662707516]
本研究では,2次元モデルから1回のパスで将来の3Dスケルトンポーズを予測するディープテンポラルグラフCNNモデルを提案する。
この設計により、Skeleton-Graph は、将来の3Dのポーズを、以前の作品とは異なり、長期にわたってばらつきなく予測する。
GTA-IM と PROX の双方で FDE が 27% 改善し,ADE が4% 改善した。
論文 参考訳(メタデータ) (2021-09-21T15:33:40Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - Multiscale Spatio-Temporal Graph Neural Networks for 3D Skeleton-Based
Motion Prediction [92.16318571149553]
本稿では,次世代の3次元骨格型人間のポーズを予測するため,マルチスケール・テンポラルグラフニューラルネットワーク(MST-GNN)を提案する。
MST-GNNは、短期および長期の動作予測において最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-08-25T14:05:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。