論文の概要: Multi-Graph Convolution Network for Pose Forecasting
- arxiv url: http://arxiv.org/abs/2304.04956v1
- Date: Tue, 11 Apr 2023 03:59:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-12 16:16:47.630667
- Title: Multi-Graph Convolution Network for Pose Forecasting
- Title(参考訳): Pose Forecastingのためのマルチグラフ畳み込みネットワーク
- Authors: Hongwei Ren, Yuhong Shi, Kewei Liang
- Abstract要約: 本稿では,3次元ポーズ予測のための多グラフ畳み込みネットワーク(MGCN)を提案する。
MGCNは、ポーズシーケンスのための拡張グラフを導入することで、空間情報と時間情報を同時にキャプチャする。
評価では,MGCNはポーズ予測において最先端の予測よりも優れていた。
- 参考スコア(独自算出の注目度): 0.8057006406834467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, there has been a growing interest in predicting human motion, which
involves forecasting future body poses based on observed pose sequences. This
task is complex due to modeling spatial and temporal relationships. The most
commonly used models for this task are autoregressive models, such as recurrent
neural networks (RNNs) or variants, and Transformer Networks. However, RNNs
have several drawbacks, such as vanishing or exploding gradients. Other
researchers have attempted to solve the communication problem in the spatial
dimension by integrating Graph Convolutional Networks (GCN) and Long Short-Term
Memory (LSTM) models. These works deal with temporal and spatial information
separately, which limits the effectiveness. To fix this problem, we propose a
novel approach called the multi-graph convolution network (MGCN) for 3D human
pose forecasting. This model simultaneously captures spatial and temporal
information by introducing an augmented graph for pose sequences. Multiple
frames give multiple parts, joined together in a single graph instance.
Furthermore, we also explore the influence of natural structure and
sequence-aware attention to our model. In our experimental evaluation of the
large-scale benchmark datasets, Human3.6M, AMSS and 3DPW, MGCN outperforms the
state-of-the-art in pose prediction.
- Abstract(参考訳): 近年,観察されたポーズシーケンスに基づいて将来の身体のポーズを予測する人の動きを予測することへの関心が高まっている。
このタスクは空間的および時間的関係をモデル化するため複雑である。
このタスクで最も一般的に使用されるモデルは、リカレントニューラルネットワーク(RNN)や変種、Transformer Networksなどの自己回帰モデルである。
しかし、RNNには、消滅や爆発的な勾配など、いくつかの欠点がある。
他の研究者は、グラフ畳み込みネットワーク(GCN)とLong Short-Term Memory(LSTM)モデルを統合することにより、空間次元における通信問題の解決を試みた。
これらの作品は時間的・空間的な情報を別々に扱い、有効性を制限する。
そこで本研究では,3次元人物ポーズ予測のためのマルチグラフ畳み込みネットワーク(mgcn)と呼ばれる新しい手法を提案する。
このモデルは、ポーズシーケンスのための拡張グラフを導入することで、空間的および時間的情報を同時にキャプチャする。
複数のフレームは複数の部分を与え、単一のグラフインスタンスに結合する。
さらに,本モデルに対する自然構造の影響とシーケンスアウェアメントの影響についても検討する。
大規模ベンチマークデータセットであるHuman3.6M, AMSS, 3DPWの実験評価において, MGCNはポーズ予測における最先端性を上回る性能を示した。
関連論文リスト
- Multivariate Time-Series Anomaly Detection based on Enhancing Graph Attention Networks with Topological Analysis [31.43159668073136]
時系列における教師なし異常検出は、手動による介入の必要性を大幅に低減するため、産業応用において不可欠である。
従来の手法では、グラフニューラルネットワーク(GNN)やトランスフォーマーを使用して空間を解析し、RNNは時間的依存をモデル化していた。
本稿では,TopoGDNと呼ばれる多変量時系列異常検出のための拡張グラフ注意ネットワーク(GAT)上に構築された新しい時間モデルを提案する。
論文 参考訳(メタデータ) (2024-08-23T14:06:30Z) - Multi-Scale Spatial-Temporal Self-Attention Graph Convolutional Networks for Skeleton-based Action Recognition [0.0]
本稿では,マルチスケール空間時間自己注意(MSST)-GCNという自己注意型GCNハイブリッドモデルを提案する。
適応トポロジを持つ空間自己保持モジュールを用いて、異なる身体部分間のフレーム内相互作用を理解するとともに、時間的自己保持モジュールを用いてノードのフレーム間の相関関係を調べる。
論文 参考訳(メタデータ) (2024-04-03T10:25:45Z) - Multiscale Residual Learning of Graph Convolutional Sequence Chunks for
Human Motion Prediction [23.212848643552395]
時間的および空間的依存関係の学習による人間の動作予測のための新しい手法を提案する。
提案手法は,動作予測のためのシーケンス情報を効果的にモデル化し,他の手法よりも優れ,新しい最先端の手法を設定できる。
論文 参考訳(メタデータ) (2023-08-31T15:23:33Z) - Multivariate Time Series Forecasting with Dynamic Graph Neural ODEs [65.18780403244178]
動的グラフニューラル正規微分方程式(MTGODE)を用いた多変量時系列予測連続モデルを提案する。
具体的には、まず、時間進化するノードの特徴と未知のグラフ構造を持つ動的グラフに多変量時系列を抽象化する。
そして、欠落したグラフトポロジを補完し、空間的および時間的メッセージパッシングを統一するために、ニューラルODEを設計、解決する。
論文 参考訳(メタデータ) (2022-02-17T02:17:31Z) - Spatio-Temporal Joint Graph Convolutional Networks for Traffic
Forecasting [75.10017445699532]
近年、時間グラフモデリング問題として交通予測の定式化に焦点が移っている。
本稿では,道路網における交通予測の精度向上のための新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-25T08:45:14Z) - Space-Time-Separable Graph Convolutional Network for Pose Forecasting [3.6417475195085602]
STS-GCNは、グラフ畳み込みネットワーク(GCN)でのみ人間のポーズダイナミクスをモデル化する
時空グラフ接続は空間と時間親和性に分解され、時空のクロストークをボトルネックにするとともに、完全結合と時間-時間相関を可能にする。
論文 参考訳(メタデータ) (2021-10-09T13:59:30Z) - Multiscale Spatio-Temporal Graph Neural Networks for 3D Skeleton-Based
Motion Prediction [92.16318571149553]
本稿では,次世代の3次元骨格型人間のポーズを予測するため,マルチスケール・テンポラルグラフニューラルネットワーク(MST-GNN)を提案する。
MST-GNNは、短期および長期の動作予測において最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-08-25T14:05:37Z) - MSR-GCN: Multi-Scale Residual Graph Convolution Networks for Human
Motion Prediction [34.565986275769745]
本稿では,人間のポーズ予測のためのマルチスケール残差グラフ畳み込みネットワーク(MSR-GCN)を提案する。
提案手法は、Human3.6MデータセットとCMU Mocapデータセットの2つの標準ベンチマークデータセットで評価される。
論文 参考訳(メタデータ) (2021-08-16T15:26:23Z) - 3D Human Pose Regression using Graph Convolutional Network [68.8204255655161]
本稿では,2次元のポーズから3次元のポーズ回帰を行うために,PoseGraphNetというグラフ畳み込みネットワークを提案する。
我々のモデルの性能は最先端に近いが、パラメータははるかに少ない。
論文 参考訳(メタデータ) (2021-05-21T14:41:31Z) - Connecting the Dots: Multivariate Time Series Forecasting with Graph
Neural Networks [91.65637773358347]
多変量時系列データに特化して設計された汎用グラフニューラルネットワークフレームワークを提案する。
グラフ学習モジュールを用いて,変数間の一方向関係を自動的に抽出する。
提案手法は,4つのベンチマークデータセットのうち3つにおいて,最先端のベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2020-05-24T04:02:18Z) - Disentangling and Unifying Graph Convolutions for Skeleton-Based Action
Recognition [79.33539539956186]
本稿では,マルチスケールグラフ畳み込みと,G3Dという空間時間グラフ畳み込み演算子を結合する簡単な方法を提案する。
これらの提案を結合することにより,MS-G3Dという強力な特徴抽出器を開発し,そのモデルが3つの大規模データセット上で従来の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-03-31T11:28:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。