論文の概要: Skeleton-Parted Graph Scattering Networks for 3D Human Motion Prediction
- arxiv url: http://arxiv.org/abs/2208.00368v1
- Date: Sun, 31 Jul 2022 05:51:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 13:47:00.110864
- Title: Skeleton-Parted Graph Scattering Networks for 3D Human Motion Prediction
- Title(参考訳): 3次元運動予測のためのスケルトン分割グラフ散乱ネットワーク
- Authors: Maosen Li, Siheng Chen, Zijing Zhang, Lingxi Xie, Qi Tian, Ya Zhang
- Abstract要約: 体-関節関係をモデル化するグラフ畳み込みネットワークに基づく手法は,最近3次元骨格に基づく人間の動作予測において大きな可能性を示唆している。
骨格分割グラフ散乱ネットワーク(SPGSN)を提案する。
SPGSNは、Human3.6M、CMU Mocap、および3DPWデータセット上で、関節位置誤差(MPJPE)当たりの3D平均の13.8%、9.3%、および2.7%の差で最先端の手法を上回っている。
- 参考スコア(独自算出の注目度): 120.08257447708503
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graph convolutional network based methods that model the body-joints'
relations, have recently shown great promise in 3D skeleton-based human motion
prediction. However, these methods have two critical issues: first, deep graph
convolutions filter features within only limited graph spectrums, losing
sufficient information in the full band; second, using a single graph to model
the whole body underestimates the diverse patterns on various body-parts. To
address the first issue, we propose adaptive graph scattering, which leverages
multiple trainable band-pass graph filters to decompose pose features into
richer graph spectrum bands. To address the second issue, body-parts are
modeled separately to learn diverse dynamics, which enables finer feature
extraction along the spatial dimensions. Integrating the above two designs, we
propose a novel skeleton-parted graph scattering network (SPGSN). The cores of
the model are cascaded multi-part graph scattering blocks (MPGSBs), building
adaptive graph scattering on diverse body-parts, as well as fusing the
decomposed features based on the inferred spectrum importance and body-part
interactions. Extensive experiments have shown that SPGSN outperforms
state-of-the-art methods by remarkable margins of 13.8%, 9.3% and 2.7% in terms
of 3D mean per joint position error (MPJPE) on Human3.6M, CMU Mocap and 3DPW
datasets, respectively.
- Abstract(参考訳): 体-関節関係をモデル化するグラフ畳み込みネットワークに基づく手法は,最近3次元骨格に基づく人間の動作予測において大きな可能性を示唆している。
しかし、これらの手法には2つの重要な問題がある: 1つは、ディープグラフ畳み込み(deep graph convolutions filter feature in only limited graph spectrums, lost enough information in the full band)、2つ目は、シングルグラフを使って体全体をモデル化し、様々なボディ部分の様々なパターンを過小評価する。
まず,複数のトレーニング可能な帯域通過グラフフィルタを用いて,よりリッチなグラフスペクトル帯域にポーズを分解する適応グラフ散乱を提案する。
第2の課題に対処するために、ボディパートは別々にモデル化され、多様なダイナミクスを学習し、空間的次元に沿ってより細かい特徴抽出を可能にする。
以上の2つの設計を統合し,新しいスケルトン分割グラフ散乱ネットワーク(SPGSN)を提案する。
モデルのコアはカスケードマルチパートグラフ散乱ブロック(mpgsbs)であり、様々なボディパーツに適応的なグラフ散乱を構築し、推定されたスペクトルの重要性とボディパートの相互作用に基づいて分解された特徴を融合する。
大規模な実験により、SPGSNは、Human3.6M、CMU Mocap、および3DPWデータセット上の関節位置誤差(MPJPE)当たりの3D平均の13.8%、9.3%、および2.7%の差で最先端の手法より優れていることが示されている。
関連論文リスト
- GSpect: Spectral Filtering for Cross-Scale Graph Classification [9.800723513820046]
クロススケールグラフ分類タスクのための高度なスペクトルグラフフィルタリングモデルであるGSpectを提案する。
オープンデータセットでは、GSpectは分類精度を平均1.62%改善し、ProteINSでは最大3.33%向上した。
GSpectは、クロススケールグラフ分類研究のギャップを埋め、脳疾患の診断のような応用研究を支援する可能性がある。
論文 参考訳(メタデータ) (2024-08-31T03:26:32Z) - Spatio-temporal MLP-graph network for 3D human pose estimation [8.267311047244881]
グラフ畳み込みネットワークとその変種は3次元人間のポーズ推定において大きな可能性を示している。
暗黙の伝搬フェアリングを用いたグラフフィルタリングにより得られる新しい重み付きヤコビ特徴則を導入する。
また, 関節間の関係を学習するために, 隣接変調を用いた。
論文 参考訳(メタデータ) (2023-08-29T14:00:55Z) - Iterative Graph Filtering Network for 3D Human Pose Estimation [5.177947445379688]
グラフ畳み込みネットワーク(GCN)は3次元人間のポーズ推定に有効な手法であることが証明されている。
本稿では,3次元ポーズ推定のための反復グラフフィルタリングフレームワークを提案する。
我々のアプローチは、ラプラシア正規化によるグラフフィルタリングを反復的に解くという考え方に基づいている。
論文 参考訳(メタデータ) (2023-07-29T20:46:44Z) - Hierarchical Graph Networks for 3D Human Pose Estimation [50.600944798627786]
最近の2次元から3次元の人間のポーズ推定は、人間の骨格のトポロジーによって形成されたグラフ構造を利用する傾向がある。
この骨格トポロジーは体の構造を反映するには小さすぎるため、重度の2次元から3次元のあいまいさに悩まされていると我々は主張する。
本稿では,これらの弱点を克服するために,新しいグラフ畳み込みネットワークアーキテクチャである階層グラフネットワークを提案する。
論文 参考訳(メタデータ) (2021-11-23T15:09:03Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - Conditional Directed Graph Convolution for 3D Human Pose Estimation [23.376538132362498]
グラフ畳み込みネットワークは、人間の骨格を非方向グラフとして表現することで、人間のポーズ推定を大幅に改善した。
本稿では,人間の骨格をノードとして,骨を親関節から子関節へ向けたエッジとして有向グラフとして表現することを提案する。
論文 参考訳(メタデータ) (2021-07-16T09:50:40Z) - 3D Human Pose Regression using Graph Convolutional Network [68.8204255655161]
本稿では,2次元のポーズから3次元のポーズ回帰を行うために,PoseGraphNetというグラフ畳み込みネットワークを提案する。
我々のモデルの性能は最先端に近いが、パラメータははるかに少ない。
論文 参考訳(メタデータ) (2021-05-21T14:41:31Z) - Disentangling and Unifying Graph Convolutions for Skeleton-Based Action
Recognition [79.33539539956186]
本稿では,マルチスケールグラフ畳み込みと,G3Dという空間時間グラフ畳み込み演算子を結合する簡単な方法を提案する。
これらの提案を結合することにより,MS-G3Dという強力な特徴抽出器を開発し,そのモデルが3つの大規模データセット上で従来の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-03-31T11:28:25Z) - Dynamic Multiscale Graph Neural Networks for 3D Skeleton-Based Human
Motion Prediction [102.9787019197379]
本研究では3次元骨格に基づく人体動作を予測するために,新しい動的マルチスケールグラフニューラルネットワーク(DMGNN)を提案する。
モデルはアクションカテゴリに依存しないもので、エンコーダ/デコーダフレームワークに従う。
提案したDMGNNは,短期および長期の予測において最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-03-17T02:49:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。