論文の概要: Regular Splitting Graph Network for 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2305.05785v1
- Date: Tue, 9 May 2023 22:13:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-11 15:15:30.120518
- Title: Regular Splitting Graph Network for 3D Human Pose Estimation
- Title(参考訳): 3次元ポーズ推定のための正規分割グラフネットワーク
- Authors: Tanvir Hassan and A. Ben Hamza
- Abstract要約: 2次元から3次元の人間のポーズ推定のための高次正規分割グラフネットワーク(RS-Net)を提案する。
近年の3次元ポーズ推定における最先端手法よりも優れた性能を実現する。
- 参考スコア(独自算出の注目度): 5.177947445379688
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In human pose estimation methods based on graph convolutional architectures,
the human skeleton is usually modeled as an undirected graph whose nodes are
body joints and edges are connections between neighboring joints. However, most
of these methods tend to focus on learning relationships between body joints of
the skeleton using first-order neighbors, ignoring higher-order neighbors and
hence limiting their ability to exploit relationships between distant joints.
In this paper, we introduce a higher-order regular splitting graph network
(RS-Net) for 2D-to-3D human pose estimation using matrix splitting in
conjunction with weight and adjacency modulation. The core idea is to capture
long-range dependencies between body joints using multi-hop neighborhoods and
also to learn different modulation vectors for different body joints as well as
a modulation matrix added to the adjacency matrix associated to the skeleton.
This learnable modulation matrix helps adjust the graph structure by adding
extra graph edges in an effort to learn additional connections between body
joints. Instead of using a shared weight matrix for all neighboring body
joints, the proposed RS-Net model applies weight unsharing before aggregating
the feature vectors associated to the joints in order to capture the different
relations between them. Experiments and ablations studies performed on two
benchmark datasets demonstrate the effectiveness of our model, achieving
superior performance over recent state-of-the-art methods for 3D human pose
estimation.
- Abstract(参考訳): グラフ畳み込み構造に基づく人間のポーズ推定法では、人間の骨格は通常、ノードが身体関節であり、エッジが隣接関節間の接続である無向グラフとしてモデル化される。
しかし、これらの方法の多くは、一階隣人を用いて骨格の体節間の関係を学習することに集中し、高階隣人を無視し、遠方の関節間の関係を利用する能力を制限する傾向がある。
本稿では,重みと隣接変調を併用した行列分割を用いた2次元から3次元のポーズ推定のための高次正規分割グラフネットワーク(rs-net)を提案する。
中心となるアイデアは、マルチホップ近傍を用いて身体関節間の長距離依存性を捉え、異なる身体関節の異なる変調ベクトルや、骨格に付随する隣接マトリックスに加えられた変調行列を学習することである。
この学習可能な変調行列は、ボディジョイント間の追加接続を学ぶためにグラフエッジを追加することでグラフ構造を調整するのに役立つ。
提案したRS-Netモデルは, 隣り合うすべての関節に共有重み行列を使用する代わりに, 関節に付随する特徴ベクトルを集約する前に重み非共有を適用し, それらの関係を捉える。
2つのベンチマークデータセットで行った実験とアブレーション実験は、このモデルの有効性を示し、最近の3次元ポーズ推定法よりも優れた性能を達成する。
関連論文リスト
- 3D Hand Reconstruction via Aggregating Intra and Inter Graphs Guided by
Prior Knowledge for Hand-Object Interaction Scenario [8.364378460776832]
モデルベースおよびモデルフリーアプローチの利点を生かした3次元ハンドリコンストラクションネットワークを提案する。
まず,2次元関節から直接のMANOポーズパラメータ回帰モジュールを提案する。
論文 参考訳(メタデータ) (2024-03-04T05:11:26Z) - Spatio-temporal MLP-graph network for 3D human pose estimation [8.267311047244881]
グラフ畳み込みネットワークとその変種は3次元人間のポーズ推定において大きな可能性を示している。
暗黙の伝搬フェアリングを用いたグラフフィルタリングにより得られる新しい重み付きヤコビ特徴則を導入する。
また, 関節間の関係を学習するために, 隣接変調を用いた。
論文 参考訳(メタデータ) (2023-08-29T14:00:55Z) - Iterative Graph Filtering Network for 3D Human Pose Estimation [5.177947445379688]
グラフ畳み込みネットワーク(GCN)は3次元人間のポーズ推定に有効な手法であることが証明されている。
本稿では,3次元ポーズ推定のための反復グラフフィルタリングフレームワークを提案する。
我々のアプローチは、ラプラシア正規化によるグラフフィルタリングを反復的に解くという考え方に基づいている。
論文 参考訳(メタデータ) (2023-07-29T20:46:44Z) - Skeleton-Parted Graph Scattering Networks for 3D Human Motion Prediction [120.08257447708503]
体-関節関係をモデル化するグラフ畳み込みネットワークに基づく手法は,最近3次元骨格に基づく人間の動作予測において大きな可能性を示唆している。
骨格分割グラフ散乱ネットワーク(SPGSN)を提案する。
SPGSNは、Human3.6M、CMU Mocap、および3DPWデータセット上で、関節位置誤差(MPJPE)当たりの3D平均の13.8%、9.3%、および2.7%の差で最先端の手法を上回っている。
論文 参考訳(メタデータ) (2022-07-31T05:51:39Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - Conditional Directed Graph Convolution for 3D Human Pose Estimation [23.376538132362498]
グラフ畳み込みネットワークは、人間の骨格を非方向グラフとして表現することで、人間のポーズ推定を大幅に改善した。
本稿では,人間の骨格をノードとして,骨を親関節から子関節へ向けたエッジとして有向グラフとして表現することを提案する。
論文 参考訳(メタデータ) (2021-07-16T09:50:40Z) - A hybrid classification-regression approach for 3D hand pose estimation
using graph convolutional networks [1.0152838128195467]
目的ごとの関係制約を学習する2段階のGCNベースのフレームワークを提案する。
第1フェーズは2D/3D空間を量子化し、その局所性に基づいて関節を2D/3Dブロックに分類する。
第2段階ではGCNベースのモジュールを使用し、隣り合う適応アルゴリズムを用いて関節関係を決定する。
論文 参考訳(メタデータ) (2021-05-23T10:09:10Z) - 3D Human Pose Regression using Graph Convolutional Network [68.8204255655161]
本稿では,2次元のポーズから3次元のポーズ回帰を行うために,PoseGraphNetというグラフ畳み込みネットワークを提案する。
我々のモデルの性能は最先端に近いが、パラメータははるかに少ない。
論文 参考訳(メタデータ) (2021-05-21T14:41:31Z) - Revisiting Skeleton-based Action Recognition [107.08112310075114]
PoseC3Dは骨格に基づく行動認識の新しいアプローチであり、代わりに人間の骨格のベース表現としてグラフシーケンスを積み重ねる3Dヒートマップに依存している。
4つの挑戦的なデータセットにおいて、PoseC3Dは、スケルトン上で単独で使用し、RGBモダリティと組み合わせることで、常に優れたパフォーマンスを得る。
論文 参考訳(メタデータ) (2021-04-28T06:32:17Z) - MotioNet: 3D Human Motion Reconstruction from Monocular Video with
Skeleton Consistency [72.82534577726334]
モノクロビデオから3次元人間の骨格の動きを直接再構成するディープニューラルネットワークであるMotioNetを紹介した。
本手法は,動作表現を完全かつ一般的に使用するキネマティックスケルトンを直接出力する最初のデータ駆動型手法である。
論文 参考訳(メタデータ) (2020-06-22T08:50:09Z) - Disentangling and Unifying Graph Convolutions for Skeleton-Based Action
Recognition [79.33539539956186]
本稿では,マルチスケールグラフ畳み込みと,G3Dという空間時間グラフ畳み込み演算子を結合する簡単な方法を提案する。
これらの提案を結合することにより,MS-G3Dという強力な特徴抽出器を開発し,そのモデルが3つの大規模データセット上で従来の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-03-31T11:28:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。