論文の概要: Hierarchical Graph Networks for 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2111.11927v1
- Date: Tue, 23 Nov 2021 15:09:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-24 15:23:47.037476
- Title: Hierarchical Graph Networks for 3D Human Pose Estimation
- Title(参考訳): 3次元ポーズ推定のための階層グラフネットワーク
- Authors: Han Li and Bowen Shi and Wenrui Dai and Yabo Chen and Botao Wang and
Yu Sun and Min Guo and Chenlin Li and Junni Zou and Hongkai Xiong
- Abstract要約: 階層グラフネットワーク(HGN)という新しいグラフ畳み込みネットワークアーキテクチャを提案する。
これは、我々のマルチスケールグラフ構造構築戦略によって生成されるより密度の高いグラフトポロジーに基づいている。
我々のHGNは,ネットワークパラメータを減らして最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 43.14013027728559
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent 2D-to-3D human pose estimation works tend to utilize the graph
structure formed by the topology of the human skeleton. However, we argue that
this skeletal topology is too sparse to reflect the body structure and suffer
from serious 2D-to-3D ambiguity problem. To overcome these weaknesses, we
propose a novel graph convolution network architecture, Hierarchical Graph
Networks (HGN). It is based on denser graph topology generated by our
multi-scale graph structure building strategy, thus providing more delicate
geometric information. The proposed architecture contains three sparse-to-fine
representation subnetworks organized in parallel, in which multi-scale
graph-structured features are processed and exchange information through a
novel feature fusion strategy, leading to rich hierarchical representations. We
also introduce a 3D coarse mesh constraint to further boost detail-related
feature learning. Extensive experiments demonstrate that our HGN achieves the
state-of-the art performance with reduced network parameters
- Abstract(参考訳): 最近の2次元から3次元の人間のポーズ推定は、人間の骨格のトポロジーによって形成されるグラフ構造を利用する傾向がある。
しかし,この骨格トポロジーは体の構造を反映するには小さすぎるため,重度の2次元から3次元の曖昧さに悩まされている。
これらの弱点を克服するために、新しいグラフ畳み込みネットワークアーキテクチャ、階層グラフネットワーク(HGN)を提案する。
これは、多スケールグラフ構造構築戦略によって生成された密度の高いグラフトポロジーに基づいており、より繊細な幾何学的情報を提供する。
提案するアーキテクチャは3つのスパース・ツー・ファイン表現サブネットワークを並列に構成し,マルチスケールのグラフ構造特徴を処理し,新しい特徴融合戦略により情報を交換することで,リッチな階層表現を実現する。
また,詳細な特徴学習をさらに促進するために,3次元粗いメッシュ制約を導入する。
我々のHGNがネットワークパラメータを減らして最先端の性能を達成することを実証した大規模な実験
関連論文リスト
- Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - Deep Manifold Graph Auto-Encoder for Attributed Graph Embedding [51.75091298017941]
本稿では,属性付きグラフデータに対する新しいDeep Manifold (Variational) Graph Auto-Encoder (DMVGAE/DMGAE)を提案する。
提案手法は,最先端のベースラインアルゴリズムを,一般的なデータセット間でのダウンストリームタスクの差を大きく越える。
論文 参考訳(メタデータ) (2024-01-12T17:57:07Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Joint 3D Human Shape Recovery from A Single Imag with Bilayer-Graph [35.375489948345404]
画像から3次元の人物形状とポーズを推定するための2次元グラフ手法を提案する。
密なグラフから得られた粗いグラフを用いて、人間の3次元のポーズを推定し、密なグラフを使って3次元の形状を推定する。
エンド・ツー・エンドのモデルをトレーニングし、いくつかの評価データセットに対して最先端の結果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-16T05:04:02Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - Dense Graph Convolutional Neural Networks on 3D Meshes for 3D Object
Segmentation and Classification [0.0]
本稿では3次元メッシュ上でのグラフ畳み込みニューラルネットワーク(GCN)の設計について述べる。
メッシュの顔を基本処理単位とし、各ノードが顔に対応するグラフとして3Dメッシュを表現する。
論文 参考訳(メタデータ) (2021-06-30T02:17:16Z) - Graph Stacked Hourglass Networks for 3D Human Pose Estimation [1.0660480034605242]
2次元から3次元のポーズ推定タスクのための新しいグラフ畳み込みネットワークアーキテクチャであるgraph stacked hourglass networkを提案する。
提案アーキテクチャは,人間の骨格表現の3つの異なるスケールでグラフ構造化特徴を処理した繰り返しエンコーダデコーダで構成されている。
論文 参考訳(メタデータ) (2021-03-30T14:25:43Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - Geom-GCN: Geometric Graph Convolutional Networks [15.783571061254847]
本稿では,この2つの弱点を克服するために,グラフニューラルネットワークのための新しい幾何集約手法を提案する。
提案したアグリゲーションスキームは置換不変であり、ノード埋め込み、構造近傍、二レベルアグリゲーションという3つのモジュールから構成される。
また,このスキームをGeom-GCNと呼ばれるグラフ畳み込みネットワークに実装し,グラフ上でトランスダクティブ学習を行う。
論文 参考訳(メタデータ) (2020-02-13T00:03:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。