論文の概要: Graph Stacked Hourglass Networks for 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2103.16385v1
- Date: Tue, 30 Mar 2021 14:25:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-31 14:52:08.060143
- Title: Graph Stacked Hourglass Networks for 3D Human Pose Estimation
- Title(参考訳): 3次元ポーズ推定のためのグラフ重ね合わせ砂時計ネットワーク
- Authors: Tianhan Xu, Wataru Takano
- Abstract要約: 2次元から3次元のポーズ推定タスクのための新しいグラフ畳み込みネットワークアーキテクチャであるgraph stacked hourglass networkを提案する。
提案アーキテクチャは,人間の骨格表現の3つの異なるスケールでグラフ構造化特徴を処理した繰り返しエンコーダデコーダで構成されている。
- 参考スコア(独自算出の注目度): 1.0660480034605242
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel graph convolutional network architecture,
Graph Stacked Hourglass Networks, for 2D-to-3D human pose estimation tasks. The
proposed architecture consists of repeated encoder-decoder, in which
graph-structured features are processed across three different scales of human
skeletal representations. This multi-scale architecture enables the model to
learn both local and global feature representations, which are critical for 3D
human pose estimation. We also introduce a multi-level feature learning
approach using different-depth intermediate features and show the performance
improvements that result from exploiting multi-scale, multi-level feature
representations. Extensive experiments are conducted to validate our approach,
and the results show that our model outperforms the state-of-the-art.
- Abstract(参考訳): 本稿では,2次元から3次元の人間のポーズ推定のための新しいグラフ畳み込みネットワークアーキテクチャであるグラフ重畳ホアーグラスネットワークを提案する。
提案アーキテクチャは,人間の骨格表現の3つの異なるスケールでグラフ構造化特徴を処理した繰り返しエンコーダデコーダで構成されている。
このマルチスケールアーキテクチャにより、モデルは3次元の人間のポーズ推定に不可欠な局所的特徴表現と大域的特徴表現の両方を学ぶことができる。
また,異なる詳細な中間機能を用いたマルチレベル特徴学習手法を導入し,マルチスケール・マルチレベル特徴表現の活用による性能改善を示す。
我々のアプローチを検証するために広範な実験が行われ、その結果、我々のモデルが最先端を上回っていることが判明した。
関連論文リスト
- Implicit-Zoo: A Large-Scale Dataset of Neural Implicit Functions for 2D Images and 3D Scenes [65.22070581594426]
Implicit-Zoo"は、この分野の研究と開発を容易にするために、数千のGPUトレーニング日を必要とする大規模なデータセットである。
1)トランスモデルのトークン位置を学習すること、(2)NeRFモデルに関して直接3Dカメラが2D画像のポーズを取ること、である。
これにより、画像分類、セマンティックセグメンテーション、および3次元ポーズ回帰の3つのタスクすべてのパフォーマンスが向上し、研究のための新たな道が開けることになる。
論文 参考訳(メタデータ) (2024-06-25T10:20:44Z) - Multi-hop graph transformer network for 3D human pose estimation [4.696083734269233]
本稿では,2次元から3次元の人間のポーズ推定を目的としたマルチホップグラフトランスフォーマーネットワークを提案する。
提案するネットワークアーキテクチャは,多頭部自己注意層と学習可能な隣接行列を用いたグラフ畳み込みからなるグラフアテンションブロックで構成されている。
拡張畳み込み層の統合により、人体関節の正確な位置決めに必要な空間的一般化を扱う能力が向上する。
論文 参考訳(メタデータ) (2024-05-05T21:29:20Z) - Hierarchical Graph Networks for 3D Human Pose Estimation [50.600944798627786]
最近の2次元から3次元の人間のポーズ推定は、人間の骨格のトポロジーによって形成されたグラフ構造を利用する傾向がある。
この骨格トポロジーは体の構造を反映するには小さすぎるため、重度の2次元から3次元のあいまいさに悩まされていると我々は主張する。
本稿では,これらの弱点を克服するために,新しいグラフ畳み込みネットワークアーキテクチャである階層グラフネットワークを提案する。
論文 参考訳(メタデータ) (2021-11-23T15:09:03Z) - Higher-Order Implicit Fairing Networks for 3D Human Pose Estimation [1.1501261942096426]
2次元から3次元のポーズ推定のための初期残差接続を持つ高階グラフ畳み込みフレームワークを提案する。
我々のモデルは、体節間の長距離依存関係を捉えることができる。
2つの標準ベンチマークで行った実験と改善研究は、我々のモデルの有効性を実証した。
論文 参考訳(メタデータ) (2021-11-01T13:48:55Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - Auto-MVCNN: Neural Architecture Search for Multi-view 3D Shape
Recognition [16.13826056628379]
3Dシェイプ認識では、人間の視点を活かして3Dシェイプを解析し、大きな成果を上げています。
マルチビュー3D形状認識におけるアーキテクチャを最適化するために特に設計された,Auto-MVCNNというニューラルアーキテクチャ検索手法を提案する。
論文 参考訳(メタデータ) (2020-12-10T07:40:28Z) - Unsupervised Cross-Modal Alignment for Multi-Person 3D Pose Estimation [52.94078950641959]
マルチパーソン・ヒューマン・ポーズ推定のためのデプロイフレンドリーで高速なボトムアップ・フレームワークを提案する。
我々は,人物の位置を対応する3Dポーズ表現と統一する,多人数の3Dポーズのニューラル表現を採用する。
ペア化された2Dまたは3Dポーズアノテーションが利用できない実用的な配置パラダイムを提案する。
論文 参考訳(メタデータ) (2020-08-04T07:54:25Z) - HMOR: Hierarchical Multi-Person Ordinal Relations for Monocular
Multi-Person 3D Pose Estimation [54.23770284299979]
本稿では, 階層型多人数常連関係(HMOR)を新たに導入する。
HMORは相互作用情報を階層的に深さと角度の順序関係として符号化する。
統合トップダウンモデルは、学習プロセスにおけるこれらの順序関係を活用するように設計されている。
提案手法は, 公開されている多人数の3Dポーズデータセットにおいて, 最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-08-01T07:53:27Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。