論文の概要: ZoomNAS: Searching for Whole-body Human Pose Estimation in the Wild
- arxiv url: http://arxiv.org/abs/2208.11547v1
- Date: Tue, 23 Aug 2022 16:33:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-25 12:58:56.497498
- Title: ZoomNAS: Searching for Whole-body Human Pose Estimation in the Wild
- Title(参考訳): zoomnas: 野生動物における全身人間のポーズ推定の探索
- Authors: Lumin Xu, Sheng Jin, Wentao Liu, Chen Qian, Wanli Ouyang, Ping Luo,
Xiaogang Wang
- Abstract要約: 本研究では,全身の階層構造を考慮したシングルネットワーク方式ZoomNetを提案する。
また,全身のポーズ推定の精度と効率を両立させるために,ZoomNASと呼ばれるニューラルネットワーク検索フレームワークを提案する。
ZoomNASをトレーニングし,評価するために,最初の大規模2次元人体データセットであるCOCO-WholeBody V1.0を導入する。
- 参考スコア(独自算出の注目度): 97.0025378036642
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates the task of 2D whole-body human pose estimation,
which aims to localize dense landmarks on the entire human body including body,
feet, face, and hands. We propose a single-network approach, termed ZoomNet, to
take into account the hierarchical structure of the full human body and solve
the scale variation of different body parts. We further propose a neural
architecture search framework, termed ZoomNAS, to promote both the accuracy and
efficiency of whole-body pose estimation. ZoomNAS jointly searches the model
architecture and the connections between different sub-modules, and
automatically allocates computational complexity for searched sub-modules. To
train and evaluate ZoomNAS, we introduce the first large-scale 2D human
whole-body dataset, namely COCO-WholeBody V1.0, which annotates 133 keypoints
for in-the-wild images. Extensive experiments demonstrate the effectiveness of
ZoomNAS and the significance of COCO-WholeBody V1.0.
- Abstract(参考訳): 本研究は,人体,足,顔,手など,人体全体に密集したランドマークを局在させることを目的とした2次元人体ポーズ推定の課題について検討する。
本稿では,人体の階層構造を考慮した単一ネットワークアプローチであるzoomnetを提案する。
さらに,体全体のポーズ推定の精度と効率を高めるために,zoomnasと呼ばれるニューラルネットワーク探索フレームワークを提案する。
zoomnasはモデルアーキテクチャと異なるサブモジュール間の接続を共同で検索し、検索されたサブモジュールの計算複雑性を自動的に割り当てる。
ZoomNASをトレーニングし評価するために,最初の大規模2次元人体データセットであるCOCO-WholeBody V1.0を導入する。
実験はZoomNASの有効性とCOCO-WholeBody V1.0の意義を実証した。
関連論文リスト
- Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot [15.975753370100051]
単一のRGB画像からマルチパーソンな3次元メッシュリカバリのための強力なシングルショットモデルであるMulti-HMRを提案する。
SMPL-Xパラメトリックモデルを用いて、手や表情を含む全身を予測する。
このデータセットをトレーニングに組み込むことで、特に手による予測をさらに強化できることが示される。
論文 参考訳(メタデータ) (2024-02-22T16:05:13Z) - Full-Body Articulated Human-Object Interaction [61.01135739641217]
CHAIRSは16.2時間の多目的相互作用からなる大規模な動きキャプチャーされたf-AHOIデータセットである。
CHAIRSは、対話的なプロセス全体を通して、人間と明瞭なオブジェクトの両方の3Dメッシュを提供する。
HOIにおける幾何学的関係を学習することにより,人間のポーズ推定を利用した最初のモデルが考案された。
論文 参考訳(メタデータ) (2022-12-20T19:50:54Z) - A Skeleton-aware Graph Convolutional Network for Human-Object
Interaction Detection [14.900704382194013]
そこで我々は,SGCN4HOIという人-物間相互作用検出のためのスケルトン対応グラフ畳み込みネットワークを提案する。
我々のネットワークは、人間のキーポイントとオブジェクトキーポイントの間の空間的接続を利用して、グラフの畳み込みによるきめ細かい構造的相互作用を捉えます。
このような幾何学的特徴と視覚的特徴と、人間と物体のペアから得られる空間的構成特徴を融合させる。
論文 参考訳(メタデータ) (2022-07-11T15:20:18Z) - Higher-Order Implicit Fairing Networks for 3D Human Pose Estimation [1.1501261942096426]
2次元から3次元のポーズ推定のための初期残差接続を持つ高階グラフ畳み込みフレームワークを提案する。
我々のモデルは、体節間の長距離依存関係を捉えることができる。
2つの標準ベンチマークで行った実験と改善研究は、我々のモデルの有効性を実証した。
論文 参考訳(メタデータ) (2021-11-01T13:48:55Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - Pose-based Modular Network for Human-Object Interaction Detection [5.6397911482914385]
提案するPose-based Modular Network (PMN) は,絶対的なポーズ特徴と相対的な空間的ポーズ特徴を探索し,HOI検出を改善する。
提案手法を評価するため,VS-GATと呼ばれる最新技術モデルと組み合わせ,2つの公開ベンチマークにおいて大幅な改善が得られた。
論文 参考訳(メタデータ) (2020-08-05T10:56:09Z) - Whole-Body Human Pose Estimation in the Wild [88.09875133989155]
COCO-WholeBodyは、全体アノテーションでCOCOデータセットを拡張する。
これは人体全体に手動のアノテーションがある最初のベンチマークである。
ZoomNetという名前のシングルネットワークモデルは、完全な人体の階層構造を考慮するために考案された。
論文 参考訳(メタデータ) (2020-07-23T08:35:26Z) - HDNet: Human Depth Estimation for Multi-Person Camera-Space Localization [83.57863764231655]
本稿では,根の絶対的局所化のためのエンドツーエンドフレームワークであるHuman Depth Estimation Network (HDNet)を提案する。
関節間の特徴伝達に骨格ベースのグラフニューラルネットワーク(GNN)を用いる。
我々は,2つのベンチマークデータセットを用いて,ルートジョイントローカライゼーションとルート相対的な3次元ポーズ推定タスクについて,HDNetの評価を行った。
論文 参考訳(メタデータ) (2020-07-17T12:44:23Z) - Anatomy-aware 3D Human Pose Estimation with Bone-based Pose
Decomposition [92.99291528676021]
3次元関節位置を直接回帰するのではなく,骨方向予測と骨長予測に分解する。
私たちのモチベーションは、人間の骨格の骨の長さが時間とともに一定であることにあります。
我々の完全なモデルは、Human3.6MとMPI-INF-3DHPデータセットにおいて、以前の最高の結果よりも優れています。
論文 参考訳(メタデータ) (2020-02-24T15:49:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。