Fugu-MT 論文翻訳(概要): ZoomNAS: Searching for Whole-body Human Pose Estimation in the Wild

論文の概要: ZoomNAS: Searching for Whole-body Human Pose Estimation in the Wild

arxiv url: http://arxiv.org/abs/2208.11547v1
Date: Tue, 23 Aug 2022 16:33:57 GMT
ステータス: 翻訳完了
システム内更新日: 2022-08-25 12:58:56.497498
Title: ZoomNAS: Searching for Whole-body Human Pose Estimation in the Wild
Title（参考訳）: zoomnas: 野生動物における全身人間のポーズ推定の探索
Authors: Lumin Xu, Sheng Jin, Wentao Liu, Chen Qian, Wanli Ouyang, Ping Luo, Xiaogang Wang
Abstract要約: 本研究では,全身の階層構造を考慮したシングルネットワーク方式ZoomNetを提案する。また,全身のポーズ推定の精度と効率を両立させるために,ZoomNASと呼ばれるニューラルネットワーク検索フレームワークを提案する。 ZoomNASをトレーニングし,評価するために,最初の大規模2次元人体データセットであるCOCO-WholeBody V1.0を導入する。
参考スコア（独自算出の注目度）: 97.0025378036642
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper investigates the task of 2D whole-body human pose estimation, which aims to localize dense landmarks on the entire human body including body, feet, face, and hands. We propose a single-network approach, termed ZoomNet, to take into account the hierarchical structure of the full human body and solve the scale variation of different body parts. We further propose a neural architecture search framework, termed ZoomNAS, to promote both the accuracy and efficiency of whole-body pose estimation. ZoomNAS jointly searches the model architecture and the connections between different sub-modules, and automatically allocates computational complexity for searched sub-modules. To train and evaluate ZoomNAS, we introduce the first large-scale 2D human whole-body dataset, namely COCO-WholeBody V1.0, which annotates 133 keypoints for in-the-wild images. Extensive experiments demonstrate the effectiveness of ZoomNAS and the significance of COCO-WholeBody V1.0.
Abstract（参考訳）: 本研究は,人体,足,顔,手など,人体全体に密集したランドマークを局在させることを目的とした2次元人体ポーズ推定の課題について検討する。本稿では,人体の階層構造を考慮した単一ネットワークアプローチであるzoomnetを提案する。さらに,体全体のポーズ推定の精度と効率を高めるために,zoomnasと呼ばれるニューラルネットワーク探索フレームワークを提案する。 zoomnasはモデルアーキテクチャと異なるサブモジュール間の接続を共同で検索し、検索されたサブモジュールの計算複雑性を自動的に割り当てる。 ZoomNASをトレーニングし評価するために,最初の大規模2次元人体データセットであるCOCO-WholeBody V1.0を導入する。実験はZoomNASの有効性とCOCO-WholeBody V1.0の意義を実証した。

関連論文リスト

Reconstructing People, Places, and Cameras [57.81696692335401]
Humans and Structure from Motion (HSfM) は、メカニカルワールド座標系において、複数の人メッシュ、シーンポイント雲、カメラパラメータを共同で再構築する手法である。以上の結果から,SfMパイプラインに人体データを組み込むことで,カメラのポーズ推定が改善された。
論文参考訳（メタデータ） (2024-12-23T18:58:34Z)
WHAC: World-grounded Humans and Cameras [37.877565981937586]
我々は,表現的パラメトリック人間モデル(SMPL-X)と対応するカメラのポーズを共同で再現することを目指している。 WHACと呼ばれる新しいフレームワークを導入し、世界規模で表現された人間のポーズと形状の推定を容易にする。我々は、正確に注釈付けされた人間とカメラを含む新しい合成データセットWHAC-A-Moleを提案する。
論文参考訳（メタデータ） (2024-03-19T17:58:02Z)
MUC: Mixture of Uncalibrated Cameras for Robust 3D Human Body Reconstruction [12.942635715952525]
複数のカメラは、人物の包括的なマルチビュービデオカバレッジを提供することができる。以前の研究では、複数の視点の下で自己排除によって生じる課題を見落としていた。複数のカメラビューから3次元人体を再構築する手法を提案する。
論文参考訳（メタデータ） (2024-03-08T05:03:25Z)
Full-Body Articulated Human-Object Interaction [61.01135739641217]
CHAIRSは16.2時間の多目的相互作用からなる大規模な動きキャプチャーされたf-AHOIデータセットである。 CHAIRSは、対話的なプロセス全体を通して、人間と明瞭なオブジェクトの両方の3Dメッシュを提供する。 HOIにおける幾何学的関係を学習することにより,人間のポーズ推定を利用した最初のモデルが考案された。
論文参考訳（メタデータ） (2022-12-20T19:50:54Z)
Higher-Order Implicit Fairing Networks for 3D Human Pose Estimation [1.1501261942096426]
2次元から3次元のポーズ推定のための初期残差接続を持つ高階グラフ畳み込みフレームワークを提案する。我々のモデルは、体節間の長距離依存関係を捉えることができる。 2つの標準ベンチマークで行った実験と改善研究は、我々のモデルの有効性を実証した。
論文参考訳（メタデータ） (2021-11-01T13:48:55Z)
Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2021-09-13T11:44:07Z)
Pose-based Modular Network for Human-Object Interaction Detection [5.6397911482914385]
提案するPose-based Modular Network (PMN) は,絶対的なポーズ特徴と相対的な空間的ポーズ特徴を探索し,HOI検出を改善する。提案手法を評価するため,VS-GATと呼ばれる最新技術モデルと組み合わせ,2つの公開ベンチマークにおいて大幅な改善が得られた。
論文参考訳（メタデータ） (2020-08-05T10:56:09Z)
Whole-Body Human Pose Estimation in the Wild [88.09875133989155]
COCO-WholeBodyは、全体アノテーションでCOCOデータセットを拡張する。これは人体全体に手動のアノテーションがある最初のベンチマークである。 ZoomNetという名前のシングルネットワークモデルは、完全な人体の階層構造を考慮するために考案された。
論文参考訳（メタデータ） (2020-07-23T08:35:26Z)
HDNet: Human Depth Estimation for Multi-Person Camera-Space Localization [83.57863764231655]
本稿では,根の絶対的局所化のためのエンドツーエンドフレームワークであるHuman Depth Estimation Network (HDNet)を提案する。関節間の特徴伝達に骨格ベースのグラフニューラルネットワーク(GNN)を用いる。我々は,2つのベンチマークデータセットを用いて,ルートジョイントローカライゼーションとルート相対的な3次元ポーズ推定タスクについて,HDNetの評価を行った。
論文参考訳（メタデータ） (2020-07-17T12:44:23Z)
Anatomy-aware 3D Human Pose Estimation with Bone-based Pose Decomposition [92.99291528676021]
3次元関節位置を直接回帰するのではなく,骨方向予測と骨長予測に分解する。私たちのモチベーションは、人間の骨格の骨の長さが時間とともに一定であることにあります。我々の完全なモデルは、Human3.6MとMPI-INF-3DHPデータセットにおいて、以前の最高の結果よりも優れています。
論文参考訳（メタデータ） (2020-02-24T15:49:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。