論文の概要: Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images
- arxiv url: http://arxiv.org/abs/2109.05885v1
- Date: Mon, 13 Sep 2021 11:44:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-15 00:39:47.199521
- Title: Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images
- Title(参考訳): マルチビュー画像を用いたグラフベース3次元マルチパーソンポーズ推定
- Authors: Size Wu, Sheng Jin, Wentao Liu, Lei Bai, Chen Qian, Dong Liu, Wanli
Ouyang
- Abstract要約: 我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
- 参考スコア(独自算出の注目度): 79.70127290464514
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper studies the task of estimating the 3D human poses of multiple
persons from multiple calibrated camera views. Following the top-down paradigm,
we decompose the task into two stages, i.e. person localization and pose
estimation. Both stages are processed in coarse-to-fine manners. And we propose
three task-specific graph neural networks for effective message passing. For 3D
person localization, we first use Multi-view Matching Graph Module (MMG) to
learn the cross-view association and recover coarse human proposals. The Center
Refinement Graph Module (CRG) further refines the results via flexible
point-based prediction. For 3D pose estimation, the Pose Regression Graph
Module (PRG) learns both the multi-view geometry and structural relations
between human joints. Our approach achieves state-of-the-art performance on CMU
Panoptic and Shelf datasets with significantly lower computation complexity.
- Abstract(参考訳): 本稿では,複数のキャリブレーションカメラから複数の人物の3次元ポーズを推定する作業について検討する。
トップダウンのパラダイムに従って、タスクを2つのステージ、すなわち人物のローカライゼーションとポーズ推定に分解する。
どちらの段階も粗い方法で処理される。
また,効果的なメッセージパッシングのためのタスク固有グラフニューラルネットワークを3つ提案する。
3次元パーソナライズのために、まず、マルチビューマッチンググラフモジュール(mmg)を使用して、クロスビューアソシエーションを学び、粗い人間の提案を回収する。
センターリファインメントグラフモジュール(crg)は、フレキシブルなポイントベースの予測によって結果をさらに洗練する。
3次元ポーズ推定のために、Pose Regression Graph Module (PRG)は、多視点形状と人間の関節の構造的関係の両方を学ぶ。
提案手法はCMU Panoptic と Shelf のデータセットに対して,計算処理の複雑さを大幅に低減した最先端性能を実現する。
関連論文リスト
- Multi-hop graph transformer network for 3D human pose estimation [4.696083734269233]
本稿では,2次元から3次元の人間のポーズ推定を目的としたマルチホップグラフトランスフォーマーネットワークを提案する。
提案するネットワークアーキテクチャは,多頭部自己注意層と学習可能な隣接行列を用いたグラフ畳み込みからなるグラフアテンションブロックで構成されている。
拡張畳み込み層の統合により、人体関節の正確な位置決めに必要な空間的一般化を扱う能力が向上する。
論文 参考訳(メタデータ) (2024-05-05T21:29:20Z) - Iterative Graph Filtering Network for 3D Human Pose Estimation [5.177947445379688]
グラフ畳み込みネットワーク(GCN)は3次元人間のポーズ推定に有効な手法であることが証明されている。
本稿では,3次元ポーズ推定のための反復グラフフィルタリングフレームワークを提案する。
我々のアプローチは、ラプラシア正規化によるグラフフィルタリングを反復的に解くという考え方に基づいている。
論文 参考訳(メタデータ) (2023-07-29T20:46:44Z) - Direct Multi-view Multi-person 3D Pose Estimation [138.48139701871213]
マルチビュー画像からマルチパーソン3Dポーズを推定するためのMulti-view Pose Transformer(MvP)を提案する。
MvPは、中間タスクに頼ることなく、複数の人物の3Dポーズを直接クリーンで効率的な方法で回帰する。
我々は,MvPモデルがより効率的でありながら,いくつかのベンチマークにおいて最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-07T13:09:20Z) - 3D Human Pose Regression using Graph Convolutional Network [68.8204255655161]
本稿では,2次元のポーズから3次元のポーズ回帰を行うために,PoseGraphNetというグラフ畳み込みネットワークを提案する。
我々のモデルの性能は最先端に近いが、パラメータははるかに少ない。
論文 参考訳(メタデータ) (2021-05-21T14:41:31Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - Graph Stacked Hourglass Networks for 3D Human Pose Estimation [1.0660480034605242]
2次元から3次元のポーズ推定タスクのための新しいグラフ畳み込みネットワークアーキテクチャであるgraph stacked hourglass networkを提案する。
提案アーキテクチャは,人間の骨格表現の3つの異なるスケールでグラフ構造化特徴を処理した繰り返しエンコーダデコーダで構成されている。
論文 参考訳(メタデータ) (2021-03-30T14:25:43Z) - Self-Supervised Multi-View Synchronization Learning for 3D Pose
Estimation [39.334995719523]
現在の方法では、画像の大規模なデータセットと対応するスケルトンポーズに基づいてニューラルネットワークをトレーニングすることで、学習問題としてモノラルな3次元ポーズ推定が採用されている。
そこで本稿では,ラベルなしデータセットの自己教師付き学習を通じて事前学習した微調整ネットワークによって,小さな注釈付きデータセットを活用できるアプローチを提案する。
我々は,Human3.6Mデータセット上での同期タスクの有効性を実証し,人間の3次元ポーズ推定における最先端結果を実現する。
論文 参考訳(メタデータ) (2020-10-13T08:01:24Z) - Unsupervised Cross-Modal Alignment for Multi-Person 3D Pose Estimation [52.94078950641959]
マルチパーソン・ヒューマン・ポーズ推定のためのデプロイフレンドリーで高速なボトムアップ・フレームワークを提案する。
我々は,人物の位置を対応する3Dポーズ表現と統一する,多人数の3Dポーズのニューラル表現を採用する。
ペア化された2Dまたは3Dポーズアノテーションが利用できない実用的な配置パラダイムを提案する。
論文 参考訳(メタデータ) (2020-08-04T07:54:25Z) - Fusing Wearable IMUs with Multi-View Images for Human Pose Estimation: A
Geometric Approach [76.10879433430466]
多視点画像と人手足に装着したIMUから3次元人間のポーズを推定する。
まず2つの信号から2Dのポーズを検出し、3D空間に持ち上げる。
単純な2段階のアプローチは、公開データセット上の大きなマージンによる最先端のエラーを低減する。
論文 参考訳(メタデータ) (2020-03-25T00:26:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。