論文の概要: PI-Net: Pose Interacting Network for Multi-Person Monocular 3D Pose
Estimation
- arxiv url: http://arxiv.org/abs/2010.05302v1
- Date: Sun, 11 Oct 2020 17:58:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 13:41:07.569375
- Title: PI-Net: Pose Interacting Network for Multi-Person Monocular 3D Pose
Estimation
- Title(参考訳): pi-net:多人数単眼3次元ポーズ推定のためのポーズインタラクションネットワーク
- Authors: Wen Guo, Enric Corona, Francesc Moreno-Noguer, Xavier Alameda-Pineda
- Abstract要約: 毎日の多くの状況では、人々は交流しており、個人のポーズは、その相手のポーズに依存する。
本稿では,この依存性を利用して3次元単眼のポーズ推定を行う深層ネットワークについて検討する。
我々のポーズ相互作用ネットワーク(PI-Net)は、対話者の変動数の初期ポーズ推定値を、興味のある人のポーズを洗練するために使用される繰り返しアーキテクチャに入力する。
- 参考スコア(独自算出の注目度): 45.38242801270147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent literature addressed the monocular 3D pose estimation task very
satisfactorily. In these studies, different persons are usually treated as
independent pose instances to estimate. However, in many every-day situations,
people are interacting, and the pose of an individual depends on the pose of
his/her interactees. In this paper, we investigate how to exploit this
dependency to enhance current - and possibly future - deep networks for 3D
monocular pose estimation. Our pose interacting network, or PI-Net, inputs the
initial pose estimates of a variable number of interactees into a recurrent
architecture used to refine the pose of the person-of-interest. Evaluating such
a method is challenging due to the limited availability of public annotated
multi-person 3D human pose datasets. We demonstrate the effectiveness of our
method in the MuPoTS dataset, setting the new state-of-the-art on it.
Qualitative results on other multi-person datasets (for which 3D pose
ground-truth is not available) showcase the proposed PI-Net. PI-Net is
implemented in PyTorch and the code will be made available upon acceptance of
the paper.
- Abstract(参考訳): 近年の文献では、単眼の3Dポーズ推定が極めて良好である。
これらの研究において、異なる人物は通常、推定のための独立したポーズインスタンスとして扱われる。
しかし、毎日の多くの状況において、人々は相互作用し、個人のポーズは、その相互作用者のポーズに依存する。
本稿では,この依存性を活用して,現在およびおそらく将来の深層ネットワークを3次元単眼的ポーズ推定に活用する方法について検討する。
我々のポーズ相互作用ネットワーク(PI-Net)は、対話者の変動数の初期ポーズ推定値を、興味のある人のポーズを洗練するために使用される繰り返しアーキテクチャに入力する。
このような方法の評価は、公開注釈付きマルチパーソン3dポーズデータセットの可用性が限られているため、難しい。
本手法の有効性をmupotsデータセットで実証し,その上で新たな最先端の設定を行う。
他のマルチパーソンデータセット(3dポーズは使用できない)の質的結果が提案されているpi-netを示している。
pi-netはpytorchで実装されており、コードは論文が受け入れられると利用可能になる。
関連論文リスト
- PedRecNet: Multi-task deep neural network for full 3D human pose and
orientation estimation [0.0]
マルチタスクネットワークは、様々なディープニューラルネットワークベースの歩行者検出機能をサポートしている。
ネットワークアーキテクチャは比較的単純だが強力であり、さらなる研究や応用にも容易に適応できる。
論文 参考訳(メタデータ) (2022-04-25T10:47:01Z) - Permutation-Invariant Relational Network for Multi-person 3D Pose
Estimation [46.38290735670527]
単一のRGB画像から複数の人物の3Dポーズを復元することは、非常に不適切な問題である。
近年の研究では、異なる人物の推論を同時に行うことで、地域内のすべての事例において有望な成果を上げている。
PI-Netは、画像中のすべての人を同時に推論するための自己注意ブロックを導入し、ノイズの多い最初の3Dポーズを洗練します。
本稿では,集合変換器上に構築された置換不変な手法を用いて,人間同士の相互作用全体を,その数と独立にモデル化する。
論文 参考訳(メタデータ) (2022-04-11T07:23:54Z) - VoxelTrack: Multi-Person 3D Human Pose Estimation and Tracking in the
Wild [98.69191256693703]
本稿では,VoxelTrackを用いて,多人数の3次元ポーズ推定と,広義のベースラインで分離された少数のカメラからの追跡を行う。
マルチブランチネットワークを使用して、環境中のすべての人に3Dポーズと再識別機能(Re-ID)を共同で推定する。
これは、Shelf、Campus、CMU Panopticの3つの公開データセットに対して、最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2021-08-05T08:35:44Z) - PandaNet : Anchor-Based Single-Shot Multi-Person 3D Pose Estimation [35.791868530073955]
PandaNetは、新しいシングルショット、アンカーベース、マルチパーソナライズされた3Dポーズ推定手法である。
提案モデルは境界ボックス検出を行い,検出者毎に2次元および3次元ポーズ回帰を1回のフォワードパスに設定する。
ネットワークが各バウンディングボックスの完全な3Dポーズを予測するため、関節を再グループ化するための後処理は不要である。
論文 参考訳(メタデータ) (2021-01-07T10:32:17Z) - HMOR: Hierarchical Multi-Person Ordinal Relations for Monocular
Multi-Person 3D Pose Estimation [54.23770284299979]
本稿では, 階層型多人数常連関係(HMOR)を新たに導入する。
HMORは相互作用情報を階層的に深さと角度の順序関係として符号化する。
統合トップダウンモデルは、学習プロセスにおけるこれらの順序関係を活用するように設計されている。
提案手法は, 公開されている多人数の3Dポーズデータセットにおいて, 最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-08-01T07:53:27Z) - Unsupervised 3D Human Pose Representation with Viewpoint and Pose
Disentanglement [63.853412753242615]
優れた3次元ポーズ表現を学習することは、人間のポーズ関連タスクにとって重要である。
本稿では,3次元ポーズ表現を学習するために,新しいシームズ・デノナイズドオートエンコーダを提案する。
提案手法は,2つの本質的に異なるタスクに対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-07-14T14:25:22Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z) - Multi-Person Absolute 3D Human Pose Estimation with Weak Depth
Supervision [0.0]
弱教師付きでRGB-D画像を追加してトレーニングできるネットワークを導入する。
我々のアルゴリズムは、単眼で、多人、絶対的なポーズ推定器である。
アルゴリズムを複数のベンチマークで評価し,一貫した誤差率の向上を示した。
論文 参考訳(メタデータ) (2020-04-08T13:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。