論文の概要: Multi-Hypothesis Pose Networks: Rethinking Top-Down Pose Estimation
- arxiv url: http://arxiv.org/abs/2101.11223v1
- Date: Wed, 27 Jan 2021 06:51:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-02 03:52:05.634070
- Title: Multi-Hypothesis Pose Networks: Rethinking Top-Down Pose Estimation
- Title(参考訳): マルチHypothesis Pose Networks: Rethinking Top-Down Pose Estimations
- Authors: Rawal Khirodkar, Visesh Chari, Amit Agrawal, Ambrish Tyagi
- Abstract要約: MHPNet(Multi-Hypothesis Pose Network)は、与えられたバウンディングボックス内で複数の2Dポーズを予測することができる。
提案手法の有効性を,COCO,CrowdPose,OCHumanデータセットを用いて評価した。
- 参考スコア(独自算出の注目度): 8.512021564439639
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A key assumption of top-down human pose estimation approaches is their
expectation of having a single person present in the input bounding box. This
often leads to failures in crowded scenes with occlusions. We propose a novel
solution to overcome the limitations of this fundamental assumption. Our
Multi-Hypothesis Pose Network (MHPNet) allows for predicting multiple 2D poses
within a given bounding box. We introduce a Multi-Hypothesis Attention Block
(MHAB) that can adaptively modulate channel-wise feature responses for each
hypothesis and is parameter efficient. We demonstrate the efficacy of our
approach by evaluating on COCO, CrowdPose, and OCHuman datasets. Specifically,
we achieve 70.0 AP on CrowdPose and 42.5 AP on OCHuman test sets, a significant
improvement of 2.4 AP and 6.5 AP over the prior art, respectively. When using
ground truth bounding boxes for inference, MHPNet achieves an improvement of
0.7 AP on COCO, 0.9 AP on CrowdPose, and 9.1 AP on OCHuman validation sets
compared to HRNet. Interestingly, when fewer, high confidence bounding boxes
are used, HRNet's performance degrades (by 5 AP) on OCHuman, whereas MHPNet
maintains a relatively stable performance (a drop of 1 AP) for the same inputs.
- Abstract(参考訳): トップダウンの人間のポーズ推定アプローチの重要な仮定は、入力バウンディングボックスに一人の人がいるという期待です。
これはしばしば閉塞を伴う混み合ったシーンで失敗する。
この基本的な仮定の限界を克服するための新しいソリューションを提案します。
MHPNet(Multi-Hypothesis Pose Network)は、特定のバウンディングボックス内で複数の2Dポーズを予測できます。
MHAB(Multi-Hypothesis Attention Block)を導入して,各仮説に対するチャネルワイズな特徴応答を適応的に変調し,パラメータ効率を向上する。
提案手法の有効性を,COCO,CrowdPose,OCHumanデータセットを用いて評価した。
具体的には,crowdposeでは70.0 ap,ochuman testsetでは42.5 apを達成し,先行技術では2.4 apと6.5 apが有意に改善した。
推論に接地真理境界ボックスを使用する場合、MHPNetはCOCO0.7 AP、CrowdPose0.9 AP、OCHuman検証セット9.1 APをHRNetと比較して改善する。
興味深いことに、高信頼バウンディングボックスが少ない場合、HRNetのパフォーマンスはOCHumanで(5 APで)低下しますが、MHPNetは同じ入力に対して比較的安定したパフォーマンス(1 APの低下)を維持します。
関連論文リスト
- On the Calibration of Human Pose Estimation [39.15814732856338]
Calibrated ConfidenceNet (CCNet)は、市販のポーズ推定フレームワークでAPを最大1.4%改善する軽量なポストホック追加である。
メッシュリカバリの下流タスクに適用されたCCNetは、3Dキーポイントエラーを1.0mm削減する。
論文 参考訳(メタデータ) (2023-11-28T09:31:09Z) - Rethinking pose estimation in crowds: overcoming the detection
information-bottleneck and ambiguity [46.10812760258666]
個人間の頻繁な相互作用は、ポーズ推定アルゴリズムの基本的な課題である。
ボトムアップ条件付きトップダウンポーズ推定と呼ばれる新しいパイプラインを提案する。
動物と人間のポーズ推定ベンチマークにおけるアプローチの性能と効率を実証する。
論文 参考訳(メタデータ) (2023-06-13T16:14:40Z) - Towards High Performance One-Stage Human Pose Estimation [13.220521786778544]
Mask RCNNは1つのフレームワークで人物検出とポーズ推定を行うことで効率を大幅に向上させることができる。
本稿では,Mask-RCNNの人間のポーズ推定結果を大きく推し進め,効率性を維持することを目的としている。
論文 参考訳(メタデータ) (2023-01-12T07:02:17Z) - AdaptivePose++: A Powerful Single-Stage Network for Multi-Person Pose
Regression [66.39539141222524]
そこで本研究では,ヒトの部位を適応点として表現し,微細な身体表現法を提案する。
提案するボディ表現では,AdaptivePoseと呼ばれる,コンパクトなシングルステージ多人数ポーズ回帰ネットワークを提供する。
本稿では,AdaptivePoseの有効性を検証するために,2D/3D多人数ポーズ推定タスクにAdaptivePoseを用いる。
論文 参考訳(メタデータ) (2022-10-08T12:54:20Z) - Bottom-Up 2D Pose Estimation via Dual Anatomical Centers for Small-Scale
Persons [75.86463396561744]
マルチパーソン2Dポーズ推定では、ボトムアップ手法は同時にすべての人のポーズを予測する。
本手法は,バウンディングボックス精度を38.4%改善し,バウンディングボックスリコールを39.1%改善した。
ヒトのポーズAP評価では,COCOテストデフセット上で新しいSOTA(71.0 AP)を単一スケールテストで達成する。
論文 参考訳(メタデータ) (2022-08-25T10:09:10Z) - Occluded Human Mesh Recovery [23.63235079216075]
我々は、画像空間コンテキストを組み込んだ新しいトップダウンメッシュ回復アプローチであるOCHMR(Occluded Human Mesh Recovery)を提案する。
OCHMRは、3DPW、CrowdPose、OCHumanといった挑戦的なマルチパーソンベンチマークにおいて優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-03-24T21:39:20Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - EfficientPose: Efficient Human Pose Estimation with Neural Architecture
Search [47.30243595690131]
効率的なバックボーンと効率的なヘッドの2つの部分を含む、人間のポーズ推定を目的とした効率的なフレームワークを提案します。
我々の最小モデルは、MPIIで88.1%のPCKh@0.5の0.65 GFLOPしか持たず、我々の大モデルは2 GFLOPしか持たないが、その精度は最先端の大型モデルと競合する。
論文 参考訳(メタデータ) (2020-12-13T15:38:38Z) - AdaFuse: Adaptive Multiview Fusion for Accurate Human Pose Estimation in
the Wild [77.43884383743872]
本稿では,アダプティブなマルチビュー融合手法であるAdaFuseについて述べる。
我々は、Human3.6M、Total Capture、CMU Panopticの3つの公開データセットに対するアプローチを広く評価した。
また,大規模合成データセットOcclusion-Personを作成し,咬合関節の数値評価を行う。
論文 参考訳(メタデータ) (2020-10-26T03:19:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。