論文の概要: Rethinking the Heatmap Regression for Bottom-up Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2012.15175v4
- Date: Thu, 25 Mar 2021 05:38:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-18 13:23:58.745658
- Title: Rethinking the Heatmap Regression for Bottom-up Human Pose Estimation
- Title(参考訳): ボトムアップ姿勢推定のためのヒートマップ回帰の再検討
- Authors: Zhengxiong Luo, Zhicheng Wang, Yan Huang, Tieniu Tan, Erjin Zhou
- Abstract要約: 本稿では,各キーポイントの標準偏差を適応的に調整できるスケール適応型ヒートマップ回帰(SAHR)法を提案する。
SAHRは、前景サンプル間の不均衡を悪化させ、SAHRの改善を損なう可能性がある。
また,重量適応型ヒートマップ回帰(WAHR)を導入し,背景試料のバランスをとる。
- 参考スコア(独自算出の注目度): 63.623787834984206
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Heatmap regression has become the most prevalent choice for nowadays human
pose estimation methods. The ground-truth heatmaps are usually constructed via
covering all skeletal keypoints by 2D gaussian kernels. The standard deviations
of these kernels are fixed. However, for bottom-up methods, which need to
handle a large variance of human scales and labeling ambiguities, the current
practice seems unreasonable. To better cope with these problems, we propose the
scale-adaptive heatmap regression (SAHR) method, which can adaptively adjust
the standard deviation for each keypoint. In this way, SAHR is more tolerant of
various human scales and labeling ambiguities. However, SAHR may aggravate the
imbalance between fore-background samples, which potentially hurts the
improvement of SAHR. Thus, we further introduce the weight-adaptive heatmap
regression (WAHR) to help balance the fore-background samples. Extensive
experiments show that SAHR together with WAHR largely improves the accuracy of
bottom-up human pose estimation. As a result, we finally outperform the
state-of-the-art model by +1.5AP and achieve 72.0AP on COCO test-dev2017, which
is com-arable with the performances of most top-down methods. Source codes are
available at https://github.com/greatlog/SWAHR-HumanPose.
- Abstract(参考訳): ヒートマップ回帰は、現在人間のポーズ推定法において最も一般的な選択となっている。
基底トラスヒートマップは通常、2Dガウス核によって全ての骨格キーポイントをカバーして構築される。
これらのカーネルの標準偏差は固定されている。
しかし、人間のスケールの大きな分散や曖昧さのラベル付けが必要なボトムアップ手法では、現在のプラクティスは理にかなっているように思える。
これらの問題に対処するために、各キーポイントの標準偏差を適応的に調整できるスケール適応型ヒートマップ回帰法(SAHR)を提案する。
このように、SAHRは様々な人間のスケールに寛容であり、曖昧さをラベル付けする。
しかし、SAHRは背景サンプル間の不均衡を悪化させ、SAHRの改善を損なう可能性がある。
そこで,本研究では,重量適応型ヒートマップ回帰法(WAHR)を導入して,背景試料のバランスをとる。
広汎な実験により,SAHRとWAHRはボトムアップヒトのポーズ推定の精度を大幅に向上させることが示された。
その結果,ほとんどのトップダウン手法の性能と組み合わせたCOCO test-dev2017において,技術モデルの性能を+1.5APで上回り,72.0APを達成した。
ソースコードはhttps://github.com/greatlog/SWAHR-HumanPoseで入手できる。
関連論文リスト
- Lightweight Super-Resolution Head for Human Pose Estimation [42.51588635059534]
ヒートマップに基づく手法がポーズ推定の主流となっている。
しかし、ヒートマップに基づくアプローチは、ダウンスケールのヒートマップを持つ重要な量子化誤差に悩まされる。
本稿では,SRPoseによる量子化誤差の低減と処理後処理への依存性について述べる。
論文 参考訳(メタデータ) (2023-07-31T15:35:34Z) - Learning Structure-Guided Diffusion Model for 2D Human Pose Estimation [71.24808323646167]
ニューラルネットワークを用いてキーポイントのヒートマップを学習するための新しいスキームである textbfDiffusionPose を提案する。
トレーニング中、キーポイントはノイズを加えることでランダム分布に拡散され、拡散モデルはノイズ付きヒートマップから地中構造熱マップを復元する。
実験では、広く使用されているCOCO、CrowdPose、AI Challengeデータセット上で1.6、1.2、1.2mAPの改善による、私たちのスキームの長所が示されている。
論文 参考訳(メタデータ) (2023-06-29T16:24:32Z) - Bias-Compensated Integral Regression for Human Pose Estimation [21.75308054647583]
本稿では,ソフトマックスと期待演算を組み合わせた積分回帰による帰納バイアスを明らかにする。
バイアスを補償する統合回帰ベースのフレームワークであるバイアス補償積分回帰(BCIR)を提案する。
BCIRは従来の積分回帰よりも高速で精度が高く、最先端の検出手法と競合する。
論文 参考訳(メタデータ) (2023-01-25T06:54:04Z) - Bottom-Up 2D Pose Estimation via Dual Anatomical Centers for Small-Scale
Persons [75.86463396561744]
マルチパーソン2Dポーズ推定では、ボトムアップ手法は同時にすべての人のポーズを予測する。
本手法は,バウンディングボックス精度を38.4%改善し,バウンディングボックスリコールを39.1%改善した。
ヒトのポーズAP評価では,COCOテストデフセット上で新しいSOTA(71.0 AP)を単一スケールテストで達成する。
論文 参考訳(メタデータ) (2022-08-25T10:09:10Z) - A Simple Method to Boost Human Pose Estimation Accuracy by Correcting
the Joint Regressor for the Human3.6m Dataset [21.096409769550387]
SMPL-to-joint linear layer (joint regressor) は不正確である。
より高精度な継手回帰器を実現するために,擬似地下構造SMPLポーズを作成する手法を提案する。
我々の回帰器は、再トレーニングを必要とせずに、テストセットのポーズ推定の改善につながることを示す。
論文 参考訳(メタデータ) (2022-04-29T20:42:48Z) - Human Pose Regression with Residual Log-likelihood Estimation [48.30425850653223]
本稿では,Residual Log-likelihood Estimation (RLE) を用いた新たな回帰パラダイムを提案する。
RLEは、トレーニングプロセスを容易にするために、未参照の基盤となる分布ではなく、分布の変化を学習する。
従来の回帰パラダイムと比較して、RLEによる回帰はテスト時間オーバーヘッドを伴わずに、MSCOCOに12.4mAPの改善をもたらす。
論文 参考訳(メタデータ) (2021-07-23T15:06:31Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。