論文の概要: Lightweight Super-Resolution Head for Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2307.16765v1
- Date: Mon, 31 Jul 2023 15:35:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-01 13:39:14.773564
- Title: Lightweight Super-Resolution Head for Human Pose Estimation
- Title(参考訳): 軽量超解像ヘッドによる人体電位推定
- Authors: Haonan Wang, Jie Liu, Jie Tang, Gangshan Wu
- Abstract要約: ヒートマップに基づく手法がポーズ推定の主流となっている。
しかし、ヒートマップに基づくアプローチは、ダウンスケールのヒートマップを持つ重要な量子化誤差に悩まされる。
本稿では,SRPoseによる量子化誤差の低減と処理後処理への依存性について述べる。
- 参考スコア(独自算出の注目度): 42.51588635059534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Heatmap-based methods have become the mainstream method for pose estimation
due to their superior performance. However, heatmap-based approaches suffer
from significant quantization errors with downscale heatmaps, which result in
limited performance and the detrimental effects of intermediate supervision.
Previous heatmap-based methods relied heavily on additional post-processing to
mitigate quantization errors. Some heatmap-based approaches improve the
resolution of feature maps by using multiple costly upsampling layers to
improve localization precision. To solve the above issues, we creatively view
the backbone network as a degradation process and thus reformulate the heatmap
prediction as a Super-Resolution (SR) task. We first propose the SR head, which
predicts heatmaps with a spatial resolution higher than the input feature maps
(or even consistent with the input image) by super-resolution, to effectively
reduce the quantization error and the dependence on further post-processing.
Besides, we propose SRPose to gradually recover the HR heatmaps from LR
heatmaps and degraded features in a coarse-to-fine manner. To reduce the
training difficulty of HR heatmaps, SRPose applies SR heads to supervise the
intermediate features in each stage. In addition, the SR head is a lightweight
and generic head that applies to top-down and bottom-up methods. Extensive
experiments on the COCO, MPII, and CrowdPose datasets show that SRPose
outperforms the corresponding heatmap-based approaches. The code and models are
available at https://github.com/haonanwang0522/SRPose.
- Abstract(参考訳): ヒートマップに基づく手法がその優れた性能のためにポーズ推定の主流となっている。
しかしながら、ヒートマップベースのアプローチは、ダウンスケールヒートマップでかなりの量子化誤差を被り、結果として性能が低下し、中間監督による有害な影響が生じる。
以前のヒートマップベースの手法は、量子化エラーを軽減するために追加の後処理に大きく依存していた。
ヒートマップに基づくいくつかのアプローチは、複数のコストのかかるアップサンプリング層を使用して、ローカライズ精度を向上させることで特徴マップの解像度を改善する。
以上の課題を解決するため,バックボーンネットワークを劣化過程と捉え,熱マップ予測を超解法(SR)タスクとして再構成する。
まず,入力特徴写像よりも空間分解能の高いヒートマップ(あるいは入力画像との整合性)を超解法で予測し,量子化誤差とさらなる後処理への依存性を効果的に低減するSRヘッドを提案する。
さらに, HRヒートマップをLRヒートマップから徐々に復元するSRPoseを提案し, 粗大な粒度化を図った。
HRヒートマップのトレーニングの難しさを軽減するため、SRPoseはSRヘッドを適用して各ステージの中間的な特徴を監督する。
加えて、SRヘッドは軽量で汎用的なヘッドであり、トップダウンおよびボトムアップメソッドに適用できる。
COCO、MPII、CrowdPoseデータセットに関する大規模な実験は、SRPoseが対応するヒートマップベースのアプローチよりも優れていることを示している。
コードとモデルはhttps://github.com/haonanwang0522/srposeで入手できる。
関連論文リスト
- Learning Structure-Guided Diffusion Model for 2D Human Pose Estimation [71.24808323646167]
ニューラルネットワークを用いてキーポイントのヒートマップを学習するための新しいスキームである textbfDiffusionPose を提案する。
トレーニング中、キーポイントはノイズを加えることでランダム分布に拡散され、拡散モデルはノイズ付きヒートマップから地中構造熱マップを復元する。
実験では、広く使用されているCOCO、CrowdPose、AI Challengeデータセット上で1.6、1.2、1.2mAPの改善による、私たちのスキームの長所が示されている。
論文 参考訳(メタデータ) (2023-06-29T16:24:32Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - Improving Robustness for Pose Estimation via Stable Heatmap Regression [19.108116394510258]
ネットワーク脆弱性を小さな摂動に緩和するヒートマップ回帰法を提案する。
最適化の難易度を簡略化するために、最大安定性トレーニング損失を使用する。
提案手法は,2つのベンチマークデータセットに対する最先端アプローチに対するロバスト性を大幅に向上させる。
論文 参考訳(メタデータ) (2021-05-08T03:07:05Z) - Heatmap Regression via Randomized Rounding [105.75014893647538]
本稿では,サブピクセルローカライゼーション問題に対処する簡易かつ効果的な量子化システムを提案する。
提案システムでは,数値座標の分数部をトレーニング中の確率的アプローチを用いて基底真理熱マップに符号化する。
論文 参考訳(メタデータ) (2020-09-01T04:54:22Z) - Attentive One-Dimensional Heatmap Regression for Facial Landmark
Detection and Tracking [73.35078496883125]
顔のランドマークの局所化のための新しい1次元熱マップ回帰法を提案する。
まず、x座標とy座標の辺分布を表すために、1次元熱マップの2つの群を予測する。
第2に、x と y 座標に存在する固有の空間パターンをモデル化するコアテンション機構が採用されている。
第3に、1次元熱マップ構造に基づいて、画像上のランドマーク検出のための空間パターンを検出する顔ランドマーク検出器を提案する。
論文 参考訳(メタデータ) (2020-04-05T06:51:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。