論文の概要: Heatmap Regression via Randomized Rounding
- arxiv url: http://arxiv.org/abs/2009.00225v2
- Date: Thu, 26 Aug 2021 09:34:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 01:19:40.537292
- Title: Heatmap Regression via Randomized Rounding
- Title(参考訳): ランダムラウンドリングによる熱マップ回帰
- Authors: Baosheng Yu, Dacheng Tao
- Abstract要約: 本稿では,サブピクセルローカライゼーション問題に対処する簡易かつ効果的な量子化システムを提案する。
提案システムでは,数値座標の分数部をトレーニング中の確率的アプローチを用いて基底真理熱マップに符号化する。
- 参考スコア(独自算出の注目度): 105.75014893647538
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Heatmap regression has become the mainstream methodology for deep
learning-based semantic landmark localization, including in facial landmark
localization and human pose estimation. Though heatmap regression is robust to
large variations in pose, illumination, and occlusion in unconstrained
settings, it usually suffers from a sub-pixel localization problem.
Specifically, considering that the activation point indices in heatmaps are
always integers, quantization error thus appears when using heatmaps as the
representation of numerical coordinates. Previous methods to overcome the
sub-pixel localization problem usually rely on high-resolution heatmaps. As a
result, there is always a trade-off between achieving localization accuracy and
computational cost, where the computational complexity of heatmap regression
depends on the heatmap resolution in a quadratic manner. In this paper, we
formally analyze the quantization error of vanilla heatmap regression and
propose a simple yet effective quantization system to address the sub-pixel
localization problem. The proposed quantization system induced by the
randomized rounding operation 1) encodes the fractional part of numerical
coordinates into the ground truth heatmap using a probabilistic approach during
training; and 2) decodes the predicted numerical coordinates from a set of
activation points during testing. We prove that the proposed quantization
system for heatmap regression is unbiased and lossless. Experimental results on
popular facial landmark localization datasets (WFLW, 300W, COFW, and AFLW) and
human pose estimation datasets (MPII and COCO) demonstrate the effectiveness of
the proposed method for efficient and accurate semantic landmark localization.
Code is available at http://github.com/baoshengyu/H3R.
- Abstract(参考訳): ヒートマップ回帰は、顔のランドマークのローカライゼーションや人間のポーズ推定など、ディープラーニングに基づくセマンティックランドマークのローカライゼーションの主流となっている。
熱マップ回帰は、制約のない環境でのポーズ、照明、オクルージョンの大きなバリエーションに対して堅牢であるが、通常はサブピクセルのローカライゼーションの問題に悩まされる。
具体的には、ヒートマップのアクティベーションポイントインデックスが常に整数であることを考えると、数値座標の表現としてヒートマップを使用すると量子化誤差が発生する。
サブピクセルのローカライズ問題を解決する以前の方法は、通常高分解能ヒートマップに依存している。
その結果、局所化精度と計算コストの間には常にトレードオフがあり、熱マップ回帰の計算複雑性は二次的な方法での熱マップ分解に依存する。
本稿では,バニラ熱マップ回帰の量子化誤差を正式に解析し,サブピクセルローカライゼーション問題に対処する簡易かつ効果的な量子化システムを提案する。
ランダム化ラウンドリング操作による量子化システムの提案
1)訓練中に確率論的アプローチを用いて数値座標の分数部分を基底真理熱マップにエンコードする。
2) テスト中の一連の活性化点から予測された数値座標を復号する。
提案するヒートマップ回帰の量子化システムは偏りがなく損失がないことを証明した。
顔のランドマーク局所化データセット (WFLW, 300W, COFW, AFLW) と人間のポーズ推定データセット (MPII, COCO) を用いた実験により, 提案手法の有効性が示された。
コードはhttp://github.com/baoshengyu/h3r。
関連論文リスト
- Subpixel Heatmap Regression for Facial Landmark Localization [65.41270740933656]
熱マップ回帰法は、熱マップ符号化と復号処理の両方に関連する離散化による誤差に悩まされる。
本稿では,熱マップの符号化と復号化に基礎となる連続分布を利用した新しい手法を提案する。
我々のアプローチは、顔のランドマークのローカライゼーションに新しい最先端の結果を設定する複数のデータセット間で顕著な利得を提供する。
論文 参考訳(メタデータ) (2021-11-03T17:21:28Z) - Is 2D Heatmap Representation Even Necessary for Human Pose Estimation? [44.313782042852246]
キーポイント座標(emphSimDR)のための textbfSimple yet promising textbfDisentangled textbfRepresentation を提案する。
本稿では,キーポイント位置に対する水平座標と垂直座標の表現をアンタングル化することを提案する。
論文 参考訳(メタデータ) (2021-07-07T16:20:12Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z) - A Transfer Learning approach to Heatmap Regression for Action Unit
intensity estimation [50.261472059743845]
アクション・ユニット(英: Action Units、AUs)は、幾何学に基づく原子性顔面筋運動である。
本稿では,その位置と強度を共同で推定する新しいAUモデリング問題を提案する。
ヒートマップは、所定の空間的位置でAUが発生するか否かをモデル化する。
論文 参考訳(メタデータ) (2020-04-14T16:51:13Z) - Attentive One-Dimensional Heatmap Regression for Facial Landmark
Detection and Tracking [73.35078496883125]
顔のランドマークの局所化のための新しい1次元熱マップ回帰法を提案する。
まず、x座標とy座標の辺分布を表すために、1次元熱マップの2つの群を予測する。
第2に、x と y 座標に存在する固有の空間パターンをモデル化するコアテンション機構が採用されている。
第3に、1次元熱マップ構造に基づいて、画像上のランドマーク検出のための空間パターンを検出する顔ランドマーク検出器を提案する。
論文 参考訳(メタデータ) (2020-04-05T06:51:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。