論文の概要: Bias-Compensated Integral Regression for Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2301.10431v1
- Date: Wed, 25 Jan 2023 06:54:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-26 15:46:35.254689
- Title: Bias-Compensated Integral Regression for Human Pose Estimation
- Title(参考訳): 姿勢推定のためのバイアス補償積分回帰
- Authors: Kerui Gu, Linlin Yang, Michael Bi Mi, Angela Yao
- Abstract要約: 本稿では,ソフトマックスと期待演算を組み合わせた積分回帰による帰納バイアスを明らかにする。
バイアスを補償する統合回帰ベースのフレームワークであるバイアス補償積分回帰(BCIR)を提案する。
BCIRは従来の積分回帰よりも高速で精度が高く、最先端の検出手法と競合する。
- 参考スコア(独自算出の注目度): 21.75308054647583
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In human and hand pose estimation, heatmaps are a crucial intermediate
representation for a body or hand keypoint. Two popular methods to decode the
heatmap into a final joint coordinate are via an argmax, as done in heatmap
detection, or via softmax and expectation, as done in integral regression.
Integral regression is learnable end-to-end, but has lower accuracy than
detection. This paper uncovers an induced bias from integral regression that
results from combining the softmax and the expectation operation. This bias
often forces the network to learn degenerately localized heatmaps, obscuring
the keypoint's true underlying distribution and leads to lower accuracies.
Training-wise, by investigating the gradients of integral regression, we show
that the implicit guidance of integral regression to update the heatmap makes
it slower to converge than detection. To counter the above two limitations, we
propose Bias Compensated Integral Regression (BCIR), an integral
regression-based framework that compensates for the bias. BCIR also
incorporates a Gaussian prior loss to speed up training and improve prediction
accuracy. Experimental results on both the human body and hand benchmarks show
that BCIR is faster to train and more accurate than the original integral
regression, making it competitive with state-of-the-art detection methods.
- Abstract(参考訳): 人間と手の位置推定では、ヒートマップは身体や手のキーポイントにとって重要な中間表現である。
ヒートマップを最終的なジョイント座標にデコードする2つの一般的な方法は、熱マップ検出で行うargmax、あるいは積分回帰で行うソフトマックスと期待によって行われる。
積分回帰はエンドツーエンドで学習できるが、検出よりも精度が低い。
本稿では,ソフトマックスと期待操作を組み合わせた積分回帰から誘導されるバイアスを明らかにする。
このバイアスは、しばしばネットワークに縮退した局所的な熱マップを学習させ、キーポイントの真の基盤分布を隠蔽し、より低い精度をもたらす。
学習側では,積分回帰の勾配を調べることにより,熱マップ更新のための積分回帰の暗黙的指導により,検出よりも収束が遅くなることを示す。
上記の2つの制限に対処するため、バイアスを補う統合回帰ベースのフレームワークであるバイアス補償積分回帰(BCIR)を提案する。
BCIRはまた、トレーニングをスピードアップし、予測精度を向上させるためにガウスの事前損失を組み込んでいる。
人体と手のベンチマークによる実験の結果、BCIRは元の積分回帰よりも訓練が速く、精度が高いことが示され、最先端の検出手法と競合する。
関連論文リスト
- Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Predicting Rebar Endpoints using Sin Exponential Regression Model [4.129225533930966]
本稿では, YOLO(You Only Look Once)v3に基づいて, マシンビジョンカメラに入力された残差終端画像の検出と追跡を行う手法を提案する。
提案手法は、OPPDetモデルにおいて、残差エンドポイントが遠くにあるフレーム位置の大規模な予測誤差率の問題を解決する。
論文 参考訳(メタデータ) (2021-10-18T00:38:00Z) - Human Pose Regression with Residual Log-likelihood Estimation [48.30425850653223]
本稿では,Residual Log-likelihood Estimation (RLE) を用いた新たな回帰パラダイムを提案する。
RLEは、トレーニングプロセスを容易にするために、未参照の基盤となる分布ではなく、分布の変化を学習する。
従来の回帰パラダイムと比較して、RLEによる回帰はテスト時間オーバーヘッドを伴わずに、MSCOCOに12.4mAPの改善をもたらす。
論文 参考訳(メタデータ) (2021-07-23T15:06:31Z) - Rethinking the Heatmap Regression for Bottom-up Human Pose Estimation [63.623787834984206]
本稿では,各キーポイントの標準偏差を適応的に調整できるスケール適応型ヒートマップ回帰(SAHR)法を提案する。
SAHRは、前景サンプル間の不均衡を悪化させ、SAHRの改善を損なう可能性がある。
また,重量適応型ヒートマップ回帰(WAHR)を導入し,背景試料のバランスをとる。
論文 参考訳(メタデータ) (2020-12-30T14:39:41Z) - Ridge Regression with Frequent Directions: Statistical and Optimization
Perspectives [1.0152838128195465]
acrshortfdは、高精度の解が得られる反復的なスキームによって最適化設定に利用できることを示す。
これは、収束のスピードで、イテレーション毎に新しいスケッチの必要性を妥協する必要のあるランダム化されたアプローチを改善する。
論文 参考訳(メタデータ) (2020-11-06T21:40:38Z) - Heatmap Regression via Randomized Rounding [105.75014893647538]
本稿では,サブピクセルローカライゼーション問題に対処する簡易かつ効果的な量子化システムを提案する。
提案システムでは,数値座標の分数部をトレーニング中の確率的アプローチを用いて基底真理熱マップに符号化する。
論文 参考訳(メタデータ) (2020-09-01T04:54:22Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。