論文の概要: Train Your Data Processor: Distribution-Aware and Error-Compensation
Coordinate Decoding for Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2007.05887v4
- Date: Fri, 17 Jul 2020 04:03:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 05:58:09.540378
- Title: Train Your Data Processor: Distribution-Aware and Error-Compensation
Coordinate Decoding for Human Pose Estimation
- Title(参考訳): データセットのトレーニング:人間のポーズ推定のための分散認識と誤り補償座標復号
- Authors: Feiyu Yang, Zhan Song, Zhenzhong Xiao, Yu Chen, Zhe Pan, Min Zhang,
Min Xue, Yaoyang Mo, Yao Zhang, Guoxiong Guan, Beibei Qian
- Abstract要約: 本研究では,予測過程を通じて導入された誤差に着目して,熱マップ復号処理について検討する。
そこで,DAEC(Distributed-Aware and Error-Compensation Coordinate Decoding)を提案する。
DAECは、トレーニングデータから復号戦略を学び、最先端の人間のポーズ推定モデルの性能を大幅に向上させる。
- 参考スコア(独自算出の注目度): 14.816632698778049
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, the leading performance of human pose estimation is dominated by
heatmap based methods. While being a fundamental component of heatmap
processing, heatmap decoding (i.e. transforming heatmaps to coordinates)
receives only limited investigations, to our best knowledge. This work fills
the gap by studying the heatmap decoding processing with a particular focus on
the errors introduced throughout the prediction process. We found that the
errors of heatmap based methods are surprisingly significant, which
nevertheless was universally ignored before. In view of the discovered
importance, we further reveal the intrinsic limitations of the previous widely
used heatmap decoding methods and thereout propose a Distribution-Aware and
Error-Compensation Coordinate Decoding (DAEC). Serving as a model-agnostic
plug-in, DAEC learns its decoding strategy from training data and remarkably
improves the performance of a variety of state-of-the-art human pose estimation
models with negligible extra computation. Specifically, equipped with DAEC, the
SimpleBaseline-ResNet152-256x192 and HRNet-W48-256x192 are significantly
improved by 2.6 AP and 2.9 AP achieving 72.6 AP and 75.7 AP on COCO,
respectively. Moreover, the HRNet-W32-256x256 and ResNet-152-256x256 frameworks
enjoy even more dramatic promotions of 8.4% and 7.8% on MPII with PCKh0.1
metric. Extensive experiments performed on these two common benchmarks,
demonstrates that DAEC exceeds its competitors by considerable margins, backing
up the rationality and generality of our novel heatmap decoding idea. The
project is available at https://github.com/fyang235/DAEC.
- Abstract(参考訳): 近年,人間のポーズ推定はヒートマップに基づく手法が主流となっている。
熱マップ処理の基本的な構成要素である一方、熱マップデコーディング(すなわち、熱マップを座標に変換する)は、我々の知る限り、限られた研究しか受け取らない。
本研究は, 熱マップ復号処理において, 予測過程を通じて導入された誤差に着目し, 差を埋めるものである。
熱マップに基づく手法の誤差は驚くほど大きく,それにもかかわらず従来は無視されていた。
そこで本研究では,従来広く用いられてきたヒートマップ復号法の本質的限界を明らかにするとともに,DAEC(Distributed-Aware and Error-Compensation Coordinate Decoding)を提案する。
daecはモデルに依存しないプラグインとして、トレーニングデータからデコード戦略を学び、不要な計算で様々な最先端の人間のポーズ推定モデルの性能を著しく改善する。
具体的には、DAEC、SimpleBaseline-ResNet152-256x192、HRNet-W48-256x192をそれぞれ2.6 APと2.9 APで改善し、COCOでは72.6 APと75.7 APを達成した。
さらに、HRNet-W32-256x256とResNet-152-256x256フレームワークは、PCKh0.1メトリックによるMPIIの8.4%と7.8%というより劇的なプロモーションを享受している。
これら2つのベンチマークで実施された大規模な実験は、DAECが競争相手をかなり上回り、新しいヒートマップデコーディングの合理性と一般性を裏付けていることを示している。
このプロジェクトはhttps://github.com/fyang235/DAECで入手できる。
関連論文リスト
- Lightweight Super-Resolution Head for Human Pose Estimation [42.51588635059534]
ヒートマップに基づく手法がポーズ推定の主流となっている。
しかし、ヒートマップに基づくアプローチは、ダウンスケールのヒートマップを持つ重要な量子化誤差に悩まされる。
本稿では,SRPoseによる量子化誤差の低減と処理後処理への依存性について述べる。
論文 参考訳(メタデータ) (2023-07-31T15:35:34Z) - DistilPose: Tokenized Pose Regression with Heatmap Distillation [81.21273854769765]
本研究では,熱マップに基づく手法と回帰に基づく手法のギャップを埋める,DistilPoseと呼ばれる新しいポーズ推定フレームワークを提案する。
DistilPoseは、教師モデル(ヒートマップベース)から生徒モデル(レグレッションベース)への知識伝達を、Token-distilling (TDE) と Simulated Heatmaps を通じて最大化する。
論文 参考訳(メタデータ) (2023-03-04T16:56:29Z) - Precise Single-stage Detector [2.2719729705587155]
我々は、PSSD(Precise Single Stage Detector)と呼ばれるシングルショットマルチボックス検出器(SSD)の修正版を提案する。
このような問題に対処するため,我々はPSSD(Precise Single Stage Detector)と呼ばれる新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-10-09T12:58:37Z) - Heatmap Distribution Matching for Human Pose Estimation [12.524484316923333]
このような方法で熱マップの予測を最適化することは、生体関節局所化のモデル性能を一貫して改善することができないことを示す。
本稿では, 熱マップ予測の最適化を, 予測熱マップと生体関節のドットアノテーションとの分布整合問題として定式化する。
提案手法の有効性を,COCOデータセットとMPIIデータセットの広範な実験により示す。
論文 参考訳(メタデータ) (2022-10-03T07:21:30Z) - Lightweight Human Pose Estimation Using Heatmap-Weighting Loss [7.830376406370752]
本稿では,原位置情報,レベル間情報,レベル内情報を利用して精度を高めるアテンション機構を提案する。
また,熱マップ上の各画素の重み付けを行う熱マップ重み付け損失(Heatmap weighting loss)と呼ばれる新たな損失関数を提案する。
論文 参考訳(メタデータ) (2022-05-21T14:26:14Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - Rethinking the Heatmap Regression for Bottom-up Human Pose Estimation [63.623787834984206]
本稿では,各キーポイントの標準偏差を適応的に調整できるスケール適応型ヒートマップ回帰(SAHR)法を提案する。
SAHRは、前景サンプル間の不均衡を悪化させ、SAHRの改善を損なう可能性がある。
また,重量適応型ヒートマップ回帰(WAHR)を導入し,背景試料のバランスをとる。
論文 参考訳(メタデータ) (2020-12-30T14:39:41Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z) - Joint COCO and Mapillary Workshop at ICCV 2019 Keypoint Detection
Challenge Track Technical Report: Distribution-Aware Coordinate
Representation for Human Pose Estimation [36.73217430761146]
人間のポーズ推定における座標表現に着目した。
本稿では,分散認識型復号法を提案する。
それらを組み合わせて,キーポイント(DARK)法のための新しい分布認識座標表現を定式化する。
論文 参考訳(メタデータ) (2020-03-13T10:22:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。