論文の概要: RSPose: Ranking Based Losses for Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2511.13857v1
- Date: Mon, 17 Nov 2025 19:20:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.760905
- Title: RSPose: Ranking Based Losses for Human Pose Estimation
- Title(参考訳): RSPose: 人文評価のためのランキングベースの損失
- Authors: Muhammed Can Keles, Bedrettin Cetinkaya, Sinan Kalkan, Emre Akbas,
- Abstract要約: 提案した損失は一般的な熱マップ損失(MSE, KL-Divergence)よりも優れていることを示す。
私たちの損失は、信頼度スコアとローカライゼーション品質の相関を著しく増大させます。
我々の知る限りでは、人間のポーズ推定のための評価基準(mAP)に沿う損失を最初に提案する。
- 参考スコア(独自算出の注目度): 17.592681844374827
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While heatmap-based human pose estimation methods have shown strong performance, they suffer from three main problems: (P1) "Commonly used Mean Squared Error (MSE)" Loss may not always improve joint localization because it penalizes all pixel deviations equally, without focusing explicitly on sharpening and correctly localizing the peak corresponding to the joint; (P2) heatmaps are spatially and class-wise imbalanced; and, (P3) there is a discrepancy between the evaluation metric (i.e., mAP) and the loss functions. We propose ranking-based losses to address these issues. Both theoretically and empirically, we show that our proposed losses are superior to commonly used heatmap losses (MSE, KL-Divergence). Our losses considerably increase the correlation between confidence scores and localization qualities, which is desirable because higher correlation leads to more accurate instance selection during Non-Maximum Suppression (NMS) and better Average Precision (mAP) performance. We refer to the models trained with our losses as RSPose. We show the effectiveness of RSPose across two different modes: one-dimensional and two-dimensional heatmaps, on three different datasets (COCO, CrowdPose, MPII). To the best of our knowledge, we are the first to propose losses that align with the evaluation metric (mAP) for human pose estimation. RSPose outperforms the previous state of the art on the COCO-val set and achieves an mAP score of 79.9 with ViTPose-H, a vision transformer model for human pose estimation. We also improve SimCC Resnet-50, a coordinate classification-based pose estimation method, by 1.5 AP on the COCO-val set, achieving 73.6 AP.
- Abstract(参考訳): 熱マップに基づく人間のポーズ推定法は高い性能を示したが, (P1) "平均二乗誤差(MSE)" 損失は,すべての画素偏差を等角化させるため,必ずしも関節の偏差を均等化させるわけではない。 (P2) 熱マップは空間的, クラス的に不均衡であり, (P3) 評価基準(mAP) と損失関数との間には相違がある。
これらの問題に対処するためにランキングベースの損失を提案する。
理論的にも経験的にも,提案した損失は一般的な熱マップ損失(MSE, KL-Divergence)よりも優れていることを示す。
非最大抑圧(NMS)と平均精度(mAP)が向上し,高い相関がより正確なインスタンス選択につながることが望ましい。
損失で訓練されたモデルを RSPose と呼ぶ。
3つの異なるデータセット (COCO, CrowdPose, MPII) 上で, RSPose が1次元と2次元のヒートマップにまたがって有効であることを示す。
我々の知る限りでは、人間のポーズ推定のための評価基準(mAP)に沿う損失を最初に提案する。
RSPoseは、COCO-valセットの前の最先端よりも優れており、人間のポーズ推定のためのビジョントランスフォーマーモデルであるViTPose-Hで、mAPスコア79.9を達成する。
また,座標分類に基づくポーズ推定手法であるSimCC Resnet-50を COCO-val 上で1.5 AP で改善し,73.6 AP を達成した。
関連論文リスト
- Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。
大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。
本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:09:47Z) - Optimizing What Matters: AUC-Driven Learning for Robust Neural Retrieval [4.846917163619174]
ROC曲線(AUC)下の領域と数学的に等価なマン・ホイットニーU統計を最大化する新たなトレーニング目標を導入する。
MW損失はContrastive Lossよりも経験的に優れていることを示し、RAGのような高収率アプリケーションに対して、より良い校正とより差別的なレトリバーが得られることを示した。
論文 参考訳(メタデータ) (2025-09-30T18:14:01Z) - A Lightweight Ensemble-Based Face Image Quality Assessment Method with Correlation-Aware Loss [14.915614314380578]
顔画像品質評価(FIQA)は、顔認識および検証システムにおいて重要な役割を果たす。
本研究では,野生における顔画像の知覚的評価を目的とした,軽量で効率的なFIQA法を提案する。
論文 参考訳(メタデータ) (2025-09-12T10:13:38Z) - Rethinking pose estimation in crowds: overcoming the detection
information-bottleneck and ambiguity [46.10812760258666]
個人間の頻繁な相互作用は、ポーズ推定アルゴリズムの基本的な課題である。
ボトムアップ条件付きトップダウンポーズ推定と呼ばれる新しいパイプラインを提案する。
動物と人間のポーズ推定ベンチマークにおけるアプローチの性能と効率を実証する。
論文 参考訳(メタデータ) (2023-06-13T16:14:40Z) - Revisiting AP Loss for Dense Object Detection: Adaptive Ranking Pair
Selection [19.940491797959407]
本研究では, 平均精度 (AP) の損失を再考し, その重要な要素は, 正試料と負試料のランキングペアを選択することであることを明らかにした。
本稿では,AP損失を改善するための2つの方法を提案する。第1に,APE(Adaptive Pairwise Error)損失は,正と負の両方のサンプルにおいて,ペアのランク付けに重点を置いている。
MSCOCOデータセットで行った実験は、現在の分類とランキングの損失と比較して、提案手法の優位性を実証し、分析を支援した。
論文 参考訳(メタデータ) (2022-07-25T10:33:06Z) - Fine-grained Correlation Loss for Regression [20.175415393263037]
本稿では, 従来の回帰課題を再考し, 微粒化相関損失を直接最適化する手法を提案する。
本手法は,画像品質評価とバイオメトリック計測を含む2つの典型的な超音波画像回帰タスクに対して広範囲に検証する。
論文 参考訳(メタデータ) (2022-07-01T11:25:50Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Robust and Decomposable Average Precision for Image Retrieval [0.0]
画像検索において、標準的な評価基準はスコアランキング(例えば平均精度(AP))に依存している。
本稿では,ロバストで分解可能な平均精度(ROADMAP)を提案する。
我々は、APを用いたディープニューラルネットワークのエンドツーエンドトレーニングにおいて、非微分可能性と非分解性という2つの大きな課題に対処する。
論文 参考訳(メタデータ) (2021-10-01T12:00:43Z) - Rethinking the Heatmap Regression for Bottom-up Human Pose Estimation [63.623787834984206]
本稿では,各キーポイントの標準偏差を適応的に調整できるスケール適応型ヒートマップ回帰(SAHR)法を提案する。
SAHRは、前景サンプル間の不均衡を悪化させ、SAHRの改善を損なう可能性がある。
また,重量適応型ヒートマップ回帰(WAHR)を導入し,背景試料のバランスをとる。
論文 参考訳(メタデータ) (2020-12-30T14:39:41Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。