論文の概要: Hybrid model for Single-Stage Multi-Person Pose Estimation
- arxiv url: http://arxiv.org/abs/2305.01167v2
- Date: Mon, 19 Jun 2023 00:58:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 02:29:46.710262
- Title: Hybrid model for Single-Stage Multi-Person Pose Estimation
- Title(参考訳): シングルステージマルチパーソンポーズ推定のためのハイブリッドモデル
- Authors: Jonghyun Kim, Bosang Kim, Hyotae Lee, Jungpyo Kim, Wonhyeok Im,
Lanying Jin, Dowoo Kwon, and Jungho Lee
- Abstract要約: そこで本研究では,HybridPoseという,単段階多人数ポーズ推定のためのハイブリッドモデルを提案する。
密に配置されたキーポイントを検出するだけでなく、画像内の存在しないキーポイントをフィルタリングすることもできる。
- 参考スコア(独自算出の注目度): 3.592448408054345
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In general, human pose estimation methods are categorized into two approaches
according to their architectures: regression (i.e., heatmap-free) and
heatmap-based methods. The former one directly estimates precise coordinates of
each keypoint using convolutional and fully-connected layers. Although this
approach is able to detect overlapped and dense keypoints, unexpected results
can be obtained by non-existent keypoints in a scene. On the other hand, the
latter one is able to filter the non-existent ones out by utilizing predicted
heatmaps for each keypoint. Nevertheless, it suffers from quantization error
when obtaining the keypoint coordinates from its heatmaps. In addition, unlike
the regression one, it is difficult to distinguish densely placed keypoints in
an image. To this end, we propose a hybrid model for single-stage multi-person
pose estimation, named HybridPose, which mutually overcomes each drawback of
both approaches by maximizing their strengths. Furthermore, we introduce
self-correlation loss to inject spatial dependencies between keypoint
coordinates and their visibility. Therefore, HybridPose is capable of not only
detecting densely placed keypoints, but also filtering the non-existent
keypoints in an image. Experimental results demonstrate that proposed
HybridPose exhibits the keypoints visibility without performance degradation in
terms of the pose estimation accuracy.
- Abstract(参考訳): 一般に、人間のポーズ推定方法は、回帰(すなわち、熱マップのない)と熱マップに基づく方法の2つの手法に分類される。
前者は畳み込み層と完全連結層を用いて各キーポイントの正確な座標を直接推定する。
このアプローチは重なり、密集したキーポイントを検出できるが、シーンに存在しないキーポイントによって予期せぬ結果が得られる。
一方、後者は、各キーポイントに予測されたヒートマップを使用することで、存在しないものをフィルタリングすることができる。
それでも、キーポイント座標を熱マップから得る際に量子化誤差に悩まされる。
また、回帰と異なり、画像中の密配置されたキーポイントを区別することは困難である。
この目的のために,HybridPoseと呼ばれる単一段階多人数ポーズ推定のためのハイブリッドモデルを提案し,その長所を最大化することで,両アプローチの欠点を相互に克服する。
さらに,鍵点座標間の空間的依存関係とその可視性を示す自己相関損失を導入する。
そのため、HybridPoseは、密配置されたキーポイントを検出するだけでなく、画像内の存在しないキーポイントをフィルタリングすることもできる。
実験の結果,提案手法はポーズ推定精度において,性能劣化を伴わないキーポイントの可視性を示すことがわかった。
関連論文リスト
- GMM-IKRS: Gaussian Mixture Models for Interpretable Keypoint Refinement and Scoring [9.322937309882022]
キーポイントには、品質に応じてスコアをランク付けできるスコアが付属する。
学習されたキーポイントは手作りのものよりも優れた特性を示すことが多いが、それらのスコアは容易に解釈できない。
本稿では,どの手法でも抽出したキーポイントを解釈可能なスコアで特徴付けることができるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-30T09:39:59Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - Improving Robustness for Pose Estimation via Stable Heatmap Regression [19.108116394510258]
ネットワーク脆弱性を小さな摂動に緩和するヒートマップ回帰法を提案する。
最適化の難易度を簡略化するために、最大安定性トレーニング損失を使用する。
提案手法は,2つのベンチマークデータセットに対する最先端アプローチに対するロバスト性を大幅に向上させる。
論文 参考訳(メタデータ) (2021-05-08T03:07:05Z) - Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression [81.05772887221333]
従来のキーポイント検出およびグループ化フレームワークに劣る密度の高いキーポイント回帰フレームワークについて検討する。
我々は,dekr(disentangled keypoint regression)という,単純かつ効果的な手法を提案する。
提案手法はキーポイント検出法やグループ化法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-06T05:54:46Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z) - Attentive One-Dimensional Heatmap Regression for Facial Landmark
Detection and Tracking [73.35078496883125]
顔のランドマークの局所化のための新しい1次元熱マップ回帰法を提案する。
まず、x座標とy座標の辺分布を表すために、1次元熱マップの2つの群を予測する。
第2に、x と y 座標に存在する固有の空間パターンをモデル化するコアテンション機構が採用されている。
第3に、1次元熱マップ構造に基づいて、画像上のランドマーク検出のための空間パターンを検出する顔ランドマーク検出器を提案する。
論文 参考訳(メタデータ) (2020-04-05T06:51:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。