論文の概要: Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression
- arxiv url: http://arxiv.org/abs/2104.02300v1
- Date: Tue, 6 Apr 2021 05:54:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 14:07:22.880949
- Title: Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression
- Title(参考訳): 不連続キーポイント回帰によるボトムアップ人間のポーズ推定
- Authors: Zigang Geng, Ke Sun, Bin Xiao, Zhaoxiang Zhang, Jingdong Wang
- Abstract要約: 従来のキーポイント検出およびグループ化フレームワークに劣る密度の高いキーポイント回帰フレームワークについて検討する。
我々は,dekr(disentangled keypoint regression)という,単純かつ効果的な手法を提案する。
提案手法はキーポイント検出法やグループ化法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 81.05772887221333
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we are interested in the bottom-up paradigm of estimating
human poses from an image. We study the dense keypoint regression framework
that is previously inferior to the keypoint detection and grouping framework.
Our motivation is that regressing keypoint positions accurately needs to learn
representations that focus on the keypoint regions.
We present a simple yet effective approach, named disentangled keypoint
regression (DEKR). We adopt adaptive convolutions through pixel-wise spatial
transformer to activate the pixels in the keypoint regions and accordingly
learn representations from them. We use a multi-branch structure for separate
regression: each branch learns a representation with dedicated adaptive
convolutions and regresses one keypoint. The resulting disentangled
representations are able to attend to the keypoint regions, respectively, and
thus the keypoint regression is spatially more accurate. We empirically show
that the proposed direct regression method outperforms keypoint detection and
grouping methods and achieves superior bottom-up pose estimation results on two
benchmark datasets, COCO and CrowdPose. The code and models are available at
https://github.com/HRNet/DEKR.
- Abstract(参考訳): 本稿では,画像から人間のポーズを推定するボトムアップパラダイムに関心を寄せる。
キーポイント検出およびグループ化フレームワークよりも以前劣っていた高密度キーポイント回帰フレームワークについて検討する。
私たちのモチベーションは、キーポイントの位置をリグレッシブするには、キーポイント領域にフォーカスした表現を正しく学ぶ必要があるということです。
我々は,dekr(disentangled keypoint regression)という,単純かつ効果的な手法を提案する。
我々は,ピクセル単位の空間変換による適応畳み込みを採用し,キーポイント領域の画素を活性化し,それらから表現を学習する。
各分岐は専用の適応的畳み込みで表現を学び、1つのキーポイントを回帰する。
結果として生じる不整合表現は、それぞれキーポイント領域に参加することができ、したがってキーポイント回帰は空間的により正確である。
本研究では,提案手法がキーポイント検出およびグループ化手法より優れており,COCOとCrowdPoseの2つのベンチマークデータセットにおいて優れたボトムアップポーズ推定結果が得られることを示す。
コードとモデルはhttps://github.com/hrnet/dekrで入手できる。
関連論文リスト
- KGpose: Keypoint-Graph Driven End-to-End Multi-Object 6D Pose Estimation via Point-Wise Pose Voting [0.0]
KGposeは、複数のオブジェクトの6Dポーズ推定のためのエンドツーエンドフレームワークである。
我々のアプローチはキーポイントベースの手法とキーポイントグラフによる学習可能なポーズ回帰を組み合わせる。
論文 参考訳(メタデータ) (2024-07-12T01:06:00Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Accurate Grid Keypoint Learning for Efficient Video Prediction [87.71109421608232]
キーポイントベースのビデオ予測手法は、トレーニングやデプロイメントにおいて、かなりの計算資源を消費することができる。
本稿では,長期的効率的な映像予測のための頑健で説明可能な中間キーポイント表現を目的とした,新しいグリッドキーポイント学習フレームワークを設計する。
提案手法は,計算資源の98%以上を節約しつつ,最先端のビデオ予測手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-28T05:04:30Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z) - Point-Set Anchors for Object Detection, Instance Segmentation and Pose
Estimation [85.96410825961966]
中心点から抽出された画像の特徴は、離れたキーポイントや境界ボックスの境界を予測するための限られた情報を含んでいると論じる。
推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。
我々は、オブジェクト検出、インスタンス分割、人間のポーズ推定にPoint-Set Anchorsと呼ばれるこのフレームワークを適用した。
論文 参考訳(メタデータ) (2020-07-06T15:59:56Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。