論文の概要: Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement
- arxiv url: http://arxiv.org/abs/2007.10599v1
- Date: Tue, 21 Jul 2020 04:59:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 04:46:36.353374
- Title: Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement
- Title(参考訳): Graph-PCNN: Graph Pose Refinementによる2段階の人文推定
- Authors: Jian Wang, Xiang Long, Yuan Gao, Errui Ding, Shilei Wen
- Abstract要約: グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
- 参考スコア(独自算出の注目度): 54.29252286561449
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, most of the state-of-the-art human pose estimation methods are
based on heatmap regression. The final coordinates of keypoints are obtained by
decoding heatmap directly. In this paper, we aim to find a better approach to
get more accurate localization results. We mainly put forward two suggestions
for improvement: 1) different features and methods should be applied for rough
and accurate localization, 2) relationship between keypoints should be
considered. Specifically, we propose a two-stage graph-based and model-agnostic
framework, called Graph-PCNN, with a localization subnet and a graph pose
refinement module added onto the original heatmap regression network. In the
first stage, heatmap regression network is applied to obtain a rough
localization result, and a set of proposal keypoints, called guided points, are
sampled. In the second stage, for each guided point, different visual feature
is extracted by the localization subnet. The relationship between guided points
is explored by the graph pose refinement module to get more accurate
localization results. Experiments show that Graph-PCNN can be used in various
backbones to boost the performance by a large margin. Without bells and
whistles, our best model can achieve a new state-of-the-art 76.8% AP on COCO
test-dev split.
- Abstract(参考訳): 近年,ヒトのポーズ推定手法の多くは熱マップ回帰に基づく。
キーポイントの最終座標はヒートマップを直接復号することで得られる。
本稿では,より正確なローカライズ結果を得るためのより良いアプローチを提案する。
主に2つの改善提案を行った。
1)大まかで正確な位置決めには,異なる特徴や方法を適用する必要がある。
2)キーポイント間の関係を考慮する。
具体的には,2段階のグラフベースおよびモデル非依存フレームワークであるGraph-PCNNを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各ガイドポイントに対して、ローカライズサブネットにより異なる視覚特徴を抽出する。
誘導点間の関係は、より正確な局所化結果を得るために、グラフポーズリファインメントモジュールによって検討される。
実験によると、Graph-PCNNは様々なバックボーンで使用することができ、パフォーマンスを大きなマージンで向上させることができる。
ベルとホイッスルがなければ、私たちの最良のモデルは、COCOテストデブ分割に関する新しい最先端の76.8%APを達成することができる。
関連論文リスト
- KGpose: Keypoint-Graph Driven End-to-End Multi-Object 6D Pose Estimation via Point-Wise Pose Voting [0.0]
KGposeは、複数のオブジェクトの6Dポーズ推定のためのエンドツーエンドフレームワークである。
我々のアプローチはキーポイントベースの手法とキーポイントグラフによる学習可能なポーズ回帰を組み合わせる。
論文 参考訳(メタデータ) (2024-07-12T01:06:00Z) - Graph R-CNN: Towards Accurate 3D Object Detection with
Semantic-Decorated Local Graph [26.226885108862735]
2段検出器は3次元物体検出で大いに人気を博している。
ほとんどの2段式3D検出器は、2段目のRoI特徴抽出にグリッドポイント、ボクセルグリッド、またはサンプルキーポイントを利用する。
本稿ではこの問題を3つの側面で解決する。
論文 参考訳(メタデータ) (2022-08-07T02:56:56Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Is 2D Heatmap Representation Even Necessary for Human Pose Estimation? [44.313782042852246]
キーポイント座標(emphSimDR)のための textbfSimple yet promising textbfDisentangled textbfRepresentation を提案する。
本稿では,キーポイント位置に対する水平座標と垂直座標の表現をアンタングル化することを提案する。
論文 参考訳(メタデータ) (2021-07-07T16:20:12Z) - Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression [81.05772887221333]
従来のキーポイント検出およびグループ化フレームワークに劣る密度の高いキーポイント回帰フレームワークについて検討する。
我々は,dekr(disentangled keypoint regression)という,単純かつ効果的な手法を提案する。
提案手法はキーポイント検出法やグループ化法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-06T05:54:46Z) - Heatmap Regression via Randomized Rounding [105.75014893647538]
本稿では,サブピクセルローカライゼーション問題に対処する簡易かつ効果的な量子化システムを提案する。
提案システムでは,数値座標の分数部をトレーニング中の確率的アプローチを用いて基底真理熱マップに符号化する。
論文 参考訳(メタデータ) (2020-09-01T04:54:22Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z) - Pixel-in-Pixel Net: Towards Efficient Facial Landmark Detection in the
Wild [104.61677518999976]
顔のランドマークを検出するために,Pixel-in-Pixel Net(PIPNet)を提案する。
提案モデルは,熱マップ回帰に基づく新しい検出ヘッドを備える。
PIPNetのクロスドメイン一般化能力をさらに向上するため,カリキュラムによる自己学習を提案する。
論文 参考訳(メタデータ) (2020-03-08T12:23:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。