論文の概要: AdaptivePose: Human Parts as Adaptive Points
- arxiv url: http://arxiv.org/abs/2112.13635v1
- Date: Mon, 27 Dec 2021 12:46:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-28 20:22:09.459967
- Title: AdaptivePose: Human Parts as Adaptive Points
- Title(参考訳): AdaptivePose: 適応ポイントとしての人間部品
- Authors: Yabo Xiao, Xiaojuan Wang, Dongdong Yu, Guoli Wang, Qian Zhang, Mingshu
He
- Abstract要約: 本稿では,人間の部位をポイントとして表現し,新しい身体表現を提案する。
DLA-34では67.4% AP / 29.4 fps、テストデブデータセットでは71.3% AP / 9.1 fps、HRNet-W48では9.1 fpsである。
- 参考スコア(独自算出の注目度): 7.833251195123861
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-person pose estimation methods generally follow top-down and bottom-up
paradigms, both of which can be considered as two-stage approaches thus leading
to the high computation cost and low efficiency. Towards a compact and
efficient pipeline for multi-person pose estimation task, in this paper, we
propose to represent the human parts as points and present a novel body
representation, which leverages an adaptive point set including the human
center and seven human-part related points to represent the human instance in a
more fine-grained manner. The novel representation is more capable of capturing
the various pose deformation and adaptively factorizes the long-range
center-to-joint displacement thus delivers a single-stage differentiable
network to more precisely regress multi-person pose, termed as AdaptivePose.
For inference, our proposed network eliminates the grouping as well as
refinements and only needs a single-step disentangling process to form
multi-person pose. Without any bells and whistles, we achieve the best
speed-accuracy trade-offs of 67.4% AP / 29.4 fps with DLA-34 and 71.3% AP / 9.1
fps with HRNet-W48 on COCO test-dev dataset.
- Abstract(参考訳): 複数の人物のポーズ推定法は一般にトップダウンとボトムアップのパラダイムに従っており、どちらも2段階のアプローチとみなすことができ、高い計算コストと低い効率をもたらす。
本稿では、多人数ポーズ推定タスクのためのコンパクトで効率的なパイプラインに向けて、人間部位をポイントとして表現し、人間中心を含む適応点集合と、7つの人間関連点を活用して、より細かな方法で人間のインスタンスを表現する新しいボディ表現を提案する。
斬新な表現は、様々なポーズの変形を捉えることができ、長距離中心対結合の変位を適応的に分解することで、AdaptivePoseと呼ばれるより正確に複数の人物のポーズを復元するシングルステージの微分可能なネットワークを提供する。
推測のために,提案するネットワークはグループ化と改良を排除し,複数対人ポーズを形成するための単一ステップの切り離しプロセスのみを必要とする。
DLA-34では67.4% AP / 29.4 fps、COCOテストデブデータセットでは71.3% AP / 9.1 fps、HRNet-W48では9.1 fpsである。
関連論文リスト
- AdaptivePose++: A Powerful Single-Stage Network for Multi-Person Pose
Regression [66.39539141222524]
そこで本研究では,ヒトの部位を適応点として表現し,微細な身体表現法を提案する。
提案するボディ表現では,AdaptivePoseと呼ばれる,コンパクトなシングルステージ多人数ポーズ回帰ネットワークを提供する。
本稿では,AdaptivePoseの有効性を検証するために,2D/3D多人数ポーズ推定タスクにAdaptivePoseを用いる。
論文 参考訳(メタデータ) (2022-10-08T12:54:20Z) - Bottom-Up 2D Pose Estimation via Dual Anatomical Centers for Small-Scale
Persons [75.86463396561744]
マルチパーソン2Dポーズ推定では、ボトムアップ手法は同時にすべての人のポーズを予測する。
本手法は,バウンディングボックス精度を38.4%改善し,バウンディングボックスリコールを39.1%改善した。
ヒトのポーズAP評価では,COCOテストデフセット上で新しいSOTA(71.0 AP)を単一スケールテストで達成する。
論文 参考訳(メタデータ) (2022-08-25T10:09:10Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - Direct Multi-view Multi-person 3D Pose Estimation [138.48139701871213]
マルチビュー画像からマルチパーソン3Dポーズを推定するためのMulti-view Pose Transformer(MvP)を提案する。
MvPは、中間タスクに頼ることなく、複数の人物の3Dポーズを直接クリーンで効率的な方法で回帰する。
我々は,MvPモデルがより効率的でありながら,いくつかのベンチマークにおいて最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-07T13:09:20Z) - InsPose: Instance-Aware Networks for Single-Stage Multi-Person Pose
Estimation [37.80984212500406]
本稿では,インスタンス認識型動的ネットワークを用いて,シンプルで効果的な解を提案する。
具体的には、各インスタンスのネットワークパラメータを適応的に(一部)調整するインスタンス対応モジュールを提案する。
我々のソリューションは、コンパクトなエンドツーエンドのトレーニング可能なパイプラインを維持しながら、様々なポーズを認識するためのネットワークの容量と適応性を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-07-19T15:56:09Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View
Geometry [62.29762409558553]
マルチパーソナライズされた3次元ポーズ推定手法における特徴マッチングと深さ推定のコアは、エピポーラ制約である。
スパサーの群衆シーンにおけるこの定式化の良好なパフォーマンスにもかかわらず、その効果はより密集した群衆の状況下でしばしば挑戦される。
本稿では,マルチパーソン3次元ポーズ推定式から脱却し,群衆ポーズ推定として再編成する。
論文 参考訳(メタデータ) (2020-07-21T17:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。