論文の概要: AlphaPose: Whole-Body Regional Multi-Person Pose Estimation and Tracking
in Real-Time
- arxiv url: http://arxiv.org/abs/2211.03375v1
- Date: Mon, 7 Nov 2022 09:15:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 17:30:36.925976
- Title: AlphaPose: Whole-Body Regional Multi-Person Pose Estimation and Tracking
in Real-Time
- Title(参考訳): AlphaPose:全身体的マルチパーソンポーズ推定とリアルタイムでの追跡
- Authors: Hao-Shu Fang, Jiefeng Li, Hongyang Tang, Chao Xu, Haoyi Zhu, Yuliang
Xiu, Yong-Lu Li, Cewu Lu
- Abstract要約: 提案するAlphaPoseは,リアルタイムに動作しながら,身体全体のポーズを正確に推定・追跡できるシステムである。
我々は,COCO-全体,COCO,PoseTrack,提案したHalpe-FullBodyポーズ推定データセットにおいて,現在の最先端手法よりも高速かつ高精度であることを示す。
- 参考スコア(独自算出の注目度): 47.19339667836196
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate whole-body multi-person pose estimation and tracking is an important
yet challenging topic in computer vision. To capture the subtle actions of
humans for complex behavior analysis, whole-body pose estimation including the
face, body, hand and foot is essential over conventional body-only pose
estimation. In this paper, we present AlphaPose, a system that can perform
accurate whole-body pose estimation and tracking jointly while running in
realtime. To this end, we propose several new techniques: Symmetric Integral
Keypoint Regression (SIKR) for fast and fine localization, Parametric Pose
Non-Maximum-Suppression (P-NMS) for eliminating redundant human detections and
Pose Aware Identity Embedding for jointly pose estimation and tracking. During
training, we resort to Part-Guided Proposal Generator (PGPG) and multi-domain
knowledge distillation to further improve the accuracy. Our method is able to
localize whole-body keypoints accurately and tracks humans simultaneously given
inaccurate bounding boxes and redundant detections. We show a significant
improvement over current state-of-the-art methods in both speed and accuracy on
COCO-wholebody, COCO, PoseTrack, and our proposed Halpe-FullBody pose
estimation dataset. Our model, source codes and dataset are made publicly
available at https://github.com/MVIG-SJTU/AlphaPose.
- Abstract(参考訳): 人体全体の正確なポーズ推定と追跡はコンピュータビジョンにおいて重要な課題である。
複雑な行動分析のために人間の微妙な行動を捉えるためには、顔、体、手、足を含む全身のポーズ推定が従来の身体のみのポーズ推定よりも不可欠である。
本稿では,リアルタイムに動作中の身体の正確なポーズ推定とトラッキングを行うシステムであるalphaposeを提案する。
そこで本研究では, 高速かつ微細な位置推定のためのSIKR(Symmetric Integral Keypoint Regression), 冗長な人間の検出を除去するためのP-NMS(Parametric Pose Non-Maximum-Suppression), 共同ポーズ推定と追跡のためのPose Aware Identity Embeddingを提案する。
トレーニング中、さらに精度を向上させるために、Part-Guided Proposal Generator(PGPG)とマルチドメイン知識蒸留を利用する。
提案手法は,人体全体のキーポイントを高精度にローカライズし,不正確な境界ボックスと冗長な検出を同時に追跡する。
我々は,COCO-全体,COCO,PoseTrack,提案したHalpe-FullBodyポーズ推定データセットにおいて,現在の最先端手法よりも高速かつ高精度であることを示す。
我々のモデル、ソースコード、データセットはhttps://github.com/MVIG-SJTU/AlphaPose.comで公開されています。
関連論文リスト
- UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - Improving Multi-Person Pose Tracking with A Confidence Network [37.84514614455588]
我々は、人間の検出とポーズ推定を改善するために、新しいキーポイント信頼ネットワークと追跡パイプラインを開発する。
具体的には、キーポイント信頼ネットワークは、各キーポイントが閉鎖されているかどうかを決定するように設計されている。
追従パイプラインでは,Bbox-revisionモジュールが欠落検出を低減し,ID-retrieveモジュールが損失軌跡を補正する。
論文 参考訳(メタデータ) (2023-10-29T06:36:27Z) - PoseExaminer: Automated Testing of Out-of-Distribution Robustness in
Human Pose and Shape Estimation [15.432266117706018]
我々は人間のポーズのイメージの多様体を探索するために、きめ細かい方法で制御できるシミュレータを開発した。
本稿では,HPSアルゴリズムを自動診断するPoseExaminerという学習ベースのテスト手法を提案する。
我々のPoseExaminerは、現実のシナリオに関係のある現在の最先端モデルにおいて、様々な制限を発見できることを示す。
論文 参考訳(メタデータ) (2023-03-13T17:58:54Z) - Kinematic-aware Hierarchical Attention Network for Human Pose Estimation
in Videos [17.831839654593452]
従来の人間のポーズ推定手法は, 連続するフレームの特徴を活用することで, 有望な結果を示した。
ほとんどのアプローチでは、ジッターに精度を妥協し、人間の動きの時間的側面を理解しない。
キネマティックなキーポイント機能を利用するアーキテクチャを設計する。
論文 参考訳(メタデータ) (2022-11-29T01:46:11Z) - Dual networks based 3D Multi-Person Pose Estimation from Monocular Video [42.01876518017639]
複数人の3Dポーズ推定はシングルポーズ推定よりも難しい。
既存のトップダウンとボトムアップのアプローチでは、推定が検出エラーに悩まされる。
我々は,トップダウンアプローチとボトムアップアプローチを統合して,その強みを活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T08:53:38Z) - Improving Robustness and Accuracy via Relative Information Encoding in
3D Human Pose Estimation [59.94032196768748]
位置および時間的拡張表現を出力する相対情報符号化法を提案する。
提案手法は2つの公開データセット上で最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-07-29T14:12:19Z) - PoseDet: Fast Multi-Person Pose Estimation Using Pose Embedding [16.57620683425904]
本稿では,PoseDet (Estimating Pose by Detection) という,身体関節の局所化と関連付けを同時に行う新しいフレームワークを提案する。
また,キーポイントの位置からオブジェクトを表現するために,キーポイント認識型ポーズ埋め込みを提案する。
この単純なフレームワークは、最先端の手法と比較してCOCOベンチマークで前例のないスピードと競争精度を達成する。
論文 参考訳(メタデータ) (2021-07-22T05:54:00Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - Human POSEitioning System (HPS): 3D Human Pose Estimation and
Self-localization in Large Scenes from Body-Mounted Sensors [71.29186299435423]
HPS(Human POSEitioning System)は、周囲の環境の3Dスキャンで登録された人間の完全な3Dポーズを回復する手法です。
最適化に基づく統合は2つの利点を生かし、結果としてドリフトのないポーズの精度が得られることを示す。
hpsは、人間が外部カメラに直接視線を向けなくてもシーンと対話できるvr/arアプリケーションとして使用できる。
論文 参考訳(メタデータ) (2021-03-31T17:58:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。