論文の概要: MDPose: Real-Time Multi-Person Pose Estimation via Mixture Density Model
- arxiv url: http://arxiv.org/abs/2302.08751v2
- Date: Mon, 8 May 2023 12:22:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 23:00:47.122598
- Title: MDPose: Real-Time Multi-Person Pose Estimation via Mixture Density Model
- Title(参考訳): mdpose:混合密度モデルによるリアルタイム多人数ポーズ推定
- Authors: Seunghyeon Seo, Jaeyoung Yoo, Jihye Hwang, Nojun Kwak
- Abstract要約: 本稿では,人間のキーポイントの結合分布をモデル化し,一段階のインスタンス認識ポーズ推定手法を提案する。
我々のMDPoseは、人間のキーポイントの高次元の関節分布を学習し、最先端の性能を達成する。
- 参考スコア(独自算出の注目度): 27.849059115252008
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One of the major challenges in multi-person pose estimation is instance-aware
keypoint estimation. Previous methods address this problem by leveraging an
off-the-shelf detector, heuristic post-grouping process or explicit instance
identification process, hindering further improvements in the inference speed
which is an important factor for practical applications. From the statistical
point of view, those additional processes for identifying instances are
necessary to bypass learning the high-dimensional joint distribution of human
keypoints, which is a critical factor for another major challenge, the
occlusion scenario. In this work, we propose a novel framework of single-stage
instance-aware pose estimation by modeling the joint distribution of human
keypoints with a mixture density model, termed as MDPose. Our MDPose estimates
the distribution of human keypoints' coordinates using a mixture density model
with an instance-aware keypoint head consisting simply of 8 convolutional
layers. It is trained by minimizing the negative log-likelihood of the ground
truth keypoints. Also, we propose a simple yet effective training strategy,
Random Keypoint Grouping (RKG), which significantly alleviates the underflow
problem leading to successful learning of relations between keypoints. On
OCHuman dataset, which consists of images with highly occluded people, our
MDPose achieves state-of-the-art performance by successfully learning the
high-dimensional joint distribution of human keypoints. Furthermore, our MDPose
shows significant improvement in inference speed with a competitive accuracy on
MS COCO, a widely-used human keypoint dataset, thanks to the proposed much
simpler single-stage pipeline.
- Abstract(参考訳): 多人数のポーズ推定における大きな課題の1つは、インスタンス認識キーポイント推定である。
従来の手法では、既製の検知器、ヒューリスティックな後グループ化プロセス、明示的なインスタンス識別プロセスを利用してこの問題に対処しており、実用上重要な要素である推論速度のさらなる改善を妨げている。
統計学的観点から見ると、これらの追加プロセスは、人間のキーポイントの高次元の関節分布の学習をバイパスするために必要であり、これはもう一つの大きな課題である閉塞シナリオにとって重要な要素である。
本研究では,mdposeと呼ばれる混合密度モデルを用いて,人間のキーポイントの結合分布をモデル化し,一段階のインスタンス認識ポーズ推定の新たな枠組みを提案する。
MDPoseは、8つの畳み込み層からなるインスタンス認識キーポイントヘッドと混合密度モデルを用いて、人間のキーポイント座標の分布を推定する。
基底真理キーポイントの負のログライク度を最小化することで訓練される。
また,単純かつ効果的なトレーニング戦略であるランダム・キーポイント・グルーピング(rkg)を提案する。
高度に隠蔽された人物の画像からなるOCHumanデータセットでは,人間のキーポイントの高次元関節分布の学習に成功して最先端の性能を実現する。
さらに,提案したより単純な単一ステージパイプラインにより,MS COCO, 広く使用されている人間のキーポイントデータセットに対して, 競合精度で推論速度が大幅に向上したことを示す。
関連論文リスト
- SDR-GAIN: A High Real-Time Occluded Pedestrian Pose Completion Method
for Autonomous Driving [3.3113002380233447]
本稿では,SDR-GAIN(SDR-GAIN)と呼ばれる新規な歩行者ポーズキーポイント完了手法を提案する。
SDR-GAINアルゴリズムは、約0.4msの驚くほど短い実行時間を示し、例外的なリアルタイム性能を誇っている。
論文 参考訳(メタデータ) (2023-06-06T09:35:56Z) - 2D Human Pose Estimation with Explicit Anatomical Keypoints Structure
Constraints [15.124606575017621]
本稿では,解剖学的キーポイント構造制約を明示した新しい2次元ポーズ推定手法を提案する。
提案手法は,既存のボトムアップやトップダウンの人間のポーズ推定手法に組み込むことができる。
提案手法は,既存のボトムアップとトップダウンの人間のポーズ推定手法に対して良好に機能する。
論文 参考訳(メタデータ) (2022-12-05T11:01:43Z) - Direct Dense Pose Estimation [138.56533828316833]
複雑な人間のポーズ推定は、RGB画像と人体の表面との密接な対応を学習する問題である。
従来より密集したポーズ推定手法は、すべてMask R-CNNフレームワークに基づいており、まず各人物のバウンディングボックスを識別しようとするトップダウン方式で動作している。
そこで我々は,DDP (Direct Dense Pose) という,高密度ポーズ推定問題の解法を提案する。
論文 参考訳(メタデータ) (2022-04-04T06:14:38Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - Greedy Offset-Guided Keypoint Grouping for Human Pose Estimation [31.468003041368814]
私たちは、異なる人物からすべてのキーポイントを無差別に推測するために、Hourglass Networkを使用します。
我々は、予測された誘導オフセットを利用して、候補のキーポイントを複数の人間のポーズにグループ化します。
当社のアプローチは、公正な条件下でのCOCOデータセットの課題に関する最先端技術に匹敵するものです。
論文 参考訳(メタデータ) (2021-07-07T09:32:01Z) - SIMPLE: SIngle-network with Mimicking and Point Learning for Bottom-up
Human Pose Estimation [81.03485688525133]
Single-network with Mimicking and Point Learning for Bottom-up Human Pose Estimation (SIMPLE) を提案する。
具体的には、トレーニングプロセスにおいて、SIMPLEが高性能なトップダウンパイプラインからのポーズ知識を模倣できるようにする。
さらに、SIMPLEは人間検出とポーズ推定を統一的なポイントラーニングフレームワークとして定式化し、単一ネットワークで相互に補完する。
論文 参考訳(メタデータ) (2021-04-06T13:12:51Z) - Differentiable Hierarchical Graph Grouping for Multi-Person Pose
Estimation [95.72606536493548]
複数の人の身体のキーポイントを同時にローカライズするため、複数の人物のポーズ推定は困難である。
ボトムアップ型多人数ポーズ推定タスクにおけるグラフグループ化を学習するための,新しい微分可能な階層グラフグループ化(HGG)手法を提案する。
論文 参考訳(メタデータ) (2020-07-23T08:46:22Z) - Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View
Geometry [62.29762409558553]
マルチパーソナライズされた3次元ポーズ推定手法における特徴マッチングと深さ推定のコアは、エピポーラ制約である。
スパサーの群衆シーンにおけるこの定式化の良好なパフォーマンスにもかかわらず、その効果はより密集した群衆の状況下でしばしば挑戦される。
本稿では,マルチパーソン3次元ポーズ推定式から脱却し,群衆ポーズ推定として再編成する。
論文 参考訳(メタデータ) (2020-07-21T17:59:36Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。