論文の概要: Rethinking pose estimation in crowds: overcoming the detection
information-bottleneck and ambiguity
- arxiv url: http://arxiv.org/abs/2306.07879v2
- Date: Sat, 30 Sep 2023 15:12:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-03 17:24:21.142158
- Title: Rethinking pose estimation in crowds: overcoming the detection
information-bottleneck and ambiguity
- Title(参考訳): 群集におけるポーズ推定の再考--発見情報とあいまいさを克服する
- Authors: Mu Zhou and Lucas Stoffl and Mackenzie Weygandt Mathis and Alexander
Mathis
- Abstract要約: 個人間の頻繁な相互作用は、ポーズ推定アルゴリズムの基本的な課題である。
ボトムアップ条件付きトップダウンポーズ推定と呼ばれる新しいパイプラインを提案する。
動物と人間のポーズ推定ベンチマークにおけるアプローチの性能と効率を実証する。
- 参考スコア(独自算出の注目度): 46.10812760258666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Frequent interactions between individuals are a fundamental challenge for
pose estimation algorithms. Current pipelines either use an object detector
together with a pose estimator (top-down approach), or localize all body parts
first and then link them to predict the pose of individuals (bottom-up). Yet,
when individuals closely interact, top-down methods are ill-defined due to
overlapping individuals, and bottom-up methods often falsely infer connections
to distant bodyparts. Thus, we propose a novel pipeline called bottom-up
conditioned top-down pose estimation (BUCTD) that combines the strengths of
bottom-up and top-down methods. Specifically, we propose to use a bottom-up
model as the detector, which in addition to an estimated bounding box provides
a pose proposal that is fed as condition to an attention-based top-down model.
We demonstrate the performance and efficiency of our approach on animal and
human pose estimation benchmarks. On CrowdPose and OCHuman, we outperform
previous state-of-the-art models by a significant margin. We achieve 78.5 AP on
CrowdPose and 48.5 AP on OCHuman, an improvement of 8.6% and 7.8% over the
prior art, respectively. Furthermore, we show that our method strongly improves
the performance on multi-animal benchmarks involving fish and monkeys. The code
is available at https://github.com/amathislab/BUCTD
- Abstract(参考訳): 個人間の頻繁な相互作用はポーズ推定アルゴリズムの基本的な課題である。
現在のパイプラインは、ポーズ推定器(トップダウンアプローチ)と共にオブジェクト検出器を使用するか、まずすべての身体部位をローカライズし、それらをリンクして個人のポーズを予測する(ボットアップ)。
しかし、個人が密接な相互作用を行う場合、トップダウンメソッドは重複する個人によって定義が不明確になる。
そこで本研究では,ボトムアップ法とトップダウン法を組み合わせたボトムアップ条件付きトップダウンポーズ推定(buctd)という新しいパイプラインを提案する。
具体的には,ボトムアップモデルを検知器として用いることを提案する。推定境界ボックスに加えて,注意に基づくトップダウンモデルに条件として与えるポーズの提案を行う。
動物および人間のポーズ推定ベンチマークにおけるアプローチの性能と効率を実証する。
CrowdPoseとOCHumanでは、従来の最先端モデルよりも大きなマージンで優れています。
crowdposeでは78.5 ap,ochumanでは48.5 ap,先行技術では8.6%,先行技術では7.8%改善した。
さらに,本手法は魚やサルを含むマルチアニマルベンチマークの性能を強く向上させることを示す。
コードはhttps://github.com/amathislab/buctdで入手できる。
関連論文リスト
- AlphaPose: Whole-Body Regional Multi-Person Pose Estimation and Tracking
in Real-Time [47.19339667836196]
提案するAlphaPoseは,リアルタイムに動作しながら,身体全体のポーズを正確に推定・追跡できるシステムである。
我々は,COCO-全体,COCO,PoseTrack,提案したHalpe-FullBodyポーズ推定データセットにおいて,現在の最先端手法よりも高速かつ高精度であることを示す。
論文 参考訳(メタデータ) (2022-11-07T09:15:38Z) - Bottom-Up 2D Pose Estimation via Dual Anatomical Centers for Small-Scale
Persons [75.86463396561744]
マルチパーソン2Dポーズ推定では、ボトムアップ手法は同時にすべての人のポーズを予測する。
本手法は,バウンディングボックス精度を38.4%改善し,バウンディングボックスリコールを39.1%改善した。
ヒトのポーズAP評価では,COCOテストデフセット上で新しいSOTA(71.0 AP)を単一スケールテストで達成する。
論文 参考訳(メタデータ) (2022-08-25T10:09:10Z) - Explicit Occlusion Reasoning for Multi-person 3D Human Pose Estimation [33.86986028882488]
咬合は, 咬合者の形状, 外観, 位置の変動が大きいため, 単眼多面体3次元ポーズ推定において大きな脅威となる。
既存のメソッドは、ポーズ先/制約、データ拡張、暗黙の推論でオクルージョンを処理しようとする。
本研究では、ボトムアップ型多人数ポーズ推定を大幅に改善する、このプロセスを明示的にモデル化する手法を開発した。
論文 参考訳(メタデータ) (2022-07-29T22:12:50Z) - Dual networks based 3D Multi-Person Pose Estimation from Monocular Video [42.01876518017639]
複数人の3Dポーズ推定はシングルポーズ推定よりも難しい。
既存のトップダウンとボトムアップのアプローチでは、推定が検出エラーに悩まされる。
我々は,トップダウンアプローチとボトムアップアプローチを統合して,その強みを活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T08:53:38Z) - Direct Dense Pose Estimation [138.56533828316833]
複雑な人間のポーズ推定は、RGB画像と人体の表面との密接な対応を学習する問題である。
従来より密集したポーズ推定手法は、すべてMask R-CNNフレームワークに基づいており、まず各人物のバウンディングボックスを識別しようとするトップダウン方式で動作している。
そこで我々は,DDP (Direct Dense Pose) という,高密度ポーズ推定問題の解法を提案する。
論文 参考訳(メタデータ) (2022-04-04T06:14:38Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View
Geometry [62.29762409558553]
マルチパーソナライズされた3次元ポーズ推定手法における特徴マッチングと深さ推定のコアは、エピポーラ制約である。
スパサーの群衆シーンにおけるこの定式化の良好なパフォーマンスにもかかわらず、その効果はより密集した群衆の状況下でしばしば挑戦される。
本稿では,マルチパーソン3次元ポーズ推定式から脱却し,群衆ポーズ推定として再編成する。
論文 参考訳(メタデータ) (2020-07-21T17:59:36Z) - HDNet: Human Depth Estimation for Multi-Person Camera-Space Localization [83.57863764231655]
本稿では,根の絶対的局所化のためのエンドツーエンドフレームワークであるHuman Depth Estimation Network (HDNet)を提案する。
関節間の特徴伝達に骨格ベースのグラフニューラルネットワーク(GNN)を用いる。
我々は,2つのベンチマークデータセットを用いて,ルートジョイントローカライゼーションとルート相対的な3次元ポーズ推定タスクについて,HDNetの評価を行った。
論文 参考訳(メタデータ) (2020-07-17T12:44:23Z) - SMPR: Single-Stage Multi-Person Pose Regression [41.096103136666834]
SMPRと呼ばれる新しいシングルステージ多人数ポーズレグレッションが提示される。
これは、密集した予測のパラダイムに従い、すべての場所からインスタンス対応キーポイントを予測する。
提案手法は,既存の単段法よりも優れているだけでなく,最新のボトムアップ法と競合することを示す。
論文 参考訳(メタデータ) (2020-06-28T11:26:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。