論文の概要: OmniPose: A Multi-Scale Framework for Multi-Person Pose Estimation
- arxiv url: http://arxiv.org/abs/2103.10180v1
- Date: Thu, 18 Mar 2021 11:30:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-19 23:55:26.627287
- Title: OmniPose: A Multi-Scale Framework for Multi-Person Pose Estimation
- Title(参考訳): OmniPose: マルチパーソンポース推定のためのマルチスケールフレームワーク
- Authors: Bruno Artacho and Andreas Savakis
- Abstract要約: 本稿では,多人数ポーズ推定のための最先端結果を実現する,エンドツーエンドのトレーニング可能な単一パスフレームワークを提案する。
OmniPoseはマルチパーソンポーズ推定のための頑健で効率的なアーキテクチャであることを示す。
- 参考スコア(独自算出の注目度): 3.8073142980733
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose OmniPose, a single-pass, end-to-end trainable framework, that
achieves state-of-the-art results for multi-person pose estimation. Using a
novel waterfall module, the OmniPose architecture leverages multi-scale feature
representations that increase the effectiveness of backbone feature extractors,
without the need for post-processing. OmniPose incorporates contextual
information across scales and joint localization with Gaussian heatmap
modulation at the multi-scale feature extractor to estimate human pose with
state-of-the-art accuracy. The multi-scale representations, obtained by the
improved waterfall module in OmniPose, leverage the efficiency of progressive
filtering in the cascade architecture, while maintaining multi-scale
fields-of-view comparable to spatial pyramid configurations. Our results on
multiple datasets demonstrate that OmniPose, with an improved HRNet backbone
and waterfall module, is a robust and efficient architecture for multi-person
pose estimation that achieves state-of-the-art results.
- Abstract(参考訳): 提案するOmniPoseは,複数対人ポーズ推定のための最先端の学習結果を実現する,ワンパスでエンドツーエンドのトレーニング可能なフレームワークである。
新たなウォーターフォールモジュールを使用すると、omniposeアーキテクチャは、ポストプロセッシングを必要とせずに、バックボーン機能抽出器の有効性を高めるマルチスケールの機能表現を利用する。
OmniPoseは、マルチスケールの特徴抽出器において、スケールにわたるコンテキスト情報とガウス熱マップ変調との結合位置を組み込んで、最先端の精度で人間のポーズを推定する。
OmniPoseで改良されたウォーターフォールモジュールによって得られたマルチスケール表現は、空間ピラミッド構成に匹敵するマルチスケールフィールドを維持しながら、カスケードアーキテクチャにおけるプログレッシブフィルタリングの効率を活用している。
HRNetのバックボーンとウォーターフォールモジュールを改良したOmniPoseは、複数の人物のポーズ推定のための堅牢で効率的なアーキテクチャであり、最先端の結果が得られることを示す。
関連論文リスト
- SkelFormer: Markerless 3D Pose and Shape Estimation using Skeletal Transformers [57.46911575980854]
マルチビュー人間のポーズと形状推定のための新しいマーカーレスモーションキャプチャパイプラインであるSkelFormerを紹介する。
提案手法は,まず市販の2次元キーポイント推定器を用いて,大規模インザミルドデータに基づいて事前トレーニングを行い,3次元関節位置を求める。
次に、重雑音観測から、関節の位置をポーズと形状の表現にマッピングする回帰に基づく逆運動性骨格変換器を設計する。
論文 参考訳(メタデータ) (2024-04-19T04:51:18Z) - FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - AdaptivePose++: A Powerful Single-Stage Network for Multi-Person Pose
Regression [66.39539141222524]
そこで本研究では,ヒトの部位を適応点として表現し,微細な身体表現法を提案する。
提案するボディ表現では,AdaptivePoseと呼ばれる,コンパクトなシングルステージ多人数ポーズ回帰ネットワークを提供する。
本稿では,AdaptivePoseの有効性を検証するために,2D/3D多人数ポーズ推定タスクにAdaptivePoseを用いる。
論文 参考訳(メタデータ) (2022-10-08T12:54:20Z) - BAPose: Bottom-Up Pose Estimation with Disentangled Waterfall
Representations [3.8073142980733]
BAPoseは、多人数ポーズ推定のための最先端結果を実現する新しいフレームワークである。
挑戦的なCOCOとCrowdPoseデータセットに関する我々の結果は、BAPoseが効率的で堅牢なフレームワークであることを示している。
論文 参考訳(メタデータ) (2021-12-20T18:07:09Z) - Direct Multi-view Multi-person 3D Pose Estimation [138.48139701871213]
マルチビュー画像からマルチパーソン3Dポーズを推定するためのMulti-view Pose Transformer(MvP)を提案する。
MvPは、中間タスクに頼ることなく、複数の人物の3Dポーズを直接クリーンで効率的な方法で回帰する。
我々は,MvPモデルがより効率的でありながら,いくつかのベンチマークにおいて最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-07T13:09:20Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - DeepMultiCap: Performance Capture of Multiple Characters Using Sparse
Multiview Cameras [63.186486240525554]
deep multicapは、スパースマルチビューカメラを用いたマルチパーソンパフォーマンスキャプチャのための新しい手法である。
本手法では,事前走査型テンプレートモデルを用いることなく,時間変化した表面の詳細をキャプチャできる。
論文 参考訳(メタデータ) (2021-05-01T14:32:13Z) - Multi-Person Pose Estimation with Enhanced Feature Aggregation and
Selection [33.15192824888279]
複数人物のポーズ推定のためのEFASNet(Enhanced Feature Aggregation and Selection Network)を提案する。
我々の手法は、混み合った、散らばった、ぎこちないシーンをうまく扱える。
総合的な実験により、提案手法は最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-03-20T08:33:25Z) - UniPose: Unified Human Pose Estimation in Single Images and Videos [3.04585143845864]
本稿では,我々の「ウォーターフォール」アトラス空間ポーリングアーキテクチャに基づく,人間のポーズ推定のための統一的なフレームワークを提案する。
UniPoseは、コンテキストセグメンテーションとジョイントローカライゼーションを取り入れて、人間のポーズを単一のステージで推定する。
複数のデータセットで得られた結果は、ResNetのバックボーンとウォーターフォールモジュールを備えたUniPoseが、ポーズ推定のための堅牢で効率的なアーキテクチャであることを実証している。
論文 参考訳(メタデータ) (2020-01-22T15:59:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。