論文の概要: Multi-Person Full Body Pose Estimation
- arxiv url: http://arxiv.org/abs/2008.10060v1
- Date: Sun, 23 Aug 2020 15:47:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 03:13:29.944066
- Title: Multi-Person Full Body Pose Estimation
- Title(参考訳): 多人数全身ポーズ推定
- Authors: Haoyi Zhu, Cheng Jie, Shaofei Jiang
- Abstract要約: 我々の研究は、全身のポーズを推定できる知識蒸留による統合モデルを開発した。
我々のモデルは、手動で注釈付けされた検証データセット上で51.5mAPを達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-person pose estimation plays an important role in many fields. Although
previous works have researched a lot on different parts of human pose
estimation, full body pose estimation for multi-person still needs further
research. Our work has developed an integrated model through knowledge
distillation which can estimate full body poses. Trained based on the AlphaPose
system and MSCOCO2017 dataset, our model achieves 51.5 mAP on the validation
dataset annotated manually by ourselves. Related resources are available at
https://esflfei.github.io/esflfei.gethub.io/website.html.
- Abstract(参考訳): 多人数のポーズ推定は多くの分野において重要な役割を果たす。
従来の研究は、人間のポーズ推定の様々な部分について多くの研究を行ってきたが、マルチパーソンのフルボディポーズ推定は、まださらなる研究が必要である。
本研究は,全身のポーズを推定できる知識蒸留による統合モデルを開発した。
AlphaPoseシステムとMSCOCO2017データセットに基づいてトレーニングされ、我々のモデルは手動で注釈付けされた検証データセット上で51.5mAPを達成する。
関連リソースはhttps://esflfei.github.io/esflfei.gethub.io/website.htmlで入手できる。
関連論文リスト
- VoxelKeypointFusion: Generalizable Multi-View Multi-Person Pose Estimation [45.085830389820956]
本研究では,多視点多人数ポーズ推定器のデータセットに対する一般化能力の評価を行う。
また、深度情報を利用した改良も検討している。
この新しいアプローチは、未知のデータセットだけでなく、異なるキーポイントにもうまく一般化できるため、最初のマルチパーソン全体の推定器が提示される。
論文 参考訳(メタデータ) (2024-10-24T13:28:40Z) - RTMW: Real-Time Multi-Person 2D and 3D Whole-body Pose Estimation [9.121372333621538]
全体ポーズ推定は、人体のきめ細かいポーズ情報を予測することを目的としている。
本稿では,RTMW (Real-Time Multi-person Whole-body pose Estimation model) について述べる。
論文 参考訳(メタデータ) (2024-07-11T16:15:47Z) - PF-LRM: Pose-Free Large Reconstruction Model for Joint Pose and Shape
Prediction [77.89935657608926]
画像から3Dオブジェクトを再構成するためのPF-LRM(Pose-Free Large Restruction Model)を提案する。
PF-LRMは1つのA100 GPU上で1.3秒で相対カメラのポーズを同時に推定する。
論文 参考訳(メタデータ) (2023-11-20T18:57:55Z) - Delving Deeper into Data Scaling in Masked Image Modeling [145.36501330782357]
視覚認識のためのマスク付き画像モデリング(MIM)手法のスケーリング能力に関する実証的研究を行った。
具体的には、Webで収集したCoyo-700Mデータセットを利用する。
我々のゴールは、データとモデルのサイズの異なるスケールでダウンストリームタスクのパフォーマンスがどのように変化するかを調べることです。
論文 参考訳(メタデータ) (2023-05-24T15:33:46Z) - AlphaPose: Whole-Body Regional Multi-Person Pose Estimation and Tracking
in Real-Time [47.19339667836196]
提案するAlphaPoseは,リアルタイムに動作しながら,身体全体のポーズを正確に推定・追跡できるシステムである。
我々は,COCO-全体,COCO,PoseTrack,提案したHalpe-FullBodyポーズ推定データセットにおいて,現在の最先端手法よりも高速かつ高精度であることを示す。
論文 参考訳(メタデータ) (2022-11-07T09:15:38Z) - Deep Learning-Based Human Pose Estimation: A Survey [66.01917727294163]
人間のポーズ推定は、過去10年間に注目を集めてきた。
ヒューマン・コンピュータ・インタラクション、モーション・アナリティクス、拡張現実、バーチャル・リアリティーなど幅広い用途で利用されている。
最近のディープラーニングベースのソリューションは、人間のポーズ推定において高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-12-24T18:49:06Z) - AID: Pushing the Performance Boundary of Human Pose Estimation with
Information Dropping Augmentation [23.366620137910967]
本稿では,このジレンマを検証・対処するために,情報ドロップによる拡張を提案する。
カスタマイズされたトレーニングスケジュールは、情報提供の観点から、トレーニングプロセスにおける損失パターンとパフォーマンスパターンを分析して設計される。
AIDは、トップダウンパラダイムでは0.6 AP、ボトムアップパラダイムでは1.5 APまで、さまざまな構成のパフォーマンスを一貫して向上させる。
論文 参考訳(メタデータ) (2020-08-17T08:05:16Z) - Whole-Body Human Pose Estimation in the Wild [88.09875133989155]
COCO-WholeBodyは、全体アノテーションでCOCOデータセットを拡張する。
これは人体全体に手動のアノテーションがある最初のベンチマークである。
ZoomNetという名前のシングルネットワークモデルは、完全な人体の階層構造を考慮するために考案された。
論文 参考訳(メタデータ) (2020-07-23T08:35:26Z) - Self-supervised Keypoint Correspondences for Multi-Person Pose
Estimation and Tracking in Videos [32.43899916477434]
本稿では,映像中の人物を関連付けるために,キーポイント対応に依存するアプローチを提案する。
ビデオデータ上でキーポイント対応を推定するためにネットワークをトレーニングする代わりに、人間のポーズ推定のために大規模な画像データセットでトレーニングする。
提案手法は,PosTrack$2017およびPoseTrack$2018のデータセット上で,複数フレームのポーズ推定と複数人物のポーズ追跡の最先端結果を実現する。
論文 参考訳(メタデータ) (2020-04-27T09:02:24Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。