論文の概要: Mask as Supervision: Leveraging Unified Mask Information for
Unsupervised 3D Pose Estimation
- arxiv url: http://arxiv.org/abs/2312.07051v1
- Date: Tue, 12 Dec 2023 08:08:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-13 16:59:30.073531
- Title: Mask as Supervision: Leveraging Unified Mask Information for
Unsupervised 3D Pose Estimation
- Title(参考訳): マスクを監督する: 統一マスク情報を活用した教師なし3次元ポーズ推定
- Authors: Yuchen Yang, Yu Qiao, Xiao Sun
- Abstract要約: マスクを教師なし3次元ポーズ推定の監督として活用する統合フレームワークを提案する。
我々は、アノテーションのないデータの処理を可能にする、完全に教師なしの方法で人間の骨格を整理する。
実験により,Human3.6MとMPI-INF-3DHPデータセットを用いた現状のポーズ推定性能を示す。
- 参考スコア(独自算出の注目度): 29.9302410416768
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic estimation of 3D human pose from monocular RGB images is a
challenging and unsolved problem in computer vision. In a supervised manner,
approaches heavily rely on laborious annotations and present hampered
generalization ability due to the limited diversity of 3D pose datasets. To
address these challenges, we propose a unified framework that leverages mask as
supervision for unsupervised 3D pose estimation. With general unsupervised
segmentation algorithms, the proposed model employs skeleton and physique
representations that exploit accurate pose information from coarse to fine.
Compared with previous unsupervised approaches, we organize the human skeleton
in a fully unsupervised way which enables the processing of annotation-free
data and provides ready-to-use estimation results. Comprehensive experiments
demonstrate our state-of-the-art pose estimation performance on Human3.6M and
MPI-INF-3DHP datasets. Further experiments on in-the-wild datasets also
illustrate the capability to access more data to boost our model. Code will be
available at https://github.com/Charrrrrlie/Mask-as-Supervision.
- Abstract(参考訳): 単眼rgb画像からの3次元人物ポーズの自動推定はコンピュータビジョンにおいて困難かつ未解決の問題である。
教師ありの方法では、3dポーズデータセットの多様性が限られているため、アプローチは労力のかかるアノテーションと一般化能力に大きく依存している。
これらの課題に対処するために,マスクを教師なし3次元ポーズ推定の監督として利用する統一フレームワークを提案する。
一般的な教師なしセグメンテーションアルゴリズムでは、提案モデルは、粗いものから細かいものまで正確なポーズ情報を利用する骨格と物理表現を用いる。
従来の教師なしアプローチと比較して、アノテーションなしデータの処理を可能にし、使い勝手の良い推定結果を提供する、完全に教師なしの方法で人間の骨格を整理する。
ヒト3.6M と MPI-INF-3DHP データセットのポーズ推定性能について総合実験を行った。
アプリ内データセットに関するさらなる実験は、モデルを強化するためにより多くのデータにアクセスする能力を示している。
コードはhttps://github.com/charrrlie/mask-as-supervisionで入手できる。
関連論文リスト
- X as Supervision: Contending with Depth Ambiguity in Unsupervised Monocular 3D Pose Estimation [12.765995624408557]
マルチハイポテーシス検出と複数の調整済みプレテキストタスクを特徴とする教師なしフレームワークを提案する。
ローカルウィンドウ内のヒートマップから複数の仮説を抽出し、マルチソリューション問題を効果的に管理する。
プリテキストタスクは、SMPLモデルからの3D人間の事前情報を利用して、ポーズ推定の解空間を規則化し、それを3D人間の構造を経験的分布と整合させる。
論文 参考訳(メタデータ) (2024-11-20T04:18:11Z) - UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - On Triangulation as a Form of Self-Supervision for 3D Human Pose
Estimation [57.766049538913926]
ラベル付きデータが豊富である場合, 単一画像からの3次元ポーズ推定に対する改良されたアプローチは, 極めて効果的である。
最近の注目の多くは、セミと(あるいは)弱い教師付き学習に移行している。
本稿では,多視点の幾何学的制約を,識別可能な三角測量を用いて課し,ラベルがない場合の自己監督の形式として用いることを提案する。
論文 参考訳(メタデータ) (2022-03-29T19:11:54Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Unsupervised View-Invariant Human Posture Representation [28.840986167408037]
本研究では、2次元画像からビュー不変な3次元ポーズ表現を抽出することを学ぶ新しい教師なしアプローチを提案する。
本モデルは,同時フレーム間の人間のポーズの内在的なビュー不変性を活用することで訓練される。
RGB画像と深度画像の非教師なしのクロスビュー動作分類精度の改善を示す。
論文 参考訳(メタデータ) (2021-09-17T19:23:31Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z) - Weakly-Supervised 3D Human Pose Learning via Multi-view Images in the
Wild [101.70320427145388]
本稿では、3Dアノテーションを必要としない弱教師付きアプローチを提案し、ラベルのないマルチビューデータから3Dポーズを推定する。
提案手法を2つの大規模データセット上で評価する。
論文 参考訳(メタデータ) (2020-03-17T08:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。