論文の概要: Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation
- arxiv url: http://arxiv.org/abs/2203.15293v1
- Date: Tue, 29 Mar 2022 07:14:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-30 15:13:20.549490
- Title: Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation
- Title(参考訳): 自己監督型3次元姿勢推定のための不確実性認識適応
- Authors: Jogendra Nath Kundu, Siddharth Seth, Pradyumna YM, Varun Jampani,
Anirban Chakraborty, R. Venkatesh Babu
- Abstract要約: 本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
- 参考スコア(独自算出の注目度): 70.32536356351706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The advances in monocular 3D human pose estimation are dominated by
supervised techniques that require large-scale 2D/3D pose annotations. Such
methods often behave erratically in the absence of any provision to discard
unfamiliar out-of-distribution data. To this end, we cast the 3D human pose
learning as an unsupervised domain adaptation problem. We introduce MRP-Net
that constitutes a common deep network backbone with two output heads
subscribing to two diverse configurations; a) model-free joint localization and
b) model-based parametric regression. Such a design allows us to derive
suitable measures to quantify prediction uncertainty at both pose and joint
level granularity. While supervising only on labeled synthetic samples, the
adaptation process aims to minimize the uncertainty for the unlabeled target
images while maximizing the same for an extreme out-of-distribution dataset
(backgrounds). Alongside synthetic-to-real 3D pose adaptation, the
joint-uncertainties allow expanding the adaptation to work on in-the-wild
images even in the presence of occlusion and truncation scenarios. We present a
comprehensive evaluation of the proposed approach and demonstrate
state-of-the-art performance on benchmark datasets.
- Abstract(参考訳): モノラルな3次元ポーズ推定の進歩は、大規模な2D/3Dポーズアノテーションを必要とする教師付き技術によって支配されている。
そのような方法は、不慣れな分散データを捨てる条項がない場合、しばしば不規則に振る舞う。
そこで本研究では,教師なし領域適応問題として3次元ポーズ学習を行った。
2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを導入する。
a)モデルフリージョイント・ローカライズと
b) モデルに基づくパラメトリック回帰
このような設計により、ポーズと関節レベルの粒度の両方で予測の不確かさを定量化するための適切な尺度を導出することができる。
ラベル付き合成サンプルのみを監視しながら、適応プロセスは、ラベル付き対象画像の不確実性を最小限に抑えつつ、極端に分布しないデータセット(背景)に対してそれを最大化する。
合成から現実の3Dポーズ適応に加えて、関節不確実性により、閉塞シナリオやトランケーションシナリオの存在下でも、ワイヤード画像への適応を拡大することができる。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
関連論文リスト
- UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - Progressive Multi-view Human Mesh Recovery with Self-Supervision [68.60019434498703]
既存のソリューションは通常、新しい設定への一般化性能の低下に悩まされる。
マルチビューヒューマンメッシュリカバリのためのシミュレーションに基づく新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-12-10T06:28:29Z) - A generic diffusion-based approach for 3D human pose prediction in the
wild [68.00961210467479]
3D人間のポーズ予測、すなわち、過去の観察されたポーズのシーケンスが与えられた後の人間の3Dポーズのシーケンスを予測することは、困難な時間課題である。
本稿では,不完全な要素(予測や観測に関係しない)をノイズとして扱える統一的な定式化法を提案し,それらを認知し,妥当なポーズを予測する条件拡散モデルを提案する。
本研究は,4つの標準データセットについて検討し,現状よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-10-11T17:59:54Z) - Self-supervised Human Mesh Recovery with Cross-Representation Alignment [20.69546341109787]
自己教師付きヒューマンメッシュリカバリ手法は、3Dアノテーション付きベンチマークデータセットの可用性と多様性が制限されているため、一般化性が低い。
頑健だがスパースな表現(2Dキーポイント)からの相補的情報を利用した相互表現アライメントを提案する。
この適応的相互表現アライメントは、偏差から明示的に学習し、相補的な情報(疎表現からの豊かさと密表現からの堅牢さ)をキャプチャする。
論文 参考訳(メタデータ) (2022-09-10T04:47:20Z) - Non-Local Latent Relation Distillation for Self-Adaptive 3D Human Pose
Estimation [63.199549837604444]
3次元ポーズ推定アプローチは、強い(2D/3Dポーズ)または弱い(複数ビューまたは深さ)ペアによる監督の異なる形態を利用する。
我々は3Dポーズ学習を,ラベル付きソースドメインから完全に損なわれないターゲットへのタスク知識の転送を目的とした,自己指導型適応問題として捉えた。
我々は、異なる自己適応設定を評価し、標準ベンチマークで最先端の3Dポーズ推定性能を示す。
論文 参考訳(メタデータ) (2022-04-05T03:52:57Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。