論文の概要: Semantics-aware Test-time Adaptation for 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2502.10724v1
- Date: Sat, 15 Feb 2025 08:27:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:11:34.717198
- Title: Semantics-aware Test-time Adaptation for 3D Human Pose Estimation
- Title(参考訳): セマンティックスを考慮した3次元人文推定のためのテスト時間適応法
- Authors: Qiuxia Lin, Rongyu Chen, Kerui Gu, Angela Yao,
- Abstract要約: この研究は、人間の3次元ポーズ推定における意味的ミスアライメントを強調している。
テストタイム適応のタスクでは、ミスアライメントは過度にスムーズで、ガイドなしの予測として現れます。
我々は,3次元ポーズ推定の試行時間適応に先立って,セマンティックスを意識した動作の統合を開拓した。
- 参考スコア(独自算出の注目度): 33.23626920059161
- License:
- Abstract: This work highlights a semantics misalignment in 3D human pose estimation. For the task of test-time adaptation, the misalignment manifests as overly smoothed and unguided predictions. The smoothing settles predictions towards some average pose. Furthermore, when there are occlusions or truncations, the adaptation becomes fully unguided. To this end, we pioneer the integration of a semantics-aware motion prior for the test-time adaptation of 3D pose estimation. We leverage video understanding and a well-structured motion-text space to adapt the model motion prediction to adhere to video semantics during test time. Additionally, we incorporate a missing 2D pose completion based on the motion-text similarity. The pose completion strengthens the motion prior's guidance for occlusions and truncations. Our method significantly improves state-of-the-art 3D human pose estimation TTA techniques, with more than 12% decrease in PA-MPJPE on 3DPW and 3DHP.
- Abstract(参考訳): この研究は、人間の3次元ポーズ推定における意味的ミスアライメントを強調している。
テストタイム適応のタスクでは、ミスアライメントは過度にスムーズで、ガイドなしの予測として現れます。
平滑化は、いくつかの平均的なポーズに対する予測を落ち着かせる。
さらに、オクルージョンやトランケーションがある場合、適応は完全に無誘導になる。
そこで我々は,3次元ポーズ推定のテスト時間適応に先立って,セマンティックスを意識した動作の統合を開拓した。
我々は、ビデオ理解とよく構造化されたモーションテキスト空間を活用して、テスト時間中にビデオセマンティクスに順応するモデル動き予測に適応する。
さらに、動作テキストの類似性に基づいた2次元ポーズ補完を欠いている。
ポーズ完了は、オクルージョンとトランケーションに対する前者の動作ガイダンスを強化する。
提案手法は,3DPWおよび3DHPにおけるPA-MPJPEの12%以上が減少し,最先端の3次元ポーズ推定TTA技術を大幅に改善する。
関連論文リスト
- UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - Unsupervised 3D Pose Estimation with Non-Rigid Structure-from-Motion
Modeling [83.76377808476039]
本研究では,人間のポーズの変形をモデル化し,それに伴う拡散に基づく動きを事前に設計する手法を提案する。
動作中の3次元人間の骨格を復元する作業は3次元基準骨格の推定に分割する。
混合時空間NASfMformerを用いて、各フレームの3次元基準骨格と骨格変形を2次元観測シーケンスから同時に推定する。
論文 参考訳(メタデータ) (2023-08-18T16:41:57Z) - Denoising Diffusion for 3D Hand Pose Estimation from Images [38.20064386142944]
本稿では,モノクロ画像やシーケンスからの3次元手ポーズ推定の問題に対処する。
本稿では,3次元ハンドレグレッションのための新しいエンド・ツー・エンド・エンド・フレームワークを提案する。
提案モデルは,2次元の片手画像を3Dに持ち上げる際に,最先端の性能を提供する。
論文 参考訳(メタデータ) (2023-08-18T12:57:22Z) - A generic diffusion-based approach for 3D human pose prediction in the
wild [68.00961210467479]
3D人間のポーズ予測、すなわち、過去の観察されたポーズのシーケンスが与えられた後の人間の3Dポーズのシーケンスを予測することは、困難な時間課題である。
本稿では,不完全な要素(予測や観測に関係しない)をノイズとして扱える統一的な定式化法を提案し,それらを認知し,妥当なポーズを予測する条件拡散モデルを提案する。
本研究は,4つの標準データセットについて検討し,現状よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-10-11T17:59:54Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Self-Attentive 3D Human Pose and Shape Estimation from Videos [82.63503361008607]
3D人間のポーズと形状推定のためのビデオベースの学習アルゴリズムを紹介します。
ビデオの時間情報を利用して自己着脱モジュールを提案する。
本手法を3DPW, MPI-INF-3DHP, Human3.6Mデータセット上で評価した。
論文 参考訳(メタデータ) (2021-03-26T00:02:19Z) - Leveraging Temporal Joint Depths for Improving 3D Human Pose Estimation
in Video [2.7501248535328306]
本稿では,映像の各フレームに3次元のポーズを推定し,時間的情報を考慮してそれを洗練することを提案する。
提案手法は, 接合深さのあいまいさを低減し, 3次元ポーズ推定精度を向上させる。
論文 参考訳(メタデータ) (2020-11-04T08:23:41Z) - Multi-Scale Networks for 3D Human Pose Estimation with Inference Stage
Optimization [33.02708860641971]
モノクロビデオから3Dのポーズを推定することは、まだまだ難しい課題だ。
既存の多くのメソッドは、対象の人が他のオブジェクトに干渉されたり、トレーニングデータのスケールや速度に対して動きが速すぎたり、遅くなったりすると低下する。
頑健な3次元ポーズ推定のための時間的ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-13T15:24:28Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。