論文の概要: Online Test-time Adaptation for 3D Human Pose Estimation: A Practical Perspective with Estimated 2D Poses
- arxiv url: http://arxiv.org/abs/2503.11194v1
- Date: Fri, 14 Mar 2025 08:41:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-17 13:07:17.903769
- Title: Online Test-time Adaptation for 3D Human Pose Estimation: A Practical Perspective with Estimated 2D Poses
- Title(参考訳): 3次元人物位置推定のためのオンラインテスト時間適応:推定2次元視点を用いた実践的視点
- Authors: Qiuxia Lin, Kerui Gu, Linlin Yang, Angela Yao,
- Abstract要約: 3次元人間のポーズ推定のためのオンラインテスト時間適応は、トレーニングデータとは異なるビデオストリームに使用される。
地上の真理2Dポーズは適応に使用されるが、実際に利用できるのは推定2Dポーズのみである。
本稿では、推定2次元ポーズによるストリーミングビデオへの適応モデルについて述べる。
- 参考スコア(独自算出の注目度): 40.21976058922288
- License:
- Abstract: Online test-time adaptation for 3D human pose estimation is used for video streams that differ from training data. Ground truth 2D poses are used for adaptation, but only estimated 2D poses are available in practice. This paper addresses adapting models to streaming videos with estimated 2D poses. Comparing adaptations reveals the challenge of limiting estimation errors while preserving accurate pose information. To this end, we propose adaptive aggregation, a two-stage optimization, and local augmentation for handling varying levels of estimated pose error. First, we perform adaptive aggregation across videos to initialize the model state with labeled representative samples. Within each video, we use a two-stage optimization to benefit from 2D fitting while minimizing the impact of erroneous updates. Second, we employ local augmentation, using adjacent confident samples to update the model before adapting to the current non-confident sample. Our method surpasses state-of-the-art by a large margin, advancing adaptation towards more practical settings of using estimated 2D poses.
- Abstract(参考訳): 3次元人間のポーズ推定のためのオンラインテスト時間適応は、トレーニングデータとは異なるビデオストリームに使用される。
地上の真理2Dポーズは適応に使用されるが、実際に利用できるのは推定2Dポーズのみである。
本稿では、推定2次元ポーズによるストリーミングビデオへの適応モデルについて述べる。
適応の比較は、正確なポーズ情報を保持しながら推定誤差を制限するという課題を明らかにしている。
そこで本研究では,アダプティブアグリゲーション,2段階最適化,および推定ポーズ誤差の様々なレベルを扱うための局所拡張を提案する。
まず,ビデオ間で適応的なアグリゲーションを行い,ラベル付き代表サンプルを用いてモデル状態を初期化する。
各ビデオ内では、2Dフィッティングの恩恵を受けるために2段階最適化を使用し、誤った更新の影響を最小限に抑える。
第2に,既存の非信頼サンプルに適応する前に,隣接した信頼度サンプルを用いてモデルを更新する局所的な拡張を用いる。
提案手法は最先端の手法をはるかに超え,推定2次元ポーズを用いたより実用的な設定への適応を推し進める。
関連論文リスト
- Semantics-aware Test-time Adaptation for 3D Human Pose Estimation [33.23626920059161]
この研究は、人間の3次元ポーズ推定における意味的ミスアライメントを強調している。
テストタイム適応のタスクでは、ミスアライメントは過度にスムーズで、ガイドなしの予測として現れます。
我々は,3次元ポーズ推定の試行時間適応に先立って,セマンティックスを意識した動作の統合を開拓した。
論文 参考訳(メタデータ) (2025-02-15T08:27:18Z) - UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - Two Views Are Better than One: Monocular 3D Pose Estimation with Multiview Consistency [0.493599216374976]
本稿では,2次元の教師のみによるトレーニングデータの追加を可能にするために,新たな損失関数であるマルチビュー整合性を提案する。
実験の結果,2つの視点を90度にオフセットすれば良好な性能が得られることがわかった。
本研究は3次元ポーズ推定におけるドメイン適応の新たな可能性を導入し,特定のアプリケーション向けにモデルをカスタマイズするための実用的で費用対効果の高いソリューションを提供する。
論文 参考訳(メタデータ) (2023-11-21T08:21:55Z) - Non-Local Latent Relation Distillation for Self-Adaptive 3D Human Pose
Estimation [63.199549837604444]
3次元ポーズ推定アプローチは、強い(2D/3Dポーズ)または弱い(複数ビューまたは深さ)ペアによる監督の異なる形態を利用する。
我々は3Dポーズ学習を,ラベル付きソースドメインから完全に損なわれないターゲットへのタスク知識の転送を目的とした,自己指導型適応問題として捉えた。
我々は、異なる自己適応設定を評価し、標準ベンチマークで最先端の3Dポーズ推定性能を示す。
論文 参考訳(メタデータ) (2022-04-05T03:52:57Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Camera Distortion-aware 3D Human Pose Estimation in Video with
Optimization-based Meta-Learning [23.200130129530653]
歪みのないデータセットでトレーニングされた既存の3次元ポーズ推定アルゴリズムは、特定のカメラ歪みのある新しいシナリオに適用した場合、パフォーマンス低下を被る。
本研究では, 歪み環境に迅速に適応できる簡易かつ効果的な3次元ポーズ推定モデルを提案する。
論文 参考訳(メタデータ) (2021-11-30T01:35:04Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - PoseAug: A Differentiable Pose Augmentation Framework for 3D Human Pose
Estimation [83.50127973254538]
既存の3D人間のポーズ推定器は、新しいデータセットへの一般化性能が悪い。
PoseAugは、より多くの多様性に向けて利用可能なトレーニングのポーズを強化することを学ぶ新しい自動増強フレームワークです。
論文 参考訳(メタデータ) (2021-05-06T06:57:42Z) - Multi-Scale Networks for 3D Human Pose Estimation with Inference Stage
Optimization [33.02708860641971]
モノクロビデオから3Dのポーズを推定することは、まだまだ難しい課題だ。
既存の多くのメソッドは、対象の人が他のオブジェクトに干渉されたり、トレーニングデータのスケールや速度に対して動きが速すぎたり、遅くなったりすると低下する。
頑健な3次元ポーズ推定のための時間的ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-13T15:24:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。