論文の概要: Robust Long-term Test-Time Adaptation for 3D Human Pose Estimation through Motion Discretization
- arxiv url: http://arxiv.org/abs/2511.18851v1
- Date: Mon, 24 Nov 2025 07:46:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:25.089785
- Title: Robust Long-term Test-Time Adaptation for 3D Human Pose Estimation through Motion Discretization
- Title(参考訳): 運動離散化による3次元人物姿勢推定のためのロバスト長期時間適応
- Authors: Yilin Wen, Kechuan Dong, Yusuke Sugano,
- Abstract要約: 3次元ポーズ推定のオンライン適応は、不完全な予測を伴う自己スーパービジョンに依存する場合、エラーの蓄積に悩まされる。
本稿では, 動きの離散化に着目した新しい手法を提案する。
我々は、同一人物のドメイン外ストリーミングテストビデオに継続的に適応することで、長期的オンライン適応を検証した。
- 参考スコア(独自算出の注目度): 3.5504752162904176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online test-time adaptation addresses the train-test domain gap by adapting the model on unlabeled streaming test inputs before making the final prediction. However, online adaptation for 3D human pose estimation suffers from error accumulation when relying on self-supervision with imperfect predictions, leading to degraded performance over time. To mitigate this fundamental challenge, we propose a novel solution that highlights the use of motion discretization. Specifically, we employ unsupervised clustering in the latent motion representation space to derive a set of anchor motions, whose regularity aids in supervising the human pose estimator and enables efficient self-replay. Additionally, we introduce an effective and efficient soft-reset mechanism by reverting the pose estimator to its exponential moving average during continuous adaptation. We examine long-term online adaptation by continuously adapting to out-of-domain streaming test videos of the same individual, which allows for the capture of consistent personal shape and motion traits throughout the streaming observation. By mitigating error accumulation, our solution enables robust exploitation of these personal traits for enhanced accuracy. Experiments demonstrate that our solution outperforms previous online test-time adaptation methods and validate our design choices.
- Abstract(参考訳): オンラインテスト時間適応は、最終的な予測を行う前に、未ラベルのストリーミングテスト入力にモデルを適応させることで、トレインテストのドメインギャップに対処する。
しかし、3次元ポーズ推定のオンライン適応は、不完全な予測を伴う自己スーパービジョンに依存するとエラーの蓄積に悩まされ、時間の経過とともに性能が低下する。
この根本的な課題を軽減するために,動作の離散化を強調させる新しい手法を提案する。
具体的には、人間のポーズ推定器を監督し、効率的な自己再生を可能にするアンカー動作の集合を導出するために、潜在動作表現空間における教師なしクラスタリングを用いる。
さらに,ポーズ推定器を連続適応中の指数移動平均に戻すことにより,効果的かつ効率的なソフトリセット機構を導入する。
我々は、同一個人のドメイン外ストリーミングテストビデオに継続的に適応することにより、長期のオンライン適応を検証し、ストリーミング観察を通して一貫した個人形状と動作特性のキャプチャを可能にする。
誤差蓄積を緩和することにより、これらの個人特性の堅牢な利用を可能にし、精度を向上する。
実験により、我々のソリューションは従来のオンラインテスト時間適応手法より優れており、設計選択の有効性が示されている。
関連論文リスト
- Adaptive Cascading Network for Continual Test-Time Adaptation [12.718826132518577]
そこで本研究では,テスト時に対象ドメインの列に事前学習したソースモデルを適応させることを目標とする連続的なテスト時間適応の問題について検討する。
テストタイムトレーニングの既存の方法には、いくつかの制限がある。
論文 参考訳(メタデータ) (2024-07-17T01:12:57Z) - STRIDE: Single-video based Temporally Continuous Occlusion-Robust 3D Pose Estimation [27.854074900345314]
本研究では,STIDE (Single-video based TempoRally contInuous Occlusion-Robust 3D Estimation Pose) を提案する。
筆者らのフレームワークは,モデルに依存しない柔軟性を示し,既製の3Dポーズ推定手法を用いて,堅牢性と時間的整合性を向上させる。
論文 参考訳(メタデータ) (2023-12-24T11:05:10Z) - Meta-Auxiliary Learning for Adaptive Human Pose Prediction [26.877194503491072]
高忠実な未来の人間のポーズを予測することは、インテリジェントロボットが人間と対話する上で決定的だ。
ディープラーニングアプローチは、通常、外部データセット上で一般的なトレーニング済みモデルをトレーニングし、すべてのテストサンプルに直接適用する。
本稿では,2つの自己監督型補助タスクを活用するテスト時間適応フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-13T11:17:09Z) - Improving Adaptive Conformal Prediction Using Self-Supervised Learning [72.2614468437919]
我々は、既存の予測モデルの上に自己教師付きプレテキストタスクを持つ補助モデルを訓練し、自己教師付きエラーを付加的な特徴として用いて、非整合性スコアを推定する。
合成データと実データの両方を用いて、効率(幅)、欠陥、共形予測間隔の超過といった付加情報の利点を実証的に実証する。
論文 参考訳(メタデータ) (2023-02-23T18:57:14Z) - Semantic Self-adaptation: Enhancing Generalization with a Single Sample [45.111358665370524]
セマンティックセグメンテーションのための自己適応型アプローチを提案する。
整合正則化を用いて畳み込み層のパラメータを入力画像に微調整する。
実験により, 自己適応は訓練時のモデル正規化の確立した実践を補完する可能性が示唆された。
論文 参考訳(メタデータ) (2022-08-10T12:29:01Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Continual Test-Time Domain Adaptation [94.51284735268597]
テスト時ドメイン適応は、ソースデータを使用しずに、ソース事前訓練されたモデルをターゲットドメインに適応することを目的としている。
CoTTAは実装が容易で、市販の事前訓練モデルに簡単に組み込むことができる。
論文 参考訳(メタデータ) (2022-03-25T11:42:02Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - MEMO: Test Time Robustness via Adaptation and Augmentation [131.28104376280197]
テスト時間ロバスト化の問題、すなわちモデルロバスト性を改善するためにテストインプットを用いて検討する。
最近の先行研究ではテスト時間適応法が提案されているが、それぞれ追加の仮定を導入している。
モデルが確率的で適応可能な任意のテスト環境で使用できるシンプルなアプローチを提案する。
論文 参考訳(メタデータ) (2021-10-18T17:55:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。