論文の概要: Lifelong Domain Adaptive 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2512.23860v1
- Date: Mon, 29 Dec 2025 20:56:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.214097
- Title: Lifelong Domain Adaptive 3D Human Pose Estimation
- Title(参考訳): 生涯ドメイン適応型3次元ヒューマンポース推定
- Authors: Qucheng Peng, Hongfei Xue, Pu Wang, Chen Chen,
- Abstract要約: 本稿では,3次元ポーズ生成器,2次元ポーズ判別器,および3次元ポーズ推定器を組み込んだ,革新的なGAN(Generative Adversarial Network)フレームワークを提案する。
本手法は,多様な領域適応型3次元HPEデータセットの広範な実験により,優れた性能を示す。
- 参考スコア(独自算出の注目度): 15.139357096577838
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: 3D Human Pose Estimation (3D HPE) is vital in various applications, from person re-identification and action recognition to virtual reality. However, the reliance on annotated 3D data collected in controlled environments poses challenges for generalization to diverse in-the-wild scenarios. Existing domain adaptation (DA) paradigms like general DA and source-free DA for 3D HPE overlook the issues of non-stationary target pose datasets. To address these challenges, we propose a novel task named lifelong domain adaptive 3D HPE. To our knowledge, we are the first to introduce the lifelong domain adaptation to the 3D HPE task. In this lifelong DA setting, the pose estimator is pretrained on the source domain and subsequently adapted to distinct target domains. Moreover, during adaptation to the current target domain, the pose estimator cannot access the source and all the previous target domains. The lifelong DA for 3D HPE involves overcoming challenges in adapting to current domain poses and preserving knowledge from previous domains, particularly combating catastrophic forgetting. We present an innovative Generative Adversarial Network (GAN) framework, which incorporates 3D pose generators, a 2D pose discriminator, and a 3D pose estimator. This framework effectively mitigates domain shifts and aligns original and augmented poses. Moreover, we construct a novel 3D pose generator paradigm, integrating pose-aware, temporal-aware, and domain-aware knowledge to enhance the current domain's adaptation and alleviate catastrophic forgetting on previous domains. Our method demonstrates superior performance through extensive experiments on diverse domain adaptive 3D HPE datasets.
- Abstract(参考訳): 3Dヒューマンポース推定(3D HPE)は、人物の再識別や行動認識から仮想現実に至るまで、様々な応用において不可欠である。
しかし、制御された環境で収集された注釈付き3Dデータへの依存は、様々な分野のシナリオに一般化する上での課題となる。
既存のドメイン適応(DA)パラダイムであるジェネラルDAや3D HPEのソースフリーDAは、非定常的なターゲットポーズデータセットの問題を見落としている。
これらの課題に対処するために、生涯ドメイン適応型3D HPEという新しいタスクを提案する。
我々の知る限り、我々は3D HPEタスクに生涯のドメイン適応を導入した最初の人物です。
この寿命のDA設定では、ポーズ推定器はソースドメイン上で事前訓練され、その後、異なるターゲットドメインに適応する。
さらに、現在のターゲットドメインへの適応中に、ポーズ推定器はソースと以前のターゲットドメインすべてにアクセスすることができない。
3D HPEの生涯のDAは、現在のドメインのポーズに適応し、以前のドメインからの知識を保存するという課題を克服する。
本稿では,3次元ポーズ生成器,2次元ポーズ判別器,および3次元ポーズ推定器を組み込んだ,革新的なGAN(Generative Adversarial Network)フレームワークを提案する。
このフレームワークはドメインシフトを効果的に軽減し、オリジナルと拡張されたポーズを調整します。
さらに、ポーズ認識、時間認識、ドメイン認識の知識を統合した新しい3Dポーズ生成パラダイムを構築し、現在のドメインの適応を強化し、過去のドメインに対する破滅的な忘れを緩和する。
本手法は,多様な領域適応型3次元HPEデータセットの広範な実験により,優れた性能を示す。
関連論文リスト
- BEVUDA++: Geometric-aware Unsupervised Domain Adaptation for Multi-View 3D Object Detection [56.477525075806966]
視覚中心のBird's Eye View (BEV) の認識は、自律運転にかなりの可能性を秘めている。
近年の研究では、効率性や精度の向上が優先されているが、ドメインシフトの問題は見過ごされている。
本稿では,この問題を解消するために,革新的な幾何学的学習支援フレームワークであるBEVUDA++を紹介する。
論文 参考訳(メタデータ) (2025-09-17T16:31:40Z) - Unsupervised Cross-Domain 3D Human Pose Estimation via Pseudo-Label-Guided Global Transforms [28.40521894200745]
ポーズ位置間のグローバルな変換を行う新しいフレームワークを提案する。
Pose Augmentorは、人間の姿勢と体の大きさの変化に対処するために組み込まれている。
提案手法は最先端の手法より優れ、目標学習モデルよりも優れる。
論文 参考訳(メタデータ) (2025-04-17T06:57:20Z) - GCA-3D: Towards Generalized and Consistent Domain Adaptation of 3D Generators [24.67369444661137]
GCA-3Dはデータ生成の複雑なパイプラインを使わずに汎用的で一貫した3Dドメイン適応法である。
我々は,非逆方向の3次元生成モデルに効率よく適応するために,多モード深度対応型スコア蒸留サンプリング損失を導入する。
実験により, GCA-3Dは, 効率, 一般化, 精度, アイデンティティの整合性の観点から, 従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-12-20T02:13:11Z) - Source-Free and Image-Only Unsupervised Domain Adaptation for Category
Level Object Pose Estimation [18.011044932979143]
3DUDAは、3Dや深度データを使わずに、ニュアンスドライデンのターゲットドメインに適応できる手法である。
対象のカテゴリを単純な立方体メッシュとして表現し、ニューラル特徴活性化の生成モデルを利用する。
本手法は,グローバルな擬似ラベル付きデータセットの微調整を軽度な仮定でシミュレートする。
論文 参考訳(メタデータ) (2024-01-19T17:48:05Z) - Unsupervised Domain Adaptation for Monocular 3D Object Detection via
Self-Training [57.25828870799331]
我々は、Mono3D上での教師なしドメイン適応のための新しい自己学習フレームワークSTMono3Dを提案する。
対象ドメイン上で適応的な擬似ラベルを生成するための教師学生パラダイムを開発する。
STMono3Dは、評価されたすべてのデータセットで顕著なパフォーマンスを達成し、KITTI 3Dオブジェクト検出データセットの完全な教師付き結果を超えています。
論文 参考訳(メタデータ) (2022-04-25T12:23:07Z) - Aligning Silhouette Topology for Self-Adaptive 3D Human Pose Recovery [70.66865453410958]
アーティキュレーション中心の2D/3Dポーズ監視は、既存の多くの人間のポーズ推定技術においてコアトレーニング目標を形成する。
本稿では,ソース学習モデルベース回帰器を適応させるために,シルエット監視のみに依存する新しいフレームワークを提案する。
我々は、トポロジカル・スケルトン表現を生シルエットから切り離すために、一連の畳み込みに優しい空間変換を開発する。
論文 参考訳(メタデータ) (2022-04-04T06:58:15Z) - Unsupervised Geodesic-preserved Generative Adversarial Networks for
Unconstrained 3D Pose Transfer [84.04540436494011]
任意の任意の任意の3次元メッシュ間のポーズ転送を行うための教師なしアプローチを提案する。
具体的には、内因性(形状)と外因性(ポーズ)の情報保存について、新規な内因性-外因性保存生成ネットワーク(IEP-GAN)を提示する。
提案手法は,最近の最先端手法と比較して,より優れた結果が得られ,より効率的である。
論文 参考訳(メタデータ) (2021-08-17T09:08:21Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。