論文の概要: Efficient Domain Adaptation via Generative Prior for 3D Infant Pose
Estimation
- arxiv url: http://arxiv.org/abs/2311.12043v1
- Date: Fri, 17 Nov 2023 20:49:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 04:05:06.199803
- Title: Efficient Domain Adaptation via Generative Prior for 3D Infant Pose
Estimation
- Title(参考訳): 3次元乳幼児ポーズ推定のための生成前処理による効率的な領域適応
- Authors: Zhuoran Zhou, Zhongyu Jiang, Wenhao Chai, Cheng-Yen Yang, Lei Li,
Jenq-Neng Hwang
- Abstract要約: 3Dの人間のポーズ推定は近年目覚ましい発展を遂げていますが、骨の長さが異なり、データも限られている幼児に焦点を当てた研究はごくわずかです。
本稿では,SyRIPデータセットで43.6mm,MINI-RGBDデータセットで21.2mmのMPJPE性能が得られることを示す。
また,本手法のZeDO-iは,少数のデータしか与えられなくても,効率的なドメイン適応が可能であることを証明した。
- 参考スコア(独自算出の注目度): 29.037799937729687
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although 3D human pose estimation has gained impressive development in recent
years, only a few works focus on infants, that have different bone lengths and
also have limited data. Directly applying adult pose estimation models
typically achieves low performance in the infant domain and suffers from
out-of-distribution issues. Moreover, the limitation of infant pose data
collection also heavily constrains the efficiency of learning-based models to
lift 2D poses to 3D. To deal with the issues of small datasets, domain
adaptation and data augmentation are commonly used techniques. Following this
paradigm, we take advantage of an optimization-based method that utilizes
generative priors to predict 3D infant keypoints from 2D keypoints without the
need of large training data. We further apply a guided diffusion model to
domain adapt 3D adult pose to infant pose to supplement small datasets.
Besides, we also prove that our method, ZeDO-i, could attain efficient domain
adaptation, even if only a small number of data is given. Quantitatively, we
claim that our model attains state-of-the-art MPJPE performance of 43.6 mm on
the SyRIP dataset and 21.2 mm on the MINI-RGBD dataset.
- Abstract(参考訳): 近年、人間の3Dポーズ推定は目覚ましい発展を遂げているが、骨の長さが異なり、データも限られている幼児に焦点を当てる研究はごくわずかである。
直接大人のポーズ推定モデルを適用すると、典型的には乳児領域での低パフォーマンスを達成し、分散の問題に苦しむ。
さらに、幼児のポーズデータ収集の制限は、学習に基づくモデルの効率を3Dに引き上げることにも大きく制約する。
小さなデータセットの問題に対処するために、ドメイン適応とデータ拡張は一般的に使用されるテクニックである。
このパラダイムに従い,大規模なトレーニングデータを必要としない2次元キーポイントからの3次元幼児キーポイントの予測に生成前処理を用いる最適化ベースの手法を活用した。
さらに,乳幼児のポーズに3次元のポーズを適応させ,小さなデータセットを補完する誘導拡散モデルを適用した。
また,本手法のZeDO-iは,少数のデータしか与えられなくても,効率的なドメイン適応が可能であることも証明した。
定量的には,SyRIPデータセットでは43.6mm,MINI-RGBDデータセットでは21.2mmのMPJPE性能が得られた。
関連論文リスト
- FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - Pretrained Deep 2.5D Models for Efficient Predictive Modeling from
Retinal OCT [7.8641166297532035]
3Dディープラーニングモデルは、病気進行の強力な予測モデルを構築する上で重要な役割を果たす。
本稿では、畳み込みニューラルネットワーク(CNN)、長寿命メモリ(LSTM)、トランスフォーマーを組み合わせた2.5Dアーキテクチャについて検討する。
湿潤加齢関連黄斑変性(AMD)の進行を6ヶ月以内に予測する作業において,建築と関連する事前訓練の有効性を実証した。
論文 参考訳(メタデータ) (2023-07-25T23:46:48Z) - Video Pretraining Advances 3D Deep Learning on Chest CT Tasks [63.879848037679224]
大規模自然画像分類データセットの事前学習は、データスカース2D医療タスクのモデル開発に役立っている。
これらの2Dモデルは、3Dコンピュータビジョンベンチマークで3Dモデルに勝っている。
3Dモデルのためのビデオ事前トレーニングにより、より小さなデータセットでより高性能な3D医療タスクを実現することができることを示す。
論文 参考訳(メタデータ) (2023-04-02T14:46:58Z) - Domain Adaptive 3D Pose Augmentation for In-the-wild Human Mesh Recovery [32.73513554145019]
Domain Adaptive 3D Pose Augmentation (DAPA)は、Wildのシナリオにおけるモデルの一般化能力を向上するデータ拡張手法である。
DAPAによる微調整が3DPWとAGORAのベンチマークの結果を効果的に改善できることを定量的に示す。
論文 参考訳(メタデータ) (2022-06-21T15:02:31Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Adapted Human Pose: Monocular 3D Human Pose Estimation with Zero Real 3D
Pose Data [14.719976311208502]
トレーニングとテストデータドメインのギャップは、しばしばモデルのパフォーマンスに悪影響を及ぼします。
本稿では、外見とポーズ空間の両方における適応問題に対処する適応的ヒューマンポーズ(AHuP)アプローチを提案する。
AHuPは、実際のアプリケーションでは、ターゲットドメインからのデータはアクセスできないか、限られた情報しか取得できないという現実的な前提に基づいて構築されている。
論文 参考訳(メタデータ) (2021-05-23T01:20:40Z) - LiftFormer: 3D Human Pose Estimation using attention models [0.0]
本稿では,映像中の人間のポーズの順序付けに注意機構を活用することで,より正確な3次元予測を実現するためのモデルを提案する。
本手法は,Human3.6Mにおける2次元キーポイント予測器の0.3 mm (44.8 MPJPE, 0.7%改善) と2mm (MPJPE: 31.9, 8.4%改善) の2次元真理入力の双方を用いた場合,文献の先行結果よりも一貫して優れていた。
我々の3Dリフトモデルの精度は、他のエンドツーエンドまたはSMPLアプローチよりも高く、多くのマルチビュー手法に匹敵する。
論文 参考訳(メタデータ) (2020-09-01T11:05:45Z) - Cascaded deep monocular 3D human pose estimation with evolutionary
training data [76.3478675752847]
深層表現学習は単眼の3次元ポーズ推定において顕著な精度を達成した。
本稿では,大量のトレーニングデータに対してスケーラブルな新しいデータ拡張手法を提案する。
本手法は,先行知識に触発された階層的人体表現と合成に基づいて,未知の3次元人体骨格を合成する。
論文 参考訳(メタデータ) (2020-06-14T03:09:52Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z) - Exemplar Fine-Tuning for 3D Human Model Fitting Towards In-the-Wild 3D
Human Pose Estimation [107.07047303858664]
3次元の地平線アノテーションを持つ大規模な人的データセットは、野生では入手が困難である。
既存の2Dデータセットを高品質な3Dポーズマッチングで拡張することで、この問題に対処する。
結果として得られるアノテーションは、3Dのプロシージャネットワークをスクラッチからトレーニングするのに十分である。
論文 参考訳(メタデータ) (2020-04-07T20:21:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。