論文の概要: Leveraging Synthetic Adult Datasets for Unsupervised Infant Pose Estimation
- arxiv url: http://arxiv.org/abs/2504.05789v1
- Date: Tue, 08 Apr 2025 08:13:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-09 13:29:46.773652
- Title: Leveraging Synthetic Adult Datasets for Unsupervised Infant Pose Estimation
- Title(参考訳): 教師なし乳幼児率推定のための合成成人データセットの活用
- Authors: Sarosij Bose, Hannah Dela Cruz, Arindam Dutta, Elena Kokkoni, Konstantinos Karydis, Amit K. Roy-Chowdhury,
- Abstract要約: ShiFT: Unsupervised InFanT Pose EstimationのためのSyntHetic Adult datasetsを活用する。
ラベル付きデータの欠如を補うために、擬似ラベル付けベースのMean-Teacherフレームワークを利用する。
また、学生と教師の擬似ラベル間の一貫性を強制することで、配布シフトに対処する。
既存の最先端の教師なしドメイン適応(UDA)のポーズ推定法を5%、監督された幼児のポーズ推定法を16%上回っている。
- 参考スコア(独自算出の注目度): 22.117963103350164
- License:
- Abstract: Human pose estimation is a critical tool across a variety of healthcare applications. Despite significant progress in pose estimation algorithms targeting adults, such developments for infants remain limited. Existing algorithms for infant pose estimation, despite achieving commendable performance, depend on fully supervised approaches that require large amounts of labeled data. These algorithms also struggle with poor generalizability under distribution shifts. To address these challenges, we introduce SHIFT: Leveraging SyntHetic Adult Datasets for Unsupervised InFanT Pose Estimation, which leverages the pseudo-labeling-based Mean-Teacher framework to compensate for the lack of labeled data and addresses distribution shifts by enforcing consistency between the student and the teacher pseudo-labels. Additionally, to penalize implausible predictions obtained from the mean-teacher framework, we incorporate an infant manifold pose prior. To enhance SHIFT's self-occlusion perception ability, we propose a novel visibility consistency module for improved alignment of the predicted poses with the original image. Extensive experiments on multiple benchmarks show that SHIFT significantly outperforms existing state-of-the-art unsupervised domain adaptation (UDA) pose estimation methods by 5% and supervised infant pose estimation methods by a margin of 16%. The project page is available at: https://sarosijbose.github.io/SHIFT.
- Abstract(参考訳): 人間のポーズ推定は、さまざまな医療アプリケーションにおいて重要なツールである。
成人をターゲットとしたポーズ推定アルゴリズムの大幅な進歩にもかかわらず、幼児のこのような発達は依然として限られている。
幼児のポーズ推定のための既存のアルゴリズムは、有望なパフォーマンスを達成するにも拘わらず、大量のラベル付きデータを必要とする完全な教師付きアプローチに依存している。
これらのアルゴリズムは、分布シフトの下での一般化性の低さにも悩まされる。
このような課題に対処するために、疑似ラベルベースのMean-Teacherフレームワークを活用して、学生と教師の擬似ラベル間の一貫性を強制することにより、ラベル付きデータの欠如を補う。
さらに, 平均教師の枠組みから得られた不明瞭な予測をペナルティ化するために, 幼児用多様体のポーズを事前に組み込む。
ShiFTの自己排他的知覚能力を高めるために,予測されたポーズと原画像とのアライメントを改善するための新しい可視性整合モジュールを提案する。
複数のベンチマークにおいて、ShiFTは既存の最先端の教師なしドメイン適応(UDA)のポーズ推定法を5%、乳幼児のポーズ推定法を16%で大幅に上回っている。
プロジェクトページは、https://sarosijbose.github.io/SHIFT.comで公開されている。
関連論文リスト
- Unsupervised Domain Adaptation for Occlusion Resilient Human Pose Estimation [23.0839810713682]
排除は人間のポーズ推定アルゴリズムにとって重要な課題である。
OR-POSE: Occlusion Resilient Human POSE Estimationのための教師なしドメイン適応を提案する。
論文 参考訳(メタデータ) (2025-01-06T05:30:37Z) - Affinity-Graph-Guided Contractive Learning for Pretext-Free Medical Image Segmentation with Minimal Annotation [55.325956390997]
本稿では,医用画像セグメンテーションのための親和性グラフ誘導半教師付きコントラスト学習フレームワーク(Semi-AGCL)を提案する。
このフレームワークは、まず、ロバストな初期特徴空間を提供する平均パッチエントロピー駆動のパッチ間サンプリング法を設計する。
完全アノテーションセットの10%に過ぎず, 完全注釈付きベースラインの精度にアプローチし, 限界偏差は2.52%に過ぎなかった。
論文 参考訳(メタデータ) (2024-10-14T10:44:47Z) - Semi-supervised 2D Human Pose Estimation via Adaptive Keypoint Masking [2.297586471170049]
本稿では,サンプル中の情報を完全にマイニングし,より優れた推定性能が得られる適応型キーポイントマスキング法を提案する。
提案手法の有効性をCOCOとMPIIで検証し,最先端の半教師によるポーズ推定をそれぞれ5.2%と0.3%で上回った。
論文 参考訳(メタデータ) (2024-04-23T08:41:50Z) - Modeling the Uncertainty with Maximum Discrepant Students for
Semi-supervised 2D Pose Estimation [57.17120203327993]
半教師付きポーズ推定タスクにおける擬似ラベルの品質を推定する枠組みを提案する。
提案手法は,3つのデータセットに対する半教師付きポーズ推定の性能を向上させる。
論文 参考訳(メタデータ) (2023-11-03T08:11:06Z) - Semi-Supervised 2D Human Pose Estimation Driven by Position
Inconsistency Pseudo Label Correction Module [74.80776648785897]
i) 大規模モデルと軽量モデルの間で対話的なトレーニングを行う場合, 大規模モデルのガイドに擬似的な軽量モデルラベルを用いる。
位置整合性擬似ラベル補正モジュール(SSPCM)により駆動される半教師付き2次元ポーズ推定フレームワークを提案する。
学生モデルの性能向上のために,擬似キーポイント認識に基づく半教師付きカットオクルードを用いて,より硬く効果的なサンプルを生成する。
論文 参考訳(メタデータ) (2023-03-08T02:57:05Z) - AggPose: Deep Aggregation Vision Transformer for Infant Pose Estimation [6.9000851935487075]
幼児のポーズデータセットと人間のポーズ推定のためのDeep Aggregation Vision Transformerを提案する。
AggPoseは、畳み込み操作を使わずに、早く訓練されたフルトランスフォーマーフレームワークである。
AggPose は,様々な解像度のマルチスケール特徴を効果的に学習し,幼児のポーズ推定の性能を大幅に向上できることを示した。
論文 参考訳(メタデータ) (2022-05-11T05:34:14Z) - Unsupervised Domain Adaptation Learning for Hierarchical Infant Pose
Recognition with Synthetic Data [28.729049747477085]
幼児の画像を入力とし、粗いポーズラベルと細かなポーズラベルを予測するCNNベースのモデルを提案する。
実験の結果,提案手法は,合成および実世界のデータセットの分布を著しく整合させることができることがわかった。
論文 参考訳(メタデータ) (2022-05-04T04:59:26Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - FP-Age: Leveraging Face Parsing Attention for Facial Age Estimation in
the Wild [50.8865921538953]
年齢推定に顔のセマンティクスを明示的に組み込む手法を提案する。
我々は,顔解析に基づくネットワークを設計し,異なるスケールで意味情報を学習する。
提案手法は,既存の年齢推定手法を常に上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-21T14:31:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。