論文の概要: PoseBH: Prototypical Multi-Dataset Training Beyond Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2505.17475v1
- Date: Fri, 23 May 2025 04:58:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.825238
- Title: PoseBH: Prototypical Multi-Dataset Training Beyond Human Pose Estimation
- Title(参考訳): PoseBH: ヒューマン・ポース・アセスメントを超えたプロトタイプ型マルチデータセット・トレーニング
- Authors: Uyoung Jeong, Jonathan Freer, Seungryul Baek, Hyung Jin Chang, Kwang In Kim,
- Abstract要約: PoseBHは、ポーズ推定のための新しいマルチデータセットトレーニングフレームワークである。
キーポイントの不均一性と2つのキーテクニックによる限定的な監視に取り組む。
我々の学習キーポイント埋め込みは手形状推定(InterHand2.6M)と人体形状推定(DPW)に効果的に伝達される。
- 参考スコア(独自算出の注目度): 38.19172513799442
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We study multi-dataset training (MDT) for pose estimation, where skeletal heterogeneity presents a unique challenge that existing methods have yet to address. In traditional domains, \eg regression and classification, MDT typically relies on dataset merging or multi-head supervision. However, the diversity of skeleton types and limited cross-dataset supervision complicate integration in pose estimation. To address these challenges, we introduce PoseBH, a new MDT framework that tackles keypoint heterogeneity and limited supervision through two key techniques. First, we propose nonparametric keypoint prototypes that learn within a unified embedding space, enabling seamless integration across skeleton types. Second, we develop a cross-type self-supervision mechanism that aligns keypoint predictions with keypoint embedding prototypes, providing supervision without relying on teacher-student models or additional augmentations. PoseBH substantially improves generalization across whole-body and animal pose datasets, including COCO-WholeBody, AP-10K, and APT-36K, while preserving performance on standard human pose benchmarks (COCO, MPII, and AIC). Furthermore, our learned keypoint embeddings transfer effectively to hand shape estimation (InterHand2.6M) and human body shape estimation (3DPW). The code for PoseBH is available at: https://github.com/uyoung-jeong/PoseBH.
- Abstract(参考訳): ポーズ推定のためのマルチデータセットトレーニング (MDT) について検討し, 骨格の不均一性は既存の手法では未解決の難題であることを示した。
従来のドメインでは、レグレッションと分類は一般的に、データセットのマージやマルチヘッドの監視に依存します。
しかし,スケルトン型の多様性とクロスデータセット管理の制限は,ポーズ推定における統合を複雑にしている。
これらの課題に対処するために、キーポイントの不均一性と2つのキーテクニックによる限定的な監督に対処する新しいMDTフレームワークであるPoseBHを紹介する。
まず, 組込み空間内で学習し, スケルトン型間のシームレスな統合を可能にする非パラメトリックキーポイントプロトタイプを提案する。
第2に、キーポイント予測とキーポイント埋め込みプロトタイプを整合させるクロスタイプのセルフスーパービジョン機構を開発し、教師の学習モデルや追加の強化に頼ることなく、監督を行う。
PoseBHは、COCO-WholeBody、AP-10K、APT-36Kを含む全身および動物のポーズデータセットの一般化を大幅に改善すると同時に、標準的な人間のポーズベンチマーク(COCO、MPII、AIC)のパフォーマンスを保っている。
さらに,学習したキーポイント埋め込みは手形状推定(InterHand2.6M)と人体形状推定(DPW)に効果的に伝達する。
PoseBHのコードは、https://github.com/uyoung-jeong/PoseBHで公開されている。
関連論文リスト
- PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - Estimating Human Poses Across Datasets: A Unified Skeleton and Multi-Teacher Distillation Approach [12.042768320132694]
本稿では,多教師による知識蒸留と骨格の統一的表現を融合した新しい手法を提案する。
私たちのネットワークは、それぞれ17と16のキーポイントを含むCOCOとMPIIデータセットで共同でトレーニングされています。
我々のジョイントモデルの平均精度は70.89と76.40で、1つのデータセットでトレーニングし、両方で評価すると53.79と55.78だった。
論文 参考訳(メタデータ) (2024-05-30T14:14:39Z) - Effective Whole-body Pose Estimation with Two-stages Distillation [52.92064408970796]
全体ポーズ推定は、画像内の人体、手、顔、足のキーポイントをローカライズする。
textbfWhole-body textbfPose 推定器の2段階ポーズ textbfDistillation を提案し,その有効性と効率性について検討した。
論文 参考訳(メタデータ) (2023-07-29T03:49:28Z) - MDPose: Real-Time Multi-Person Pose Estimation via Mixture Density Model [27.849059115252008]
本稿では,人間のキーポイントの結合分布をモデル化し,一段階のインスタンス認識ポーズ推定手法を提案する。
我々のMDPoseは、人間のキーポイントの高次元の関節分布を学習し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-02-17T08:29:33Z) - 2D Human Pose Estimation with Explicit Anatomical Keypoints Structure
Constraints [15.124606575017621]
本稿では,解剖学的キーポイント構造制約を明示した新しい2次元ポーズ推定手法を提案する。
提案手法は,既存のボトムアップやトップダウンの人間のポーズ推定手法に組み込むことができる。
提案手法は,既存のボトムアップとトップダウンの人間のポーズ推定手法に対して良好に機能する。
論文 参考訳(メタデータ) (2022-12-05T11:01:43Z) - Pose for Everything: Towards Category-Agnostic Pose Estimation [93.07415325374761]
Category-Agnostic Pose Estimation (CAPE) は、キーポイント定義を持つ少数のサンプルのみを与えられた任意の種類のオブジェクトのポーズを検出することができるポーズ推定モデルを作成することを目的としている。
異なるキーポイント間のインタラクションと、サポートとクエリイメージの関係をキャプチャするために、トランスフォーマーベースのキーポイントインタラクションモジュール(KIM)を提案する。
また、20K以上のインスタンスを含む100のオブジェクトカテゴリの2次元ポーズデータセットであるMP-100データセットを導入し、CAPEアルゴリズムの開発に適している。
論文 参考訳(メタデータ) (2022-07-21T09:40:54Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Nonparametric Structure Regularization Machine for 2D Hand Pose
Estimation [21.250031729596085]
手ポーズ推定は, 重度調音, 自己閉塞, 器質性が高いため, 身体ポーズ推定よりも困難である。
2次元手振り推定のための新しい非パラメトリック構造正規化機械(NSRM)を提案する。
論文 参考訳(メタデータ) (2020-01-24T03:27:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。