論文の概要: PoseTrans: A Simple Yet Effective Pose Transformation Augmentation for
Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2208.07755v1
- Date: Tue, 16 Aug 2022 14:03:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-17 12:36:09.519801
- Title: PoseTrans: A Simple Yet Effective Pose Transformation Augmentation for
Human Pose Estimation
- Title(参考訳): PoseTrans: シンプルで効果的なPose Transformation Augmentation for Human Pose Estimation
- Authors: Wentao Jiang, Sheng Jin, Wentao Liu, Chen Qian, Ping Luo, Si Liu
- Abstract要約: 我々は多彩なポーズを持つ新しいトレーニングサンプルを作成するために、Pose Transformation (PoseTrans)を提案する。
また,ポーズの規則性を測定するためにPose Clustering Module (PCM)を提案する。
提案手法は効率的で実装が容易であり,既存のポーズ推定モデルのトレーニングパイプラインに容易に組み込むことができる。
- 参考スコア(独自算出の注目度): 40.50255017107963
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human pose estimation aims to accurately estimate a wide variety of human
poses. However, existing datasets often follow a long-tailed distribution that
unusual poses only occupy a small portion, which further leads to the lack of
diversity of rare poses. These issues result in the inferior generalization
ability of current pose estimators. In this paper, we present a simple yet
effective data augmentation method, termed Pose Transformation (PoseTrans), to
alleviate the aforementioned problems. Specifically, we propose Pose
Transformation Module (PTM) to create new training samples that have diverse
poses and adopt a pose discriminator to ensure the plausibility of the
augmented poses. Besides, we propose Pose Clustering Module (PCM) to measure
the pose rarity and select the "rarest" poses to help balance the long-tailed
distribution. Extensive experiments on three benchmark datasets demonstrate the
effectiveness of our method, especially on rare poses. Also, our method is
efficient and simple to implement, which can be easily integrated into the
training pipeline of existing pose estimation models.
- Abstract(参考訳): 人間のポーズ推定は、さまざまな人間のポーズを正確に推定することを目的としている。
しかし、既存のデータセットは、まれなポーズがほんの一部しか占めない長い尾の分布に従うことが多く、これはさらにまれなポーズの多様性の欠如につながる。
これらの問題は、現在のポーズ推定器の劣る一般化能力をもたらす。
本稿では、上記の問題を緩和するために、Pose Transformation(PoseTrans)と呼ばれる、単純で効果的なデータ拡張手法を提案する。
具体的には、多彩なポーズを持つ新しいトレーニングサンプルを作成し、ポーズ判別器を採用して、追加ポーズの妥当性を保証するため、PTM(Pose Transformation Module)を提案する。
さらに,ポーズラリティを計測するためのポーズクラスタリングモジュール (pcm) を提案し,ロングテール分布のバランスをとるために "rarest" ポーズを選択する。
3つのベンチマークデータセットに対する大規模な実験により,本手法の有効性が示された。
また,提案手法は効率的で実装が容易であり,既存のポーズ推定モデルのトレーニングパイプラインに容易に組み込むことができる。
関連論文リスト
- Pose-NDF: Modeling Human Pose Manifolds with Neural Distance Fields [47.62275563070933]
ニューラル距離場(NDF)に基づく可塑性人間のポーズの連続モデルを提案する。
Pose-NDFは、ニューラルネットワークの暗黙関数のゼロレベル集合として可塑性ポーズの多様体を学習する。
ランダムサンプリングとプロジェクションにより、VAEベースの手法よりも多様なポーズを生成することができる。
論文 参考訳(メタデータ) (2022-07-27T21:46:47Z) - PoseGU: 3D Human Pose Estimation with Novel Human Pose Generator and
Unbiased Learning [36.609189237732394]
3Dポーズ推定は近年,コンピュータビジョン領域において大きな関心を集めている。
既存の3Dポーズ推定手法は,大規模な3Dポーズデータセットに強く依存している。
本稿では,種子サンプルの小さなサイズにのみアクセス可能な多彩なポーズを生成する新規な人造ポーズ生成装置PoseGUを提案する。
論文 参考訳(メタデータ) (2022-07-07T23:43:53Z) - PoseAug: A Differentiable Pose Augmentation Framework for 3D Human Pose
Estimation [83.50127973254538]
既存の3D人間のポーズ推定器は、新しいデータセットへの一般化性能が悪い。
PoseAugは、より多くの多様性に向けて利用可能なトレーニングのポーズを強化することを学ぶ新しい自動増強フレームワークです。
論文 参考訳(メタデータ) (2021-05-06T06:57:42Z) - FixMyPose: Pose Correctional Captioning and Retrieval [67.20888060019028]
本稿では,自動ポーズ修正システムに対応する新しいキャプションデータセットfixmyposeを提案する。
我々は「現在の」ポーズを「ターゲット」ポーズのように見えるように修正する記述を収集する。
MLバイアスを避けるため、さまざまな階層を持つキャラクタ間のバランスを維持します。
論文 参考訳(メタデータ) (2021-04-04T21:45:44Z) - Chasing the Tail in Monocular 3D Human Reconstruction with Prototype
Memory [98.36233875637168]
本稿では,レアポーズの予測性能を効果的に向上するメモリ拡張ネットワークPM-Netを提案する。
本研究では,1)この学習障害を特定し解析し,2)稀なポーズの予測性能を効果的に向上するメモリ拡張ネットワークPM-Netを提案する。
論文 参考訳(メタデータ) (2020-12-29T12:57:22Z) - PoNA: Pose-guided Non-local Attention for Human Pose Transfer [105.14398322129024]
本稿では, 簡易ブロックを用いたGAN(Generative Adversarial Network)を用いた新しいポーズ転送手法を提案する。
我々のモデルはより鮮明でよりリアルな画像を生成するが、パラメータは少なく、速度も速い。
論文 参考訳(メタデータ) (2020-12-13T12:38:29Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。