論文の概要: Adversarial Semantic Data Augmentation for Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2008.00697v1
- Date: Mon, 3 Aug 2020 07:56:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 06:33:50.696202
- Title: Adversarial Semantic Data Augmentation for Human Pose Estimation
- Title(参考訳): 人文推定のための対人意味データ拡張
- Authors: Yanrui Bin, Xuan Cao, Xinya Chen, Yanhao Ge, Ying Tai, Chengjie Wang,
Jilin Li, Feiyue Huang, Changxin Gao, Nong Sang
- Abstract要約: 本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
- 参考スコア(独自算出の注目度): 96.75411357541438
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human pose estimation is the task of localizing body keypoints from still
images. The state-of-the-art methods suffer from insufficient examples of
challenging cases such as symmetric appearance, heavy occlusion and nearby
person. To enlarge the amounts of challenging cases, previous methods augmented
images by cropping and pasting image patches with weak semantics, which leads
to unrealistic appearance and limited diversity. We instead propose Semantic
Data Augmentation (SDA), a method that augments images by pasting segmented
body parts with various semantic granularity. Furthermore, we propose
Adversarial Semantic Data Augmentation (ASDA), which exploits a generative
network to dynamiclly predict tailored pasting configuration. Given
off-the-shelf pose estimation network as discriminator, the generator seeks the
most confusing transformation to increase the loss of the discriminator while
the discriminator takes the generated sample as input and learns from it. The
whole pipeline is optimized in an adversarial manner. State-of-the-art results
are achieved on challenging benchmarks.
- Abstract(参考訳): 人間のポーズ推定は、静止画像から身体のキーポイントをローカライズするタスクである。
最先端の方法は、対称的な外観、重度の咬合、近親者などの困難な症例の不十分な例に苦しむ。
難易度を増大させるため、従来の手法では画像パッチを弱い意味論で切り刻み、ペーストすることで画像を拡大し、非現実的な外観と限定的な多様性をもたらす。
そこで我々は,セマンティックデータ拡張法 (SDA) を提案する。
さらに,生成ネットワークを利用して自動ペースト設定を動的に予測するadversarial semantic data augmentation (asda)を提案する。
判別器としてオフザシェルフポーズ推定ネットワークが与えられた場合、ジェネレータは識別器の損失を増やすために最も混乱した変換を求め、識別器は生成されたサンプルを入力として取り、そこから学習する。
パイプライン全体が逆向きに最適化されている。
最先端の結果は、挑戦的なベンチマークで達成される。
関連論文リスト
- Exploring the Robustness of Human Parsers Towards Common Corruptions [99.89886010550836]
我々は,LIP-C,ATR-C,Pascal-Person-Part-Cという3つの汚職堅牢性ベンチマークを構築し,人間の解析モデルのリスク許容度を評価する。
データ強化戦略に触発されて、一般に破損した条件下で頑健性を高めるための新しい異種強化機構を提案する。
論文 参考訳(メタデータ) (2023-09-02T13:32:14Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Training-free Diffusion Model Adaptation for Variable-Sized
Text-to-Image Synthesis [45.19847146506007]
拡散モデル(DM)は近年,テキスト・画像合成における最先端性能に注目されている。
本稿では,視覚的忠実度を維持しながら多彩性を扱うためにテキスト・画像拡散モデルを適用することに焦点を当てる。
論文 参考訳(メタデータ) (2023-06-14T17:23:07Z) - Realistic Data Enrichment for Robust Image Segmentation in
Histopathology [2.248423960136122]
拡散モデルに基づく新しい手法を提案し、不均衡なデータセットを、表現不足なグループから有意な例で拡張する。
本手法は,限定的な臨床データセットを拡張して,機械学習パイプラインのトレーニングに適したものにする。
論文 参考訳(メタデータ) (2023-04-19T09:52:50Z) - DaliID: Distortion-Adaptive Learned Invariance for Identification Models [9.502663556403622]
本稿では,同定のための歪み適応型学習不変性(DaliID)モデルを提案する。
DaliIDモデルは、7つのベンチマークデータセット上で、顔認識と人物の再識別の両方のために、最先端(SOTA)を実現する。
論文 参考訳(メタデータ) (2023-02-11T18:19:41Z) - Effective Data Augmentation With Diffusion Models [65.09758931804478]
我々は、事前訓練されたテキスト・画像拡散モデルによりパラメータ化された画像・画像変換によるデータ拡張の多様性の欠如に対処する。
本手法は,市販の拡散モデルを用いて画像のセマンティクスを編集し,いくつかのラベル付き例から新しい視覚概念に一般化する。
本手法は,実世界の雑草認識タスクと数ショット画像分類タスクにおいて評価し,テスト領域における精度の向上を観察する。
論文 参考訳(メタデータ) (2023-02-07T20:42:28Z) - Consistency Regularisation in Varying Contexts and Feature Perturbations
for Semi-Supervised Semantic Segmentation of Histology Images [14.005379068469361]
この課題を軽減するために,一貫性に基づく半教師付き学習(SSL)アプローチを提案する。
SSLモデルは、コンテキストの変更や、限られたトレーニングデータのために一般化が不十分な特徴の摂動にも影響する可能性がある。
相互整合性トレーニングにより、エンコーダの特徴が異なる摂動に不変となり、予測信頼性が向上することを示す。
論文 参考訳(メタデータ) (2023-01-30T18:21:57Z) - Discriminative Residual Analysis for Image Set Classification with
Posture and Age Variations [27.751472312581228]
識別残差分析(DRA)は分類性能を向上させるために提案される。
DRAは、残差表現を識別部分空間にキャストする強力な射影を得ようとする。
2つの正則化アプローチは、可能な小さなサンプルサイズ問題に対処するために使用される。
論文 参考訳(メタデータ) (2020-08-23T08:53:06Z) - Transferring and Regularizing Prediction for Semantic Segmentation [115.88957139226966]
本稿では,セマンティックセグメンテーションの本質的特性を利用して,モデル伝達におけるそのような問題を緩和する。
本稿では,モデル転送を教師なし方式で正規化するための制約として固有特性を課す予測伝達の正規化器(RPT)を提案する。
GTA5とSynTHIA(synthetic data)で訓練されたモデルの都市景観データセット(アーバンストリートシーン)への転送に関するRTPの提案を検証するため、大規模な実験を行った。
論文 参考訳(メタデータ) (2020-06-11T16:19:41Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。