論文の概要: Boosting Semi-Supervised 2D Human Pose Estimation by Revisiting Data
Augmentation and Consistency Training
- arxiv url: http://arxiv.org/abs/2402.11566v2
- Date: Fri, 8 Mar 2024 02:46:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 22:35:23.034215
- Title: Boosting Semi-Supervised 2D Human Pose Estimation by Revisiting Data
Augmentation and Consistency Training
- Title(参考訳): データ拡張と一貫性トレーニングの再検討による半教師付き2次元ポーズ推定の促進
- Authors: Huayi Zhou, Mukun Luo, Fei Jiang, Yue Ding, Hongtao Lu
- Abstract要約: SSHPEは、高度なデータ拡張と簡潔な一貫性のトレーニング方法という、2つのコアから強化できることがわかった。
本稿では,多彩なハード拡張を伴うラベルなし画像の繰り返し拡大と,連続的にマルチパス予測を生成することを提案する。
提案手法は,SOTA手法と比較して,公開データセットに大幅な改善をもたらす。
- 参考スコア(独自算出の注目度): 25.02026393037821
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The 2D human pose estimation (HPE) is a basic visual problem. However, its
supervised learning requires massive keypoint labels, which is labor-intensive
to collect. Thus, we aim at boosting a pose estimator by excavating extra
unlabeled data with semi-supervised learning (SSL). Most previous SSHPE methods
are consistency-based and strive to maintain consistent outputs for differently
augmented inputs. Under this genre, we find that SSHPE can be boosted from two
cores: advanced data augmentations and concise consistency training ways.
Specifically, for the first core, we discover the synergistic effects of
existing augmentations, and reveal novel paradigms for conveniently producing
new superior HPE-oriented augmentations which can more effectively add noise on
unlabeled samples. We can therefore establish paired easy-hard augmentations
with larger difficulty gaps. For the second core, we propose to repeatedly
augment unlabeled images with diverse hard augmentations, and generate
multi-path predictions sequentially for optimizing multi-losses in a single
network. This simple and compact design is interpretable, and easily benefits
from newly found augmentations. Comparing to SOTA approaches, our method brings
substantial improvements on public datasets. Code is in
\url{https://github.com/hnuzhy/MultiAugs}
- Abstract(参考訳): 2次元人間のポーズ推定(hpe)は基本的な視覚問題である。
しかし、教師付き学習には大量のキーポイントラベルが必要であり、収集に手間がかかる。
そこで我々は,半教師付き学習(ssl)による余分なラベルなしデータ抽出によるポーズ推定の促進を目指す。
従来のSSHPEメソッドは一貫性に基づいており、異なる拡張入力に対して一貫性のある出力を維持する。
このジャンルでは、SSHPEは、高度なデータ拡張と簡潔な一貫性のトレーニング方法という、2つのコアから強化できる。
具体的には,まず,既存の拡張の相乗効果を発見し,新しい優れたHPE指向拡張を簡便に生成するための新しいパラダイムを明らかにし,ラベルなしサンプルにより効果的にノイズを付加する。
したがって、より大きな難易度ギャップを持つペアの容易な拡張を確立できる。
第2のコアでは,様々なハード増補を伴うラベルなし画像を繰り返し増補し,複数経路予測を逐次生成し,単一ネットワークでマルチロスを最適化することを提案する。
このシンプルでコンパクトなデザインは解釈可能であり、新しく発見された拡張によって容易に得られる。
提案手法は,SOTA手法と比較して,公開データセットに大幅な改善をもたらす。
コードは \url{https://github.com/hnuzhy/MultiAugs} にある。
関連論文リスト
- Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - DualAug: Exploiting Additional Heavy Augmentation with OOD Data
Rejection [77.6648187359111]
そこで本稿では,textbfDualAug という新しいデータ拡張手法を提案する。
教師付き画像分類ベンチマークの実験では、DualAugは様々な自動データ拡張法を改善している。
論文 参考訳(メタデータ) (2023-10-12T08:55:10Z) - GraphLearner: Graph Node Clustering with Fully Learnable Augmentation [76.63963385662426]
Contrastive Deep Graph Clustering (CDGC)は、異なるクラスタにノードをグループ化するために、コントラスト学習のパワーを活用する。
我々は、GraphLearnerと呼ばれる、完全学習可能な拡張を備えたグラフノードクラスタリングを提案する。
学習可能な拡張器を導入し、CDGCのための高品質でタスク固有の拡張サンプルを生成する。
論文 参考訳(メタデータ) (2022-12-07T10:19:39Z) - ScoreMix: A Scalable Augmentation Strategy for Training GANs with
Limited Data [93.06336507035486]
GAN(Generative Adversarial Networks)は通常、限られたトレーニングデータが利用できる場合、過度に適合する。
ScoreMixは、様々な画像合成タスクのための、新しくスケーラブルなデータ拡張手法である。
論文 参考訳(メタデータ) (2022-10-27T02:55:15Z) - Data-Efficient Augmentation for Training Neural Networks [15.870155099135538]
本稿では,データポイントのサブセットを選択するための厳密な手法を提案する。
SVHNのCIFAR10では6.3倍,SVHNでは2.2倍の高速化を実現し,様々なサブセットサイズでベースラインを最大10%向上させる。
論文 参考訳(メタデータ) (2022-10-15T19:32:20Z) - Improving Contrastive Learning with Model Augmentation [123.05700988581806]
このシーケンシャルレコメンデーションは,ユーザ行動における次の項目を予測することを目的としている。
シーケンスにおけるデータの分散性やノイズの問題から,新たな自己教師付き学習(SSL)パラダイムが提案され,性能が向上した。
論文 参考訳(メタデータ) (2022-03-25T06:12:58Z) - Augmentation Pathways Network for Visual Recognition [61.33084317147437]
本稿では,より広範な拡張ポリシーのトレーニングを安定させるために,Augmentation Pathways (AP)を導入している。
APは、重いデータ拡張をテーパーし、拡張ポリシーの慎重に選択することなく、安定してパフォーマンスを向上させる。
ImageNetベンチマークの実験結果は、より広い範囲の拡張における互換性と有効性を示している。
論文 参考訳(メタデータ) (2021-07-26T06:54:53Z) - Few-shot learning via tensor hallucination [17.381648488344222]
限定されたラベルデータのみを与えられた例を分類するという課題に対処する。
単純な損失関数を使うことは、少数ショット設定でフィーチャージェネレータをトレーニングするのに十分であることを示す。
提案手法は,より洗練されたデータ拡張手法を上回って,新たな技術状態を設定する。
論文 参考訳(メタデータ) (2021-04-19T17:30:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。