Fugu-MT 論文翻訳(概要): Boosting Semi-Supervised 2D Human Pose Estimation by Revisiting Data Augmentation and Consistency Training

論文の概要: Boosting Semi-Supervised 2D Human Pose Estimation by Revisiting Data Augmentation and Consistency Training

arxiv url: http://arxiv.org/abs/2402.11566v1
Date: Sun, 18 Feb 2024 12:27:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-20 20:19:57.830637
Title: Boosting Semi-Supervised 2D Human Pose Estimation by Revisiting Data Augmentation and Consistency Training
Title（参考訳）: データ拡張と一貫性トレーニングの再検討による半教師付き2次元ポーズ推定の促進
Authors: Huayi Zhou, Mukun Luo, Fei Jiang, Yue Ding, Hongtao Lu
Abstract要約: 本稿では,半教師付き学習(SSL)方式でラベルのない余分な画像を抽出することにより,ポーズ推定器の精度を高めることを目的とする。本稿では,多彩な拡張を繰り返す未ラベル画像の強化,マルチパス予測の逐次的生成,および1つのネットワークを用いた非教師なし一貫性損失の最適化を提案する。最先端のSSLアプローチと比較して、我々の手法はパブリックデータセットに大幅な改善をもたらす。
参考スコア（独自算出の注目度）: 25.02026393037821
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The 2D human pose estimation is a basic visual problem. However, supervised learning of a model requires massive labeled images, which is expensive and labor-intensive. In this paper, we aim at boosting the accuracy of a pose estimator by excavating extra unlabeled images in a semi-supervised learning (SSL) way. Most previous consistency-based SSL methods strive to constraint the model to predict consistent results for differently augmented images. Following this consensus, we revisit two core aspects including advanced data augmentation methods and concise consistency training frameworks. Specifically, we heuristically dig various collaborative combinations of existing data augmentations, and discover novel superior data augmentation schemes to more effectively add noise on unlabeled samples. They can compose easy-hard augmentation pairs with larger transformation difficulty gaps, which play a crucial role in consistency-based SSL. Moreover, we propose to strongly augment unlabeled images repeatedly with diverse augmentations, generate multi-path predictions sequentially, and optimize corresponding unsupervised consistency losses using one single network. This simple and compact design is on a par with previous methods consisting of dual or triple networks. Furthermore, it can also be integrated with multiple networks to produce better performance. Comparing to state-of-the-art SSL approaches, our method brings substantial improvements on public datasets. Code is released for academic use in \url{https://github.com/hnuzhy/MultiAugs}.
Abstract（参考訳）: 2次元のポーズ推定は基本的な視覚問題である。しかし、モデルの教師付き学習には大量のラベル付き画像が必要である。本稿では,半教師付き学習(SSL)方式でラベルのない余分な画像を抽出することにより,ポーズ推定器の精度を高めることを目的とする。従来の一貫性ベースのSSLメソッドは、異なる拡張イメージに対して一貫性のある結果を予測するためにモデルを制約しようと努力した。この合意に従い、高度なデータ拡張手法と簡潔な一貫性トレーニングフレームワークを含む2つのコア側面を再検討する。具体的には、既存のデータ拡張の様々な組み合わせをヒューリスティックに掘り下げ、新しい優れたデータ拡張スキームを発見し、ラベルのないサンプルにより効果的にノイズを加える。一貫性ベースのSSLにおいて重要な役割を果たす、変換の難しさのギャップを大きくした、簡単なハードな拡張ペアを構成することができる。さらに,多彩な拡張によるラベルなし画像の繰り返しの強化,マルチパス予測の逐次生成,および1つのネットワークを用いた教師なし一貫性損失の最適化を提案する。このシンプルでコンパクトな設計は、以前の2重または3重ネットワークからなる手法と同等である。さらに、パフォーマンスを向上させるために複数のネットワークと統合することもできる。最先端のSSLアプローチと比較して、我々の手法はパブリックデータセットに大幅な改善をもたらす。コードは \url{https://github.com/hnuzhy/MultiAugs} で学術的に使用される。

関連論文リスト

Controllable Latent Space Augmentation for Digital Pathology [2.2062051154292157]
HistAugは、デジタル病理のための潜在空間における制御可能な拡張のための高速かつ効率的な生成モデルである。提案手法では,複数パッチの処理を1回のフォワードパスで効率的に行うことができる。
論文参考訳（メタデータ） (2025-08-20T10:11:48Z)
Gen-SIS: Generative Self-augmentation Improves Self-supervised Learning [52.170253590364545]
Gen-SISは、ラベルのない画像データにのみ訓練された拡散ベースの拡張技術である。これらの自己増強、すなわちバニラSSLエンコーダの埋め込みに基づく生成増強は、より強力なSSLエンコーダのトレーニングを促進することを示す。
論文参考訳（メタデータ） (2024-12-02T16:20:59Z)
GeNIe: Generative Hard Negative Images Through Diffusion [16.619150568764262]
生成AIの最近の進歩により、自然画像に似たデータを生成する、より洗練された拡張技術が実現された。本稿では,テキストプロンプトに条件付き潜伏拡散モデルを利用した新しい拡張手法であるGeNIeを紹介する。本実験は,本手法の有効性と先行技術よりも優れた性能を示すものである。
論文参考訳（メタデータ） (2023-12-05T07:34:30Z)
Contrastive Transformer Learning with Proximity Data Generation for Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文参考訳（メタデータ） (2023-11-15T16:26:49Z)
DualAug: Exploiting Additional Heavy Augmentation with OOD Data Rejection [77.6648187359111]
そこで本稿では,textbfDualAug という新しいデータ拡張手法を提案する。教師付き画像分類ベンチマークの実験では、DualAugは様々な自動データ拡張法を改善している。
論文参考訳（メタデータ） (2023-10-12T08:55:10Z)
GraphLearner: Graph Node Clustering with Fully Learnable Augmentation [76.63963385662426]
Contrastive Deep Graph Clustering (CDGC)は、異なるクラスタにノードをグループ化するために、コントラスト学習のパワーを活用する。我々は、GraphLearnerと呼ばれる、完全学習可能な拡張を備えたグラフノードクラスタリングを提案する。学習可能な拡張器を導入し、CDGCのための高品質でタスク固有の拡張サンプルを生成する。
論文参考訳（メタデータ） (2022-12-07T10:19:39Z)
ScoreMix: A Scalable Augmentation Strategy for Training GANs with Limited Data [93.06336507035486]
GAN(Generative Adversarial Networks)は通常、限られたトレーニングデータが利用できる場合、過度に適合する。 ScoreMixは、様々な画像合成タスクのための、新しくスケーラブルなデータ拡張手法である。
論文参考訳（メタデータ） (2022-10-27T02:55:15Z)
Data-Efficient Augmentation for Training Neural Networks [15.870155099135538]
本稿では,データポイントのサブセットを選択するための厳密な手法を提案する。 SVHNのCIFAR10では6.3倍,SVHNでは2.2倍の高速化を実現し,様々なサブセットサイズでベースラインを最大10%向上させる。
論文参考訳（メタデータ） (2022-10-15T19:32:20Z)
MSR: Making Self-supervised learning Robust to Aggressive Augmentations [98.6457801252358]
本稿では,弱いペアと攻撃的なペアの役割のバランスをとることによって,意味変化の影響に対処する新たなSSLパラダイムを提案する。我々は,BYOLを2.5%改善したResNet-50を200エポックとして,ImageNet-1Kで73.1%のTop-1精度を実現したことを示す。
論文参考訳（メタデータ） (2022-06-04T14:27:29Z)
Improving Contrastive Learning with Model Augmentation [123.05700988581806]
このシーケンシャルレコメンデーションは,ユーザ行動における次の項目を予測することを目的としている。シーケンスにおけるデータの分散性やノイズの問題から,新たな自己教師付き学習(SSL)パラダイムが提案され,性能が向上した。
論文参考訳（メタデータ） (2022-03-25T06:12:58Z)
Augmentation Pathways Network for Visual Recognition [61.33084317147437]
本稿では,より広範な拡張ポリシーのトレーニングを安定させるために,Augmentation Pathways (AP)を導入している。 APは、重いデータ拡張をテーパーし、拡張ポリシーの慎重に選択することなく、安定してパフォーマンスを向上させる。 ImageNetベンチマークの実験結果は、より広い範囲の拡張における互換性と有効性を示している。
論文参考訳（メタデータ） (2021-07-26T06:54:53Z)
Few-shot learning via tensor hallucination [17.381648488344222]
限定されたラベルデータのみを与えられた例を分類するという課題に対処する。単純な損失関数を使うことは、少数ショット設定でフィーチャージェネレータをトレーニングするのに十分であることを示す。提案手法は,より洗練されたデータ拡張手法を上回って,新たな技術状態を設定する。
論文参考訳（メタデータ） (2021-04-19T17:30:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。