論文の概要: An Empirical Study of the Collapsing Problem in Semi-Supervised 2D Human
Pose Estimation
- arxiv url: http://arxiv.org/abs/2011.12498v4
- Date: Fri, 8 Oct 2021 12:59:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 02:56:15.667480
- Title: An Empirical Study of the Collapsing Problem in Semi-Supervised 2D Human
Pose Estimation
- Title(参考訳): 半教師付き2次元ポーズ推定における崩壊問題の実証的研究
- Authors: Rongchang Xie and Chunyu Wang and Wenjun Zeng and Yizhou Wang
- Abstract要約: 半教師付き学習は、ラベルなし画像の探索によってモデルの精度を高めることを目的としている。
私たちは相互に教え合うために2つのネットワークを学びます。
各ネットワーク内の容易なイメージに関するより信頼性の高い予測は、他のネットワークに対応するハードイメージについて学ぶように教えるために使用される。
- 参考スコア(独自算出の注目度): 80.02124918255059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised learning aims to boost the accuracy of a model by exploring
unlabeled images. The state-of-the-art methods are consistency-based which
learn about unlabeled images by encouraging the model to give consistent
predictions for images under different augmentations. However, when applied to
pose estimation, the methods degenerate and predict every pixel in unlabeled
images as background. This is because contradictory predictions are gradually
pushed to the background class due to highly imbalanced class distribution. But
this is not an issue in supervised learning because it has accurate labels.
This inspires us to stabilize the training by obtaining reliable pseudo labels.
Specifically, we learn two networks to mutually teach each other. In
particular, for each image, we compose an easy-hard pair by applying different
augmentations and feed them to both networks. The more reliable predictions on
easy images in each network are used to teach the other network to learn about
the corresponding hard images. The approach successfully avoids degeneration
and achieves promising results on public datasets. The source code and
pretrained models have been released at
https://github.com/xierc/Semi_Human_Pose.
- Abstract(参考訳): 半教師あり学習はラベルなしの画像を探索することでモデルの精度を高めることを目的としている。
最先端の手法は、異なる拡張条件下でのイメージに対して一貫性のある予測をモデルに促すことにより、ラベルのないイメージについて学習する一貫性に基づく。
しかし、ポーズ推定に適用すると、未ラベル画像中の各ピクセルを背景として縮退して予測する。
これは、非常に不均衡なクラス分布のため、矛盾する予測が徐々にバックグラウンドクラスにプッシュされるためである。
しかし、正確なラベルがあるため、教師付き学習では問題ではない。
これにより、信頼できる擬似ラベルを得ることで、トレーニングを安定させることが奨励されます。
具体的には、相互に教え合う2つのネットワークを学習する。
特に,各画像に対して異なる拡張を適用し,両ネットワークに供給することで,簡単なペアを構成する。
各ネットワークの簡単な画像に対するより信頼性の高い予測は、他のネットワークに対応するハードイメージについて学ぶように教えるために使用される。
このアプローチはデジェネレーションをうまく回避し、パブリックデータセットで有望な結果を達成する。
ソースコードと事前訓練されたモデルがhttps://github.com/xierc/Semi_Human_Poseでリリースされた。
関連論文リスト
- Mix-up Self-Supervised Learning for Contrast-agnostic Applications [33.807005669824136]
コントラストに依存しないアプリケーションのための,最初の混合型自己教師型学習フレームワークを提案する。
クロスドメイン・ミックスアップに基づく画像間の低分散に対処し、画像再構成と透明性予測に基づくプレテキストタスクを構築する。
論文 参考訳(メタデータ) (2022-04-02T16:58:36Z) - Domain Adaptive Hand Keypoint and Pixel Localization in the Wild [40.71379707068579]
我々は,新しい撮像条件下でのキーポイントの後退とピクセルレベルのハンドマスクのセグメンテーションの性能向上を目指す。
本手法は,最新の逆適応法と比較して,HO3Dのマルチタスクスコアを4%改善する。
論文 参考訳(メタデータ) (2022-03-16T01:32:21Z) - Barely-Supervised Learning: Semi-Supervised Learning with very few
labeled images [16.905389887406894]
我々は、画像の弱い拡張バージョンに依存して監視信号を得る、最先端の半教師方式 FixMatch の振舞いを深く分析する。
疑似ラベルを高い信頼性で予測できない場合、トレーニング信号の欠如により、ほとんど監督されていないシナリオで頻繁に失敗することを示す。
本研究では,自信ある擬似ラベルが存在しない状態でのトレーニング信号を提供する自己教師型手法を活用する手法を提案する。
論文 参考訳(メタデータ) (2021-12-22T16:29:10Z) - Mixed Supervision Learning for Whole Slide Image Classification [88.31842052998319]
超高解像度画像のための混合監視学習フレームワークを提案する。
パッチトレーニングの段階では、このフレームワークは、粗いイメージレベルのラベルを使用して、自己教師付き学習を洗練することができる。
画素レベルの偽陽性と偽陰性を抑制するための包括的な戦略が提案されている。
論文 参考訳(メタデータ) (2021-07-02T09:46:06Z) - Reinforcement Based Learning on Classification Task Could Yield Better
Generalization and Adversarial Accuracy [0.0]
画像分類タスクを用いて深層学習モデルを訓練する新しい手法を提案する。
強化学習におけるバニラポリシー勾配法に類似した報酬に基づく最適化関数を用いる。
論文 参考訳(メタデータ) (2020-12-08T11:03:17Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z) - Unsupervised Landmark Learning from Unpaired Data [117.81440795184587]
教師なしランドマーク学習の最近の試みは、外観は似ているがポーズでは異なる合成画像対を活用する。
本稿では,2回スワッピング・リコンストラクション・ストラテジーを適用して最終監視を行うクロスイメージ・サイクル整合性フレームワークを提案する。
提案するフレームワークは,強いベースラインを大きなマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-06-29T13:57:20Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z) - Un-Mix: Rethinking Image Mixtures for Unsupervised Visual Representation
Learning [108.999497144296]
近年の先進的な教師なし学習手法では,同じ画像から2つの「ビュー」を学習表現として比較するために,サイムズ様の枠組みを用いている。
この研究は、教師なし学習においてラベル空間上の距離の概念を巻き込み、正対と負対のソフトな類似度をモデルに認識させることを目的としている。
その概念的単純さにもかかわらず、この解 -- 教師なし画像混合(Un-Mix)により、変換された入力と対応する新しいラベル空間からより微妙でより堅牢で一般化された表現を学習できることを実証的に示す。
論文 参考訳(メタデータ) (2020-03-11T17:59:04Z) - Continual Local Replacement for Few-shot Learning [13.956960291580938]
少数ショット学習の目標は,1つないし少数のトレーニングデータに基づいて,新しいクラスを認識可能なモデルを学習することにある。
1)新しいクラスの優れた特徴表現が欠けていること、(2)ラベル付きデータの一部が真のデータ分布を正確に表現できないこと、である。
データ不足問題に対処するために,新たな局所的置換戦略を提案する。
論文 参考訳(メタデータ) (2020-01-23T04:26:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。