論文の概要: AggMatch: Aggregating Pseudo Labels for Semi-Supervised Learning
- arxiv url: http://arxiv.org/abs/2201.10444v1
- Date: Tue, 25 Jan 2022 16:41:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-26 15:32:23.216407
- Title: AggMatch: Aggregating Pseudo Labels for Semi-Supervised Learning
- Title(参考訳): AggMatch: 半教師付き学習のための擬似ラベルの集約
- Authors: Jiwon Kim, Kwangrok Ryoo, Gyuseong Lee, Seokju Cho, Junyoung Seo,
Daehwan Kim, Hansang Cho, Seungryong Kim
- Abstract要約: 半教師付き学習は、大量のラベルのないデータを活用するための効果的なパラダイムであることが証明されている。
AggMatchは、異なる自信のあるインスタンスを使用して初期擬似ラベルを洗練する。
我々は,AggMatchの標準ベンチマークにおける最新の手法に対する有効性を示す実験を行った。
- 参考スコア(独自算出の注目度): 25.27527138880104
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semi-supervised learning (SSL) has recently proven to be an effective
paradigm for leveraging a huge amount of unlabeled data while mitigating the
reliance on large labeled data. Conventional methods focused on extracting a
pseudo label from individual unlabeled data sample and thus they mostly
struggled to handle inaccurate or noisy pseudo labels, which degenerate
performance.
In this paper, we address this limitation with a novel SSL framework for
aggregating pseudo labels, called AggMatch, which refines initial pseudo labels
by using different confident instances. Specifically, we introduce an
aggregation module for consistency regularization framework that aggregates the
initial pseudo labels based on the similarity between the instances. To enlarge
the aggregation candidates beyond the mini-batch, we present a class-balanced
confidence-aware queue built with the momentum model, encouraging to provide
more stable and consistent aggregation. We also propose a novel
uncertainty-based confidence measure for the pseudo label by considering the
consensus among multiple hypotheses with different subsets of the queue. We
conduct experiments to demonstrate the effectiveness of AggMatch over the
latest methods on standard benchmarks and provide extensive analyses.
- Abstract(参考訳): 半教師付き学習(SSL)は、最近、巨大なラベル付きデータへの依存を軽減しつつ、大量のラベル付きデータを活用するための効果的なパラダイムであることが証明された。
従来の方法では、個々のラベルのないデータサンプルから擬似ラベルを抽出することに集中しており、不正確な偽ラベルやうるさい偽ラベルを扱うのにほとんど苦労していた。
本稿では,疑似ラベルを集約するための新しいsslフレームワークであるaggmatchを用いて,信頼度の高いインスタンスを用いて初期擬似ラベルを洗練する。
具体的には,インスタンス間の類似性に基づいて初期擬似ラベルを集約する一貫性正規化フレームワークのためのアグリゲーションモジュールを提案する。
最小バッチを超えるアグリゲーション候補を拡大するため,モーメントモデルで構築したクラスバランスの信頼性を考慮したキューを提案し,より安定かつ一貫したアグリゲーションを提供する。
また、キューのサブセットが異なる複数の仮説間のコンセンサスを考慮し、疑似ラベルに対する新しい不確実性に基づく信頼度尺度を提案する。
標準ベンチマークにおける最新の手法に対するaggmatchの有効性を実証する実験を行い,広範な分析を行った。
関連論文リスト
- Generalized Semi-Supervised Learning via Self-Supervised Feature Adaptation [87.17768598044427]
従来の半教師付き学習は、ラベル付きデータとラベルなしデータの特徴分布が一貫したものであると仮定する。
本稿では,ラベル付きおよびラベルなしデータの分散によるSSL性能向上のための汎用フレームワークであるセルフ・スーパービジョン・フィーチャー・アダプテーション(SSFA)を提案する。
提案するSSFAは擬似ラベルベースのSSL学習者に適用可能であり,ラベル付き,ラベルなし,さらには目に見えない分布における性能を著しく向上させる。
論文 参考訳(メタデータ) (2024-05-31T03:13:45Z) - RankMatch: A Novel Approach to Semi-Supervised Label Distribution
Learning Leveraging Inter-label Correlations [52.549807652527306]
本稿では,SSLDL (Semi-Supervised Label Distribution Learning) の革新的なアプローチである RankMatch を紹介する。
RankMatchは、ラベルのない大量のデータとともに、少数のラベル付き例を効果的に活用する。
我々はRandMatchに縛られる理論的な一般化を確立し、広範な実験を通じて既存のSSLDL法に対する性能上の優位性を実証した。
論文 参考訳(メタデータ) (2023-12-11T12:47:29Z) - InstanT: Semi-supervised Learning with Instance-dependent Thresholds [75.91684890150283]
本稿では,既存手法と比較して高い自由度を有するインスタンス依存しきい値の研究を提案する。
インスタンスレベルのあいまいさと擬似ラベルのインスタンス依存エラー率を利用して、すべての未ラベルインスタンスに対して新しいインスタンス依存しきい値関数を考案する。
論文 参考訳(メタデータ) (2023-10-29T05:31:43Z) - Leveraging Ensemble Diversity for Robust Self-Training in the Presence of Sample Selection Bias [5.698050337128548]
半教師付き学習において、自己学習はよく知られたアプローチである。モデルが自信を持ってラベル付きデータに擬似ラベルを反復的に割り当て、ラベル付き例として扱う。
ニューラルネットワークの場合、ソフトマックス予測確率はしばしば信頼度尺度として使用されるが、誤った予測であっても過度に信頼されていることが知られている。
本稿では,線形分類器のアンサンブルの予測多様性に基づいて,$mathcalT$-similarityと呼ばれる新しい信頼度尺度を提案する。
論文 参考訳(メタデータ) (2023-10-23T11:30:06Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Seq-UPS: Sequential Uncertainty-aware Pseudo-label Selection for
Semi-Supervised Text Recognition [21.583569162994277]
最も一般的なSSLアプローチの1つは擬似ラベル(PL)である。
PL法はノイズによって著しく劣化し、ノイズの多いラベルに過度に適合する傾向がある。
テキスト認識のための擬似ラベル生成と不確実性に基づくデータ選択フレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-31T02:21:02Z) - Dash: Semi-Supervised Learning with Dynamic Thresholding [72.74339790209531]
我々は、ラベルのない例を使ってモデルをトレーニングする半教師付き学習(SSL)アプローチを提案する。
提案手法であるDashは、ラベルなしデータ選択の観点から適応性を享受する。
論文 参考訳(メタデータ) (2021-09-01T23:52:29Z) - In Defense of Pseudo-Labeling: An Uncertainty-Aware Pseudo-label
Selection Framework for Semi-Supervised Learning [53.1047775185362]
Pseudo-labeling (PL) は一般的な SSL アプローチで、この制約はありませんが、当初の処方では比較的不十分です。
PLは不整合モデルからの誤った高い信頼度予測により性能が低下していると論じる。
そこで本研究では,疑似ラベリング精度を向上させるための不確実性認識型擬似ラベル選択(ups)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-15T23:29:57Z) - How to trust unlabeled data? Instance Credibility Inference for Few-Shot
Learning [47.21354101796544]
本稿では,未ラベルのインスタンスを数発の視覚認識に利用するために,ICI (Instance Credibility Inference) と呼ばれる統計的アプローチを提案する。
擬似ラベル付きインスタンスの信頼性は, それらの付随パラメータの正規化経路に沿ってランク付けし, 最も信頼性の高い擬似ラベル付きインスタンスを拡張ラベル付きインスタンスとして保存する。
論文 参考訳(メタデータ) (2020-07-15T03:38:09Z) - Instance Credibility Inference for Few-Shot Learning [45.577880041135785]
ほとんどショットラーニングは、カテゴリごとに非常に限られたトレーニングデータを持つ新しいオブジェクトを認識することを目的としていない。
本稿では,未ラベルのインスタンスの分散サポートを数発の学習に活用するために,ICI (Instance Credibility Inference) と呼ばれる単純な統計手法を提案する。
我々の単純なアプローチは、広く使われている4つのショットラーニングベンチマークデータセットに基づいて、最先端の新たなデータセットを確立することができる。
論文 参考訳(メタデータ) (2020-03-26T12:01:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。