論文の概要: Towards Semi-supervised Learning with Non-random Missing Labels
- arxiv url: http://arxiv.org/abs/2308.08872v1
- Date: Thu, 17 Aug 2023 09:09:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 17:28:55.840503
- Title: Towards Semi-supervised Learning with Non-random Missing Labels
- Title(参考訳): 非ランダム欠落ラベルを用いた半教師付き学習を目指して
- Authors: Yue Duan, Zhen Zhao, Lei Qi, Luping Zhou, Lei Wang, Yinghuan Shi
- Abstract要約: クラス遷移追跡に基づく Pseudo-Rectifying Guidance (PRG) は、MNAR (Missing Not At Random) ラベルのために考案された。
PRGは、疑似修正手順によって引き起こされたクラス分布とクラス遷移の履歴情報を統一する。
さまざまなMNARシナリオにおけるPRGの優れたパフォーマンスを示し、最新のSSLアプローチよりも優れています。
- 参考スコア(独自算出の注目度): 42.71454054383897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised learning (SSL) tackles the label missing problem by enabling
the effective usage of unlabeled data. While existing SSL methods focus on the
traditional setting, a practical and challenging scenario called label Missing
Not At Random (MNAR) is usually ignored. In MNAR, the labeled and unlabeled
data fall into different class distributions resulting in biased label
imputation, which deteriorates the performance of SSL models. In this work,
class transition tracking based Pseudo-Rectifying Guidance (PRG) is devised for
MNAR. We explore the class-level guidance information obtained by the Markov
random walk, which is modeled on a dynamically created graph built over the
class tracking matrix. PRG unifies the historical information of class
distribution and class transitions caused by the pseudo-rectifying procedure to
maintain the model's unbiased enthusiasm towards assigning pseudo-labels to all
classes, so as the quality of pseudo-labels on both popular classes and rare
classes in MNAR could be improved. Finally, we show the superior performance of
PRG across a variety of MNAR scenarios, outperforming the latest SSL approaches
combining bias removal solutions by a large margin. Code and model weights are
available at https://github.com/NJUyued/PRG4SSL-MNAR.
- Abstract(参考訳): semi-supervised learning (ssl) はラベルなしデータの有効利用を可能にすることでラベル欠落問題に対処している。
既存のSSLメソッドは従来の設定に重点を置いているが、MNAR(Missing Not At Random)と呼ばれる実用的で困難なシナリオは通常無視される。
MNARでは、ラベル付きおよびラベルなしのデータは異なるクラス分布に分解され、バイアス付きラベル計算が行われ、SSLモデルの性能が低下する。
本研究では,クラス遷移追跡に基づくPseudo-Rectifying Guidance(PRG)をMNAR向けに考案した。
クラス追跡行列上に構築された動的に生成されたグラフをモデルとしたマルコフランダムウォークによるクラスレベルのガイダンス情報について検討する。
PRGは、疑似修正手順によって生じるクラス分布とクラス遷移の履歴情報を統一し、すべてのクラスに擬似ラベルを割り当てることに対するモデルの偏りのない熱意を維持することにより、MNARにおける人気のあるクラスと稀なクラスの擬似ラベルの品質を向上させることができる。
最後に、様々なMNARシナリオにおけるPRGの優れた性能を示し、バイアス除去ソリューションを大きなマージンで組み合わせた最新のSSLアプローチよりも優れています。
コードとモデルの重み付けはhttps://github.com/NJUyued/PRG4SSL-MNARで確認できる。
関連論文リスト
- Generalized Semi-Supervised Learning via Self-Supervised Feature Adaptation [87.17768598044427]
従来の半教師付き学習は、ラベル付きデータとラベルなしデータの特徴分布が一貫したものであると仮定する。
本稿では,ラベル付きおよびラベルなしデータの分散によるSSL性能向上のための汎用フレームワークであるセルフ・スーパービジョン・フィーチャー・アダプテーション(SSFA)を提案する。
提案するSSFAは擬似ラベルベースのSSL学習者に適用可能であり,ラベル付き,ラベルなし,さらには目に見えない分布における性能を著しく向上させる。
論文 参考訳(メタデータ) (2024-05-31T03:13:45Z) - Semi-Supervised Learning with Multiple Imputations on Non-Random Missing
Labels [0.0]
Semi-Supervised Learning (SSL)は、ラベル付きデータとラベルなしデータの両方でアルゴリズムがトレーニングされるときに実装される。
本稿では,より高精度でバイアスの少ない複数の計算モデルを組み合わせるための2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-15T04:09:53Z) - Contrastive Credibility Propagation for Reliable Semi-Supervised Learning [6.014538614447467]
逐次的擬似ラベルリファインメントによる深部SSLのためのコントラストCCP(Contrastive Credibility Propagation)を提案する。
CCPは、教師付きベースラインをデータシナリオで確実に上回るために、半教師付き学習とノイズの多いラベル学習を統一する。
論文 参考訳(メタデータ) (2022-11-17T23:01:47Z) - NorMatch: Matching Normalizing Flows with Discriminative Classifiers for
Semi-Supervised Learning [8.749830466953584]
Semi-Supervised Learning (SSL)は、小さなラベル付きセットと大量のラベルなしデータを使ってモデルを学習することを目的としている。
この作業では、NorMatchというSSLの新しいフレームワークを紹介します。
数値的および視覚的な結果を通して、NorMatchはいくつかのデータセットで最先端のパフォーマンスを達成することを実証する。
論文 参考訳(メタデータ) (2022-11-17T15:39:18Z) - On Non-Random Missing Labels in Semi-Supervised Learning [114.62655062520425]
Semi-Supervised Learning (SSL)は基本的にラベルの問題である。
SSL に "class" を明示的に組み込んでいます。
提案手法は,既存のベースラインを著しく上回るだけでなく,他のラベルバイアス除去SSL法を上回ります。
論文 参考訳(メタデータ) (2022-06-29T22:01:29Z) - Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced
Semi-Supervised Learning [80.05441565830726]
本稿では,疑似ラベルの重み付けがモデル性能に悪影響を及ぼすような,不均衡な半教師付き学習に対処する。
本稿では,この観測の動機となるバイアスに対処する,一般的な擬似ラベルフレームワークを提案する。
不均衡SSLのための新しい擬似ラベルフレームワークを、DASO(Distributed-Aware Semantics-Oriented Pseudo-label)と呼ぶ。
論文 参考訳(メタデータ) (2021-06-10T11:58:25Z) - PLM: Partial Label Masking for Imbalanced Multi-label Classification [59.68444804243782]
長いラベルの分布を持つ実世界のデータセットで訓練されたニューラルネットワークは、頻繁なクラスに偏りがあり、頻繁なクラスでは不十分である。
本稿では,この比率を利用したPLM(Partial Label Masking)を提案する。
本手法は,マルチラベル (MultiMNIST と MSCOCO) とシングルラベル (CIFAR-10 と CIFAR-100) の2つの画像分類データセットにおいて,既存の手法と比較して高い性能を実現する。
論文 参考訳(メタデータ) (2021-05-22T18:07:56Z) - Distribution Aligning Refinery of Pseudo-label for Imbalanced
Semi-supervised Learning [126.31716228319902]
Pseudo-label (DARP) アルゴリズムの分散アライメント・リファナリーを開発する。
DARPは最先端のSSLスキームと有効かつ効率的に互換性があることを示す。
論文 参考訳(メタデータ) (2020-07-17T09:16:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。