論文の概要: Improving realistic semi-supervised learning with doubly robust estimation
- arxiv url: http://arxiv.org/abs/2502.00279v1
- Date: Sat, 01 Feb 2025 02:34:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 15:04:12.715710
- Title: Improving realistic semi-supervised learning with doubly robust estimation
- Title(参考訳): 二重ロバスト推定によるリアル半教師付き学習の改善
- Authors: Khiem Pham, Charles Herrmann, Ramin Zabih,
- Abstract要約: Semi-Supervised Learning (SSL)における大きな課題は、ラベルなしデータのクラス分布に関する制限された情報である。
本稿では,有限次元パラメータである無ラベルなクラス分布を,強い理論的保証を持つ2重頑健な推定器を用いて明示的に推定することを提案する。
この推定値を既存の手法に統合して、トレーニング中のラベルなしデータをより正確に擬似ラベル付けすることができる。
- 参考スコア(独自算出の注目度): 8.828699635463265
- License:
- Abstract: A major challenge in Semi-Supervised Learning (SSL) is the limited information available about the class distribution in the unlabeled data. In many real-world applications this arises from the prevalence of long-tailed distributions, where the standard pseudo-label approach to SSL is biased towards the labeled class distribution and thus performs poorly on unlabeled data. Existing methods typically assume that the unlabeled class distribution is either known a priori, which is unrealistic in most situations, or estimate it on-the-fly using the pseudo-labels themselves. We propose to explicitly estimate the unlabeled class distribution, which is a finite-dimensional parameter, \emph{as an initial step}, using a doubly robust estimator with a strong theoretical guarantee; this estimate can then be integrated into existing methods to pseudo-label the unlabeled data during training more accurately. Experimental results demonstrate that incorporating our techniques into common pseudo-labeling approaches improves their performance.
- Abstract(参考訳): Semi-Supervised Learning (SSL)における大きな課題は、ラベルなしデータのクラス分布に関する制限された情報である。
多くの現実世界のアプリケーションでは、SSLに対する標準的な擬似ラベルのアプローチがラベル付けされたクラス分布に偏っているため、ラベル付けされていないデータでは不十分である。
既存の手法では、未ラベルのクラス分布は、ほとんどの状況で非現実的な事前分布として知られているか、あるいは擬ラベル自身を使ってそれをオンザフライで推定する。
本稿では,有限次元パラメータである未ラベルのクラス分布である<emph{as an initial step}を,強い理論的保証を持つ二重頑健な推定器を用いて明示的に推定することを提案する。
実験により,提案手法を擬似ラベル手法に組み込むことで,性能が向上することが示された。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced
Semi-Supervised Learning [80.05441565830726]
本稿では,疑似ラベルの重み付けがモデル性能に悪影響を及ぼすような,不均衡な半教師付き学習に対処する。
本稿では,この観測の動機となるバイアスに対処する,一般的な擬似ラベルフレームワークを提案する。
不均衡SSLのための新しい擬似ラベルフレームワークを、DASO(Distributed-Aware Semantics-Oriented Pseudo-label)と呼ぶ。
論文 参考訳(メタデータ) (2021-06-10T11:58:25Z) - In Defense of Pseudo-Labeling: An Uncertainty-Aware Pseudo-label
Selection Framework for Semi-Supervised Learning [53.1047775185362]
Pseudo-labeling (PL) は一般的な SSL アプローチで、この制約はありませんが、当初の処方では比較的不十分です。
PLは不整合モデルからの誤った高い信頼度予測により性能が低下していると論じる。
そこで本研究では,疑似ラベリング精度を向上させるための不確実性認識型擬似ラベル選択(ups)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-15T23:29:57Z) - Distribution Aligning Refinery of Pseudo-label for Imbalanced
Semi-supervised Learning [126.31716228319902]
Pseudo-label (DARP) アルゴリズムの分散アライメント・リファナリーを開発する。
DARPは最先端のSSLスキームと有効かつ効率的に互換性があることを示す。
論文 参考訳(メタデータ) (2020-07-17T09:16:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。