論文の概要: Multi-class Probabilistic Bounds for Self-learning
- arxiv url: http://arxiv.org/abs/2109.14422v1
- Date: Wed, 29 Sep 2021 13:57:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-30 14:44:35.333462
- Title: Multi-class Probabilistic Bounds for Self-learning
- Title(参考訳): 自己学習のための多クラス確率境界
- Authors: Vasilii Feofanov and Emilie Devijver and Massih-Reza Amini
- Abstract要約: Pseudo-labelingはエラーを起こしやすいため、ラベルなしのトレーニングデータにノイズのあるラベルを追加するリスクがある。
本稿では,多クラス分類シナリオにおける自己学習を部分的にラベル付きデータで分析する確率的枠組みを提案する。
- 参考スコア(独自算出の注目度): 13.875239300089861
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-learning is a classical approach for learning with both labeled and
unlabeled observations which consists in giving pseudo-labels to unlabeled
training instances with a confidence score over a predetermined threshold. At
the same time, the pseudo-labeling technique is prone to error and runs the
risk of adding noisy labels into unlabeled training data. In this paper, we
present a probabilistic framework for analyzing self-learning in the
multi-class classification scenario with partially labeled data. First, we
derive a transductive bound over the risk of the multi-class majority vote
classifier. Based on this result, we propose to automatically choose the
threshold for pseudo-labeling that minimizes the transductive bound. Then, we
introduce a mislabeling error model to analyze the error of the majority vote
classifier in the case of the pseudo-labeled data. We derive a probabilistic
C-bound over the majority vote error when an imperfect label is given.
Empirical results on different data sets show the effectiveness of our
framework compared to several state-of-the-art semi-supervised approaches.
- Abstract(参考訳): 自己学習(セルフラーニング)は、ラベル付きおよびラベルなしの観察の両方で学習するための古典的なアプローチであり、所定の閾値を超えた信頼スコアを持つラベルなしトレーニングインスタンスに擬似ラベルを与える。
同時に、擬似ラベル技術はエラーを起こしやすく、ラベルなしのトレーニングデータにノイズの多いラベルを追加するリスクも負う。
本稿では,多クラス分類シナリオにおける自己学習を部分的にラベル付きデータで分析する確率的枠組みを提案する。
まず、多クラス多数決分類器のリスクに対して、トランスダクティブなバウンダリを導出する。
この結果に基づき、トランスダクティブ境界を最小化する擬似ラベルのしきい値を自動的に選択する。
次に、擬似ラベルデータの場合の多数決分類器の誤りを分析するために、誤ラベル誤りモデルを導入する。
不完全なラベルが与えられた場合、多数決エラーに対して確率的C-boundを導出する。
異なるデータセットにおける実験結果から, 最先端の半教師付きアプローチと比較して, フレームワークの有効性が示された。
関連論文リスト
- Reduction-based Pseudo-label Generation for Instance-dependent Partial Label Learning [41.345794038968776]
本稿では,誤り候補ラベルの影響を軽減するために,リダクションに基づく擬似ラベルを活用することを提案する。
推定モデルから生成した擬似ラベルと比較して,減算に基づく擬似ラベルはベイズ最適分類器との整合性が高いことを示す。
論文 参考訳(メタデータ) (2024-10-28T07:32:20Z) - Multi-Label Noise Transition Matrix Estimation with Label Correlations:
Theory and Algorithm [73.94839250910977]
ノイズの多いマルチラベル学習は、大規模な正確なラベルの収集によって生じる課題により、注目を集めている。
遷移行列の導入は、マルチラベルノイズをモデル化し、統計的に一貫したアルゴリズムの開発に役立つ。
そこで本稿では, アンカーポイントを必要とせずに, ラベル相関を利用した新しい推定器を提案する。
論文 参考訳(メタデータ) (2023-09-22T08:35:38Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - Seq-UPS: Sequential Uncertainty-aware Pseudo-label Selection for
Semi-Supervised Text Recognition [21.583569162994277]
最も一般的なSSLアプローチの1つは擬似ラベル(PL)である。
PL法はノイズによって著しく劣化し、ノイズの多いラベルに過度に適合する傾向がある。
テキスト認識のための擬似ラベル生成と不確実性に基づくデータ選択フレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-31T02:21:02Z) - Learning from Multiple Unlabeled Datasets with Partial Risk
Regularization [80.54710259664698]
本稿では,クラスラベルを使わずに正確な分類器を学習することを目的とする。
まず、与えられたラベルのない集合から推定できる分類リスクの偏りのない推定器を導出する。
その結果、経験的リスクがトレーニング中に負になるにつれて、分類器が過度に適合する傾向があることが判明した。
実験により,本手法は,複数の未ラベル集合から学習する最先端の手法を効果的に緩和し,性能を向上することを示した。
論文 参考訳(メタデータ) (2022-07-04T16:22:44Z) - One Positive Label is Sufficient: Single-Positive Multi-Label Learning
with Label Enhancement [71.9401831465908]
本研究では,SPMLL (Single- positive multi-label learning) について検討した。
ラベルエンハンスメントを用いた単陽性MultIラベル学習という新しい手法を提案する。
ベンチマークデータセットの実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2022-06-01T14:26:30Z) - Learning with Proper Partial Labels [87.65718705642819]
部分ラベル学習は、不正確なラベルを持つ弱い教師付き学習の一種である。
この適切な部分ラベル学習フレームワークには,従来の部分ラベル学習設定が数多く含まれていることを示す。
次に、分類リスクの統一的非バイアス推定器を導出する。
論文 参考訳(メタデータ) (2021-12-23T01:37:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。