論文の概要: USE: Uncertainty Structure Estimation for Robust Semi-Supervised Learning
- arxiv url: http://arxiv.org/abs/2603.00404v1
- Date: Sat, 28 Feb 2026 01:31:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.173644
- Title: USE: Uncertainty Structure Estimation for Robust Semi-Supervised Learning
- Title(参考訳): USE:ロバストな半教師付き学習のための不確かさ構造推定
- Authors: Tsao-Lun Chen, Chien-Liang Liu, Tzu-Ming Harry Hsu, Tai-Hsien Wu, Chi-Cheng Fu, Han-Yi E. Chou, Shun-Feng Su,
- Abstract要約: 半教師付き学習(SSL)における不確実性構造推定(USE)の導入
USEはラベル付きセットのプロキシモデルをトレーニングし、ラベルなしサンプルのエントロピースコアを計算する。
USEが一貫して精度を向上し、OOD汚染のレベルが変化していることは明らかである。
- 参考スコア(独自算出の注目度): 6.021112703667433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this study, a novel idea, Uncertainty Structure Estimation (USE), a lightweight, algorithm-agnostic procedure that emphasizes the often-overlooked role of unlabeled data quality is introduced for Semi-supervised learning (SSL). SSL has achieved impressive progress, but its reliability in deployment is limited by the quality of the unlabeled pool. In practice, unlabeled data are almost always contaminated by out-of-distribution (OOD) samples, where both near-OOD and far-OOD can negatively affect performance in different ways. We argue that the bottleneck does not lie in algorithmic design, but rather in the absence of principled mechanisms to assess and curate the quality of unlabeled data. The proposed USE trains a proxy model on the labeled set to compute entropy scores for unlabeled samples, and then derives a threshold, via statistical comparison against a reference distribution, that separates informative (structured) from uninformative (structureless) samples. This enables assessment as a preprocessing step, removing uninformative or harmful unlabeled data before SSL training begins. Through extensive experiments on imaging (CIFAR-100) and NLP (Yelp Review) data, it is evident that USE consistently improves accuracy and robustness under varying levels of OOD contamination. Thus, it can be concluded that the proposed approach reframes unlabeled data quality control as a structural assessment problem, and considers it as a necessary component for reliable and efficient SSL in realistic mixed-distribution environments.
- Abstract(参考訳): 本研究では,半教師付き学習(SSL)において,ラベル付きデータ品質の重要視される役割を強調する軽量かつアルゴリズムに依存しない手法である不確実性構造推定(USE)を提案する。
SSLは目覚ましい進歩を遂げましたが、そのデプロイメントの信頼性は、ラベルのないプールの品質によって制限されています。
実際には、ラベルなしデータは、ほとんど常にオフ・オブ・ディストリビューション(OOD)サンプルによって汚染される。
ボトルネックはアルゴリズム設計ではなく、ラベルのないデータの品質を評価し、キュレートするための原則的なメカニズムが欠如している、と我々は主張する。
提案したUSEは、ラベル付き集合上のプロキシモデルをトレーニングし、ラベル付きサンプルのエントロピースコアを計算し、参照分布に対する統計的比較を通じて閾値を導出し、情報的(構造化されていない)サンプルと非情報的(構造化されていない)サンプルを分離する。
これにより、SSLトレーニングが始まる前に、前処理ステップとしてアセスメントが可能になり、非形式的または有害なラベル付きデータを削除できる。
画像解析 (CIFAR-100) と NLP (Yelp Review) のデータにより, USE はOOD 汚染のレベルが異なる場合, 常に精度と堅牢性を向上することが明らかとなった。
そこで,本提案手法は,非ラベル付きデータ品質制御を構造評価問題として再設計し,現実的な混合配信環境における信頼性と効率的なSSLに必要なコンポーネントとみなすことができる。
関連論文リスト
- Let the Void Be Void: Robust Open-Set Semi-Supervised Learning via Selective Non-Alignment [1.8350044465969415]
オープンセット半教師付き学習(OSSL)は、分布内(ID)と分布外(OOD)の両方を含むラベルのないデータを活用する。
選択的な非アライメントを導入し、新しい「スキップ」演算子を従来のプル・アンド・プッシュ操作に追加する。
我々のフレームワークであるSkipAlignは、低信頼の未ラベルサンプルに対するアライメント(プル)を選択的にスキップし、IDプロトタイプに対する穏やかな反発のみを保持する。
論文 参考訳(メタデータ) (2025-04-17T01:37:53Z) - Uncertainty-Aware Out-of-Distribution Detection with Gaussian Processes [13.246251147975192]
ディープニューラルネットワーク(DNN)はしばしばクローズドワールドの前提の下で構築される。
OODサンプルは、現実世界のアプリケーションでトレーニングフェーズで必ずしも利用できない。
InDデータのみに基づく決定境界を確立するために,ガウス過程に基づくOOD検出手法を提案する。
論文 参考訳(メタデータ) (2024-12-30T12:57:31Z) - How Does Unlabeled Data Provably Help Out-of-Distribution Detection? [63.41681272937562]
in-distribution (ID) とout-of-distribution (OOD) の両データの不均一性のため、未ラベルの in-the-wild データは非自明である。
本稿では,理論的保証と実証的有効性の両方を提供する新たな学習フレームワークであるSAL(Separate And Learn)を紹介する。
論文 参考訳(メタデータ) (2024-02-05T20:36:33Z) - Complementing Semi-Supervised Learning with Uncertainty Quantification [6.612035830987296]
そこで本研究では,アレータ性およびてんかん性不確実性定量化に依存する,教師なし不確実性認識の新たな目的を提案する。
CIFAR-100やMini-ImageNetのような複雑なデータセットでは,結果が最先端の成果よりも優れています。
論文 参考訳(メタデータ) (2022-07-22T00:15:02Z) - Incorporating Semi-Supervised and Positive-Unlabeled Learning for
Boosting Full Reference Image Quality Assessment [73.61888777504377]
フル参照(FR)画像品質評価(IQA)は、その知覚的差異をプリズム品質基準で測定することにより、歪み画像の視覚的品質を評価する。
ラベルなしデータは、画像劣化または復元プロセスから容易に収集することができ、ラベルなしのトレーニングデータを利用してFR-IQA性能を高めることを奨励する。
本稿では, 半教師付き, 正の未ラベル学習(PU)を用いて, ラベルなしデータを活用し, オフレーヤの悪影響を軽減することを提案する。
論文 参考訳(メタデータ) (2022-04-19T09:10:06Z) - Robust Deep Semi-Supervised Learning: A Brief Introduction [63.09703308309176]
半教師付き学習(SSL)は、ラベルが不十分なときにラベル付きデータを活用することにより、学習性能を向上させることを目的としている。
ディープモデルによるSSLは、標準ベンチマークタスクで成功したことが証明されている。
しかし、それらは現実世界のアプリケーションにおける様々な堅牢性に対する脅威に対して依然として脆弱である。
論文 参考訳(メタデータ) (2022-02-12T04:16:41Z) - Provably Robust Detection of Out-of-distribution Data (almost) for free [124.14121487542613]
ディープニューラルネットワークは、アウト・オブ・ディストリビューション(OOD)データに対する高い過度な予測を生成することが知られている。
本稿では,認証可能なOOD検出器を標準分類器と組み合わせてOOD認識分類器を提案する。
このようにして、我々は2つの世界のベストを達成している。OOD検出は、分布内に近いOODサンプルであっても、予測精度を損なうことなく、非操作型OODデータに対する最先端のOOD検出性能に近接する。
論文 参考訳(メタデータ) (2021-06-08T11:40:49Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z) - Know Your Limits: Uncertainty Estimation with ReLU Classifiers Fails at
Reliable OOD Detection [0.0]
本稿では, 実験結果について理論的に説明し, 合成データから考察する。
このような技術は、分類設定でOODサンプルを確実に識別できないことを証明します。
論文 参考訳(メタデータ) (2020-12-09T21:35:55Z) - Multi-Task Curriculum Framework for Open-Set Semi-Supervised Learning [54.85397562961903]
ラベル付きデータに制限がある場合に、ラベルなしデータを利用して強力なモデルをトレーニングする半教師付き学習(SSL)が提案されている。
我々は、Open-set SSLと呼ばれるより複雑な新しいシナリオに対処する。
提案手法は,OOD試料の効果を除去し,最先端の結果を得る。
論文 参考訳(メタデータ) (2020-07-22T10:33:55Z) - Uncertainty-Based Out-of-Distribution Classification in Deep
Reinforcement Learning [17.10036674236381]
アウト・オブ・ディストリビューションデータの誤予測は、機械学習システムにおける安全性の危機的状況を引き起こす可能性がある。
我々は不確実性に基づくOOD分類のためのフレームワークUBOODを提案する。
UBOODはアンサンブルに基づく推定器と組み合わせることで,信頼性の高い分類結果が得られることを示す。
論文 参考訳(メタデータ) (2019-12-31T09:52:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。