論文の概要: Exploration and Exploitation of Unlabeled Data for Open-Set
Semi-Supervised Learning
- arxiv url: http://arxiv.org/abs/2306.17699v1
- Date: Fri, 30 Jun 2023 14:25:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-03 12:07:20.234643
- Title: Exploration and Exploitation of Unlabeled Data for Open-Set
Semi-Supervised Learning
- Title(参考訳): オープンセット半教師付き学習のためのラベルなしデータの探索と公開
- Authors: Ganlong Zhao, Guanbin Li, Yipeng Qin, Jinjin Zhang, Zhenhua Chai,
Xiaolin Wei, Liang Lin, Yizhou Yu
- Abstract要約: 半教師付き学習 (SSL) において, 未ラベルデータには, 内分布 (ID) と外分布 (OOD) の両方を含む, オープンセット SSL という複雑なシナリオに対処する。
提案手法は, 未ラベルデータにIDサンプルが完全に欠落している場合でも, 既存のSSL方式を改良する。
- 参考スコア(独自算出の注目度): 130.56124475528475
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address a complex but practical scenario in semi-supervised
learning (SSL) named open-set SSL, where unlabeled data contain both
in-distribution (ID) and out-of-distribution (OOD) samples. Unlike previous
methods that only consider ID samples to be useful and aim to filter out OOD
ones completely during training, we argue that the exploration and exploitation
of both ID and OOD samples can benefit SSL. To support our claim, i) we propose
a prototype-based clustering and identification algorithm that explores the
inherent similarity and difference among samples at feature level and
effectively cluster them around several predefined ID and OOD prototypes,
thereby enhancing feature learning and facilitating ID/OOD identification; ii)
we propose an importance-based sampling method that exploits the difference in
importance of each ID and OOD sample to SSL, thereby reducing the sampling bias
and improving the training. Our proposed method achieves state-of-the-art in
several challenging benchmarks, and improves upon existing SSL methods even
when ID samples are totally absent in unlabeled data.
- Abstract(参考訳): 本稿では,Open-set SSLと呼ばれる半教師付き学習(SSL)において,非ラベル付きデータには,非配布(ID)とアウト・オブ・ディストリビューション(OOD)の両方が含まれている,複雑なシナリオに対処する。
IDサンプルのみを有用とみなし、トレーニング中にOODサンプルを完全にフィルタリングすることを目的とした従来の方法とは異なり、IDサンプルとOODサンプルの探索と利用はSSLにとって有益である。
我々の主張を支持するために
一 特徴レベルにおけるサンプル間の類似点と相違点を探索し、それらをいくつかの事前定義されたIDおよびOODプロトタイプを中心に効果的にクラスタリングし、特徴学習とID/OOD識別の促進を図る。
二 重要度に基づくサンプリング手法を提案し、各IDとOODサンプルのSSLに対する重要性の差を利用してサンプリングバイアスを低減し、トレーニングを改善する。
提案手法は, 未ラベルデータにIDサンプルが完全に欠落している場合でも, 既存のSSL方式を改善する。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - SCOMatch: Alleviating Overtrusting in Open-set Semi-supervised Learning [25.508200663171625]
オープンセット半教師付き学習(OSSL)は、実用的なオープンセット未ラベルデータを使用する。
以前のOSSLメソッドはラベル付きIDデータを過信する傾向に悩まされていた。
我々は,OODサンプルを新たなクラスとして扱い,新たなSSLプロセスを形成する新しいOSSLであるSCOMatchを提案する。
論文 参考訳(メタデータ) (2024-09-26T03:47:34Z) - Generalized Semi-Supervised Learning via Self-Supervised Feature Adaptation [87.17768598044427]
従来の半教師付き学習は、ラベル付きデータとラベルなしデータの特徴分布が一貫したものであると仮定する。
本稿では,ラベル付きおよびラベルなしデータの分散によるSSL性能向上のための汎用フレームワークであるセルフ・スーパービジョン・フィーチャー・アダプテーション(SSFA)を提案する。
提案するSSFAは擬似ラベルベースのSSL学習者に適用可能であり,ラベル付き,ラベルなし,さらには目に見えない分布における性能を著しく向上させる。
論文 参考訳(メタデータ) (2024-05-31T03:13:45Z) - ID-like Prompt Learning for Few-Shot Out-of-Distribution Detection [47.16254775587534]
本稿では,CLIP citeDBLP:conf/icml/RadfordKHRGASAM21を用いて,IDライクな外れ値を検出する新しいOOD検出フレームワークを提案する。
強力なCLIPから恩恵を受けるため、モデルのプロンプトを学習するためには、少数のIDサンプルしか必要ありません。
本手法は,様々な実世界の画像データセットにおいて,より優れた数ショット学習性能を実現する。
論文 参考訳(メタデータ) (2023-11-26T09:06:40Z) - On the Effectiveness of Out-of-Distribution Data in Self-Supervised
Long-Tail Learning [15.276356824489431]
我々は、長期学習(COLT)のためのOODデータを用いたコントラストを提案する。
我々はSSL長期学習におけるOODサンプルの対直感的有用性を実証的に同定した。
提案手法は,長い尾のデータセット上でのSSLの性能を大きなマージンで大幅に向上させる。
論文 参考訳(メタデータ) (2023-06-08T04:32:10Z) - Collaborative Intelligence Orchestration: Inconsistency-Based Fusion of
Semi-Supervised Learning and Active Learning [60.26659373318915]
アクティブラーニング(AL)と半教師付きラーニング(SSL)は2つの効果があるが、しばしば孤立している。
本稿では、SSL-ALの潜在的な優位性をさらに調査するために、革新的な一貫性に基づく仮想aDvErialアルゴリズムを提案する。
2つの実世界のケーススタディは、提案したデータサンプリングアルゴリズムの適用と展開の実践的な産業価値を可視化する。
論文 参考訳(メタデータ) (2022-06-07T13:28:43Z) - Trash to Treasure: Harvesting OOD Data with Cross-Modal Matching for
Open-Set Semi-Supervised Learning [101.28281124670647]
オープンセット半教師付き学習(Open-set SSL)では、ラベルなしデータにOOD(Out-of-distribution)サンプルを含む、難しいが実用的なシナリオを調査する。
我々は、OODデータの存在を効果的に活用し、特徴学習を増強する新しいトレーニングメカニズムを提案する。
我々のアプローチは、オープンセットSSLのパフォーマンスを大幅に向上させ、最先端技術よりも大きなマージンで性能を向上します。
論文 参考訳(メタデータ) (2021-08-12T09:14:44Z) - Multi-Task Curriculum Framework for Open-Set Semi-Supervised Learning [54.85397562961903]
ラベル付きデータに制限がある場合に、ラベルなしデータを利用して強力なモデルをトレーニングする半教師付き学習(SSL)が提案されている。
我々は、Open-set SSLと呼ばれるより複雑な新しいシナリオに対処する。
提案手法は,OOD試料の効果を除去し,最先端の結果を得る。
論文 参考訳(メタデータ) (2020-07-22T10:33:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。