論文の概要: SCOMatch: Alleviating Overtrusting in Open-set Semi-supervised Learning
- arxiv url: http://arxiv.org/abs/2409.17512v1
- Date: Thu, 26 Sep 2024 03:47:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-28 23:17:44.783521
- Title: SCOMatch: Alleviating Overtrusting in Open-set Semi-supervised Learning
- Title(参考訳): SCOMatch: オープンセットセミ教師付き学習における過剰信頼の軽減
- Authors: Zerun Wang, Liuyu Xiang, Lang Huang, Jiafeng Mao, Ling Xiao, Toshihiko Yamasaki,
- Abstract要約: オープンセット半教師付き学習(OSSL)は、実用的なオープンセット未ラベルデータを使用する。
以前のOSSLメソッドはラベル付きIDデータを過信する傾向に悩まされていた。
我々は,OODサンプルを新たなクラスとして扱い,新たなSSLプロセスを形成する新しいOSSLであるSCOMatchを提案する。
- 参考スコア(独自算出の注目度): 25.508200663171625
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-set semi-supervised learning (OSSL) leverages practical open-set unlabeled data, comprising both in-distribution (ID) samples from seen classes and out-of-distribution (OOD) samples from unseen classes, for semi-supervised learning (SSL). Prior OSSL methods initially learned the decision boundary between ID and OOD with labeled ID data, subsequently employing self-training to refine this boundary. These methods, however, suffer from the tendency to overtrust the labeled ID data: the scarcity of labeled data caused the distribution bias between the labeled samples and the entire ID data, which misleads the decision boundary to overfit. The subsequent self-training process, based on the overfitted result, fails to rectify this problem. In this paper, we address the overtrusting issue by treating OOD samples as an additional class, forming a new SSL process. Specifically, we propose SCOMatch, a novel OSSL method that 1) selects reliable OOD samples as new labeled data with an OOD memory queue and a corresponding update strategy and 2) integrates the new SSL process into the original task through our Simultaneous Close-set and Open-set self-training. SCOMatch refines the decision boundary of ID and OOD classes across the entire dataset, thereby leading to improved results. Extensive experimental results show that SCOMatch significantly outperforms the state-of-the-art methods on various benchmarks. The effectiveness is further verified through ablation studies and visualization.
- Abstract(参考訳): オープンセット半教師付き学習(OSSL)は、見知らぬクラスからの非配布(ID)サンプルと、見つからないクラスからのアウト・オブ・ディストリビューション(OOD)サンプルの両方を、半教師付き学習(SSL)のために、実用的なオープンセット未ラベルデータを活用する。
以前のOSSLメソッドは、IDとOODの間の決定境界をラベル付きIDデータで学習し、その後、この境界を洗練させるために自己学習を用いていた。
ラベル付きデータの不足は、ラベル付きサンプルとIDデータ全体の分布バイアスを引き起こし、決定境界が過度に適合することを誤解させる。
その後の自己学習プロセスは、過度に適合した結果に基づいて、この問題の修正に失敗する。
本稿では,OODサンプルを新たなクラスとして扱い,新たなSSLプロセスを形成することで,過信問題に対処する。
具体的には,新しい OSSL 手法である SCOMatch を提案する。
1) 信頼性の高いOODサンプルをOODメモリキューと対応する更新戦略で新しいラベル付きデータとして選択する。
2) 新しいSSLプロセスは、我々の同時クローズセットとオープンセットのセルフトレーニングを通じて、元のタスクに統合されます。
SCOMatchはデータセット全体にわたるIDクラスとOODクラスの決定境界を洗練し、その結果が改善される。
SCOMatchは様々なベンチマークで最先端の手法よりも優れていた。
この効果はアブレーション研究と可視化によってさらに検証される。
関連論文リスト
- Robust Semi-supervised Learning by Wisely Leveraging Open-set Data [48.67897991121204]
Open-set Semi-supervised Learning (OSSL)は、ラベル付けされていないデータはラベル付けされていないクラスから来る可能性がある、という現実的な設定を持っている。
Wese Open-set Semi-supervised Learning (WiseOpen) は、モデルのトレーニングにオープンセットデータを選択的に活用する汎用OSSLフレームワークである。
論文 参考訳(メタデータ) (2024-05-11T10:22:32Z) - Exploration and Exploitation of Unlabeled Data for Open-Set
Semi-Supervised Learning [130.56124475528475]
半教師付き学習 (SSL) において, 未ラベルデータには, 内分布 (ID) と外分布 (OOD) の両方を含む, オープンセット SSL という複雑なシナリオに対処する。
提案手法は, 未ラベルデータにIDサンプルが完全に欠落している場合でも, 既存のSSL方式を改良する。
論文 参考訳(メタデータ) (2023-06-30T14:25:35Z) - Prompt-driven efficient Open-set Semi-supervised Learning [52.30303262499391]
オープンセット半教師付き学習(OSSL)は関心を集めており、未ラベルデータにのみOOD(Out-of-distribution)サンプルが組み込まれているというより実践的なシナリオを調査している。
我々はOpenPromptと呼ばれる,プロンプト駆動の効率的なOSSLフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-28T16:25:08Z) - Trash to Treasure: Harvesting OOD Data with Cross-Modal Matching for
Open-Set Semi-Supervised Learning [101.28281124670647]
オープンセット半教師付き学習(Open-set SSL)では、ラベルなしデータにOOD(Out-of-distribution)サンプルを含む、難しいが実用的なシナリオを調査する。
我々は、OODデータの存在を効果的に活用し、特徴学習を増強する新しいトレーニングメカニズムを提案する。
我々のアプローチは、オープンセットSSLのパフォーマンスを大幅に向上させ、最先端技術よりも大きなマージンで性能を向上します。
論文 参考訳(メタデータ) (2021-08-12T09:14:44Z) - OpenMatch: Open-set Consistency Regularization for Semi-supervised
Learning with Outliers [71.08167292329028]
我々はOpenMatchと呼ばれる新しいオープンセットセミスーパーバイザードラーニング(OSSL)アプローチを提案する。
OpenMatchは、1-vs-all(OVA)分類器に基づいた新規検出とFixMatchを統合する。
3つのデータセットで最先端のパフォーマンスを実現し、CIFAR10の未ラベルデータで見えないアウトリーチを検出する上で、完全な教師付きモデルよりも優れています。
論文 参考訳(メタデータ) (2021-05-28T23:57:15Z) - Multi-Task Curriculum Framework for Open-Set Semi-Supervised Learning [54.85397562961903]
ラベル付きデータに制限がある場合に、ラベルなしデータを利用して強力なモデルをトレーニングする半教師付き学習(SSL)が提案されている。
我々は、Open-set SSLと呼ばれるより複雑な新しいシナリオに対処する。
提案手法は,OOD試料の効果を除去し,最先端の結果を得る。
論文 参考訳(メタデータ) (2020-07-22T10:33:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。