論文の概要: Open-World Semi-Supervised Learning
- arxiv url: http://arxiv.org/abs/2102.03526v1
- Date: Sat, 6 Feb 2021 07:11:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 16:00:35.077527
- Title: Open-World Semi-Supervised Learning
- Title(参考訳): オープンワールド半教師付き学習
- Authors: Kaidi Cao, Maria Brbic, Jure Leskovec
- Abstract要約: 本稿では,従来のクラスを認識するためにモデルを必要とする,新しいオープンワールド半教師付き学習環境を提案する。
データの分類とクラスタ化を同時に行うアプローチであるORCAを提案する。
我々は,ORCAが新しいクラスを正確に発見し,ベンチマーク画像分類データセット上で以前に見られたクラスにサンプルを割り当てることを示した。
- 参考スコア(独自算出の注目度): 66.90703597468377
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Supervised and semi-supervised learning methods have been traditionally
designed for the closed-world setting based on the assumption that unlabeled
test data contains only classes previously encountered in the labeled training
data. However, the real world is inherently open and dynamic, and thus novel,
previously unseen classes may appear in the test data or during the model
deployment. Here, we introduce a new open-world semi-supervised learning
setting in which the model is required to recognize previously seen classes, as
well as to discover novel classes never seen in the labeled dataset. To tackle
the problem, we propose ORCA, an approach that learns to simultaneously
classify and cluster the data. ORCA classifies examples from the unlabeled
dataset to previously seen classes, or forms a novel class by grouping similar
examples together. The key idea in ORCA is in introducing uncertainty based
adaptive margin that effectively circumvents the bias caused by the imbalance
of variance between seen and novel classes/clusters. We demonstrate that ORCA
accurately discovers novel classes and assigns samples to previously seen
classes on benchmark image classification datasets, including CIFAR and
ImageNet. Remarkably, despite solving the harder task ORCA outperforms
semi-supervised methods on seen classes, as well as novel class discovery
methods on novel classes, achieving 7% and 151% improvements on seen and novel
classes in the ImageNet dataset.
- Abstract(参考訳): 教師付きおよび半教師付き学習手法は、ラベル付きトレーニングデータで以前に遭遇したクラスのみを含むという仮定に基づいて、従来からクローズドワールド設定のために設計されてきた。
しかし、現実の世界は本質的にオープンで動的であるため、以前は目に見えないクラスがテストデータやモデル展開中に現れることがある。
ここでは,従来見てきたクラスを認識し,ラベル付きデータセットにない新しいクラスを発見するために,モデルが要求される,新たなオープンワールド半教師付き学習環境を提案する。
そこで本研究では,データの同時分類とクラスタ化を学習するORCAを提案する。
ORCAはラベルなしデータセットの例を以前のクラスに分類するか、類似した例をまとめてグループ化して新しいクラスを形成する。
ORCAの重要なアイデアは、目に見えないクラスと新しいクラス/クラス間の分散の不均衡によって引き起こされるバイアスを効果的に回避する不確実性ベースの適応マージンを導入することです。
ORCAが新しいクラスを正確に発見し、CIFARやImageNetを含むベンチマーク画像分類データセットの以前に見たクラスにサンプルを割り当てることを示した。
注目すべきは、ORCAが難解なタスクを解決したにもかかわらず、シークレットクラスでは半教師付きメソッド、新しいクラスでは新しいクラス発見メソッドが、ImageNetデータセットでは、シークレットクラスと新規クラスでは7%と151%の改善が達成されていることだ。
関連論文リスト
- Robust Semi-Supervised Learning for Self-learning Open-World Classes [5.714673612282175]
実世界のアプリケーションでは、ラベル付きデータは常にラベル付き集合に存在しないクラスを含んでいる。
本稿では,自己学習型オープンワールドクラス(SSOC)のためのオープンワールドSSL手法を提案する。
SSOCは、複数の人気のある分類ベンチマークで最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2024-01-15T09:27:46Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Bridging the Gap: Learning Pace Synchronization for Open-World Semi-Supervised Learning [44.91863420044712]
オープンワールドの半教師付き学習において、機械学習モデルはラベルなしのデータから新しいカテゴリを明らかにすることを任務とする。
本稿では,(1)モデル偏差を軽減するためにクラス固有の負のマージンを課するアダプティブ・コミュニケート・ラミナル・ロス,(2)モデルによって予測される擬似ラベルを利用した擬似ラベル・コントラッシブ・クラスタリングについて紹介する。
本手法は,授業の学習速度のバランスを保ち,画像Netデータセットの平均精度を3%向上させる。
論文 参考訳(メタデータ) (2023-09-21T09:44:39Z) - Open-world Semi-supervised Novel Class Discovery [12.910670907071523]
オープンワールドのセミ教師付き新しいクラス発見手法であるOpenNCDを紹介した。
提案手法は, 相互強化された2つの部分から構成される。まず, 両レベルのコントラスト学習手法を導入し, プロトタイプのペアワイドな類似性を維持する。
提案手法は,特にクラスやラベルの少ないオープンワールドシナリオにおいて有効であることを示す。
論文 参考訳(メタデータ) (2023-05-22T14:59:50Z) - Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。
ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。
NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。
本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文 参考訳(メタデータ) (2021-12-03T13:31:59Z) - Improving Contrastive Learning on Imbalanced Seed Data via Open-World
Sampling [96.8742582581744]
我々は、Model-Aware K-center (MAK)と呼ばれるオープンワールドなラベルなしデータサンプリングフレームワークを提案する。
MAKは、尾性、近接性、多様性の3つの単純な原則に従う。
我々はMAKが学習した機能の全体的な表現品質とクラスバランス性の両方を継続的に改善できることを実証した。
論文 参考訳(メタデータ) (2021-11-01T15:09:41Z) - Bridging Non Co-occurrence with Unlabeled In-the-wild Data for
Incremental Object Detection [56.22467011292147]
物体検出における破滅的忘れを緩和するために,いくつかの漸進的学習法が提案されている。
有効性にもかかわらず、これらの手法は新規クラスのトレーニングデータにラベルのないベースクラスの共起を必要とする。
そこで本研究では,新たな授業の訓練において,欠落した基本クラスが原因で生じる非発生を補うために,未ラベルのインザ・ザ・ワイルドデータを使用することを提案する。
論文 参考訳(メタデータ) (2021-10-28T10:57:25Z) - Automatically Discovering and Learning New Visual Categories with
Ranking Statistics [145.89790963544314]
我々は,他のクラスをラベル付けした画像コレクションにおいて,新しいクラスを発見する問題に対処する。
汎用クラスタリングモデルを学び、後者を用いて、非競合データ中の新しいクラスを識別する。
我々は,標準分類ベンチマークに対するアプローチと,新しいカテゴリー発見法の性能を,有意なマージンで評価した。
論文 参考訳(メタデータ) (2020-02-13T18:53:32Z) - Semi-Supervised Class Discovery [7.123519086758813]
本稿では,ラベル作成能力の新たな重要度尺度であるデータセット再構成精度について紹介する。
クラスがトレーニングデータセットに追加に値するかどうかを判断するために、新しいクラス学習可能性を適用します。
クラス発見システムは視覚や言語にうまく適用できることを示す。
論文 参考訳(メタデータ) (2020-02-10T00:29:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。