論文の概要: Generalized Category Discovery
- arxiv url: http://arxiv.org/abs/2201.02609v1
- Date: Fri, 7 Jan 2022 18:58:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-10 14:42:58.232848
- Title: Generalized Category Discovery
- Title(参考訳): 一般カテゴリー発見
- Authors: Sagar Vaze, Kai Han, Andrea Vedaldi, Andrew Zisserman
- Abstract要約: 本稿では,ラベル付き画像集合とラベル付き画像集合とを併用した画像認識手法を提案する。
ここでは、未表示の画像はラベル付きクラスから、あるいは新しいものから来ているかもしれない。
まず、新しいカテゴリー発見から最先端のアルゴリズムを取り入れ、そのタスクに適応することで、強力なベースラインを確立する。
次に、単純だが効果的な半教師付き$k$-meansメソッドを導入する。
- 参考スコア(独自算出の注目度): 148.32255950504182
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we consider a highly general image recognition setting
wherein, given a labelled and unlabelled set of images, the task is to
categorize all images in the unlabelled set. Here, the unlabelled images may
come from labelled classes or from novel ones. Existing recognition methods are
not able to deal with this setting, because they make several restrictive
assumptions, such as the unlabelled instances only coming from known - or
unknown - classes and the number of unknown classes being known a-priori. We
address the more unconstrained setting, naming it 'Generalized Category
Discovery', and challenge all these assumptions. We first establish strong
baselines by taking state-of-the-art algorithms from novel category discovery
and adapting them for this task. Next, we propose the use of vision
transformers with contrastive representation learning for this open world
setting. We then introduce a simple yet effective semi-supervised $k$-means
method to cluster the unlabelled data into seen and unseen classes
automatically, substantially outperforming the baselines. Finally, we also
propose a new approach to estimate the number of classes in the unlabelled
data. We thoroughly evaluate our approach on public datasets for generic object
classification including CIFAR10, CIFAR100 and ImageNet-100, and for
fine-grained visual recognition including CUB, Stanford Cars and Herbarium19,
benchmarking on this new setting to foster future research.
- Abstract(参考訳): 本稿では,ラベル付きかつラベル付きでない画像集合が与えられた場合,ラベルなし集合内のすべての画像の分類が課題となる,非常に一般的な画像認識設定を考える。
ここで、ラベルのない画像はラベル付きクラスか、新しいものから来ます。
既存の認識方法は、既知の-または未知の-クラスからのみ来る、未知のクラスがa-prioriとして知られているなど、いくつかの制約のある仮定を行うため、この設定に対処できない。
制約のない設定に対処し、"Generalized Category Discovery"と命名し、これらすべての前提に挑戦します。
まず,新たなカテゴリ発見から最先端のアルゴリズムを取り出して,そのタスクに適応させることで,強力なベースラインを確立する。
次に,このオープンワールド設定に対して,コントラスト表現学習を用いた視覚変換器を提案する。
次に、単純だが効果的な半教師付き$k$-meansメソッドを導入し、不正なデータを自動的に見知らぬクラスにクラスタリングし、ベースラインを大幅に上回る。
最後に,非競合データにおけるクラス数を推定する新しい手法を提案する。
我々は、CIFAR10、CIFAR100、ImageNet-100を含む汎用オブジェクト分類のためのパブリックデータセットと、CUB、Stanford Cars、Herbarium19を含むきめ細かい視覚認識のためのアプローチを徹底的に評価し、今後の研究を促進するためにこの設定をベンチマークした。
関連論文リスト
- Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Learning Semi-supervised Gaussian Mixture Models for Generalized
Category Discovery [36.01459228175808]
本稿では,表現学習とクラス数推定を交互に行うEMライクなフレームワークを提案する。
汎用画像分類データセットと細粒度オブジェクト認識データセットの双方について,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2023-05-10T13:47:38Z) - XCon: Learning with Experts for Fine-grained Category Discovery [4.787507865427207]
本稿では,XCon(Expert-Contrastive Learning)と呼ばれる新しい手法を提案する。
細粒度データセットを用いた実験では,従来の最適手法よりも明らかに改善された性能を示し,本手法の有効性を示した。
論文 参考訳(メタデータ) (2022-08-03T08:03:12Z) - Few-shot Open-set Recognition Using Background as Unknowns [58.04165813493666]
未使用のオープンセット認識は、見知らぬクラスの限られた訓練データしか持たない、目に見える画像と新しい画像の両方を分類することを目的としている。
提案手法は,複数のベースラインより優れるだけでなく,3つのベンチマークで新たな結果が得られた。
論文 参考訳(メタデータ) (2022-07-19T04:19:29Z) - AutoNovel: Automatically Discovering and Learning Novel Visual
Categories [138.80332861066287]
本稿では,他のクラスをラベル付けしたイメージコレクションにおける新しいクラス発見問題に対処するため,AutoNovelと呼ばれる新しいアプローチを提案する。
我々はAutoNovelを標準分類ベンチマークで評価し、新しいカテゴリー発見の手法をかなり上回っている。
論文 参考訳(メタデータ) (2021-06-29T11:12:16Z) - SCAN: Learning to Classify Images without Labels [73.69513783788622]
機能学習とクラスタリングを分離する2段階のアプローチを提唱する。
表現学習からの自己教師型タスクを用いて意味論的意味のある特徴を得る。
我々は、ImageNet上で有望な結果を得、低データ体制下では、いくつかの半教師付き学習方法より優れています。
論文 参考訳(メタデータ) (2020-05-25T18:12:33Z) - Automatically Discovering and Learning New Visual Categories with
Ranking Statistics [145.89790963544314]
我々は,他のクラスをラベル付けした画像コレクションにおいて,新しいクラスを発見する問題に対処する。
汎用クラスタリングモデルを学び、後者を用いて、非競合データ中の新しいクラスを識別する。
我々は,標準分類ベンチマークに対するアプローチと,新しいカテゴリー発見法の性能を,有意なマージンで評価した。
論文 参考訳(メタデータ) (2020-02-13T18:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。