論文の概要: No Representation Rules Them All in Category Discovery
- arxiv url: http://arxiv.org/abs/2311.17055v1
- Date: Tue, 28 Nov 2023 18:59:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-29 17:00:47.229391
- Title: No Representation Rules Them All in Category Discovery
- Title(参考訳): カテゴリー発見のための表現規則はない
- Authors: Sagar Vaze, Andrea Vedaldi, Andrew Zisserman
- Abstract要約: 一般化カテゴリー発見(GCD)の課題に取り組む
ラベル付きおよびアンラベル画像のデータセットが与えられた場合、そのタスクはすべての画像をアンラベル画像のサブセットにまとめることである。
カテゴリー発見のための合成データセット「Clevr-4」を提案する。
- 参考スコア(独自算出の注目度): 115.53747187400626
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we tackle the problem of Generalized Category Discovery (GCD).
Specifically, given a dataset with labelled and unlabelled images, the task is
to cluster all images in the unlabelled subset, whether or not they belong to
the labelled categories. Our first contribution is to recognize that most
existing GCD benchmarks only contain labels for a single clustering of the
data, making it difficult to ascertain whether models are using the available
labels to solve the GCD task, or simply solving an unsupervised clustering
problem. As such, we present a synthetic dataset, named 'Clevr-4', for category
discovery. Clevr-4 contains four equally valid partitions of the data, i.e
based on object shape, texture, color or count. To solve the task, models are
required to extrapolate the taxonomy specified by the labelled set, rather than
simply latching onto a single natural grouping of the data. We use this dataset
to demonstrate the limitations of unsupervised clustering in the GCD setting,
showing that even very strong unsupervised models fail on Clevr-4. We further
use Clevr-4 to examine the weaknesses of existing GCD algorithms, and propose a
new method which addresses these shortcomings, leveraging consistent findings
from the representation learning literature to do so. Our simple solution,
which is based on 'mean teachers' and termed $\mu$GCD, substantially
outperforms implemented baselines on Clevr-4. Finally, when we transfer these
findings to real data on the challenging Semantic Shift Benchmark (SSB), we
find that $\mu$GCD outperforms all prior work, setting a new state-of-the-art.
For the project webpage, see https://www.robots.ox.ac.uk/~vgg/data/clevr4/
- Abstract(参考訳): 本稿では,一般カテゴリー発見 (Generalized Category Discovery, GCD) の問題に取り組む。
具体的には、ラベル付きおよびラベルなしのイメージを持つデータセットが与えられた場合、ラベルなしのサブセット内のすべてのイメージを、ラベル付きカテゴリに属するかどうかに関わらずクラスタ化する。
我々の最初の貢献は、既存のGCDベンチマークのほとんどがデータの単一のクラスタリングのためのラベルのみを含んでいることを認識し、モデルがGCDタスクの解決に利用可能なラベルを使用しているか、あるいは教師なしクラスタリングの問題を単に解決しているかを確認するのが困難であることです。
そこで我々は,カテゴリー発見のための合成データセット「Clevr-4」を提案する。
Clevr-4は、オブジェクトの形状、テクスチャ、色、カウントに基づいて、データの4つの等価なパーティションを含む。
この課題を解決するために、モデルは単にデータの1つの自然なグループ化にこだわるのではなく、ラベル付き集合によって指定された分類を外挿する必要がある。
我々はこのデータセットを用いて、GCD設定における教師なしクラスタリングの限界を実証し、非常に強力な教師なしモデルでさえClevr-4で失敗することを示した。
さらに,既存のgcdアルゴリズムの弱点を調べるためにclevr-4を用いて,表現学習文献からの一貫した知見を活かし,これらの欠点に対処する新しい手法を提案する。
私たちの単純なソリューションは'平均教師'に基づいており、$\mu$gcdと呼ばれ、clevr-4で実装されたベースラインを実質的に上回っています。
最後に、これらの調査結果をチャレンジス・セマンティクス・シフト・ベンチマーク(ssb)の実際のデータに転送すると、$\mu$gcd は以前のすべての作業よりも優れており、新たな最先端を設定することができる。
プロジェクトのwebページはhttps://www.robots.ox.ac.uk/~vgg/data/clevr4/を参照。
関連論文リスト
- Active Generalized Category Discovery [60.69060965936214]
GCD(Generalized Category Discovery)は、新しいクラスと古いクラスの未ラベルのサンプルをクラスタ化するための取り組みである。
我々は,能動的学習の精神を取り入れて,能動的一般化カテゴリー発見(AGCD)という新たな設定を提案する。
提案手法は, 汎用および微粒なデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-07T07:12:24Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Learning Semi-supervised Gaussian Mixture Models for Generalized
Category Discovery [36.01459228175808]
本稿では,表現学習とクラス数推定を交互に行うEMライクなフレームワークを提案する。
汎用画像分類データセットと細粒度オブジェクト認識データセットの双方について,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2023-05-10T13:47:38Z) - Incremental Generalized Category Discovery [26.028970894707204]
インクリメンタル一般化カテゴリー発見(IGCD)の課題を探る
これは、以前に見られたカテゴリから画像を正しく分類できるモデルを開発することを目的としている、挑戦的なカテゴリインクリメンタルな学習環境である。
本稿では,非パラメトリック分類と効率的な画像サンプリングを組み合わせたIGCDの新しい手法を提案する。
論文 参考訳(メタデータ) (2023-04-27T16:27:11Z) - CiPR: An Efficient Framework with Cross-instance Positive Relations for Generalized Category Discovery [21.380021266251426]
一般化圏発見(GCD)は、部分的にラベル付けされたデータセットを自動的にクラスタリングするオープンワールドの問題を考える。
本稿では,非競合データに対する未知のカテゴリ数を用いて,GCD問題に対処する。
我々はCiPRというフレームワークを提案し、クロスインスタンスポジティヴリレーションを利用して表現をブートストラップする。
論文 参考訳(メタデータ) (2023-04-14T05:25:52Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Automatically Discovering and Learning New Visual Categories with
Ranking Statistics [145.89790963544314]
我々は,他のクラスをラベル付けした画像コレクションにおいて,新しいクラスを発見する問題に対処する。
汎用クラスタリングモデルを学び、後者を用いて、非競合データ中の新しいクラスを識別する。
我々は,標準分類ベンチマークに対するアプローチと,新しいカテゴリー発見法の性能を,有意なマージンで評価した。
論文 参考訳(メタデータ) (2020-02-13T18:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。