論文の概要: Learning Semi-supervised Gaussian Mixture Models for Generalized
Category Discovery
- arxiv url: http://arxiv.org/abs/2305.06144v2
- Date: Thu, 17 Aug 2023 14:12:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 23:58:35.479861
- Title: Learning Semi-supervised Gaussian Mixture Models for Generalized
Category Discovery
- Title(参考訳): 一般カテゴリー発見のための半教師付きガウス混合モデルの学習
- Authors: Bingchen Zhao, Xin Wen, Kai Han
- Abstract要約: 本稿では,表現学習とクラス数推定を交互に行うEMライクなフレームワークを提案する。
汎用画像分類データセットと細粒度オブジェクト認識データセットの双方について,本フレームワークの評価を行った。
- 参考スコア(独自算出の注目度): 36.01459228175808
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address the problem of generalized category discovery
(GCD), \ie, given a set of images where part of them are labelled and the rest
are not, the task is to automatically cluster the images in the unlabelled
data, leveraging the information from the labelled data, while the unlabelled
data contain images from the labelled classes and also new ones. GCD is similar
to semi-supervised learning (SSL) but is more realistic and challenging, as SSL
assumes all the unlabelled images are from the same classes as the labelled
ones. We also do not assume the class number in the unlabelled data is known
a-priori, making the GCD problem even harder. To tackle the problem of GCD
without knowing the class number, we propose an EM-like framework that
alternates between representation learning and class number estimation. We
propose a semi-supervised variant of the Gaussian Mixture Model (GMM) with a
stochastic splitting and merging mechanism to dynamically determine the
prototypes by examining the cluster compactness and separability. With these
prototypes, we leverage prototypical contrastive learning for representation
learning on the partially labelled data subject to the constraints imposed by
the labelled data. Our framework alternates between these two steps until
convergence. The cluster assignment for an unlabelled instance can then be
retrieved by identifying its nearest prototype. We comprehensively evaluate our
framework on both generic image classification datasets and challenging
fine-grained object recognition datasets, achieving state-of-the-art
performance.
- Abstract(参考訳): 本稿では,ラベル付きデータからの情報を活用しつつ,ラベル付きデータの一部がラベル付きで残りが存在しない画像群に対して,ラベル付きデータがラベル付きデータからのイメージを含む場合,ラベル付きデータ群がラベル付きデータ群とラベル付きデータ群を自動クラスタ化する問題に対処する。
GCDは半教師付き学習(SSL)に似ているが、SSLはラベル付き画像と同じクラスに属すると仮定しているため、より現実的で難しい。
また、未ラベルデータのクラス番号が a-priori であるとは仮定せず、GCD 問題をさらに困難にしている。
クラス番号を知らずにGCDの問題に取り組むために,表現学習とクラス数推定を交互に行うEMライクなフレームワークを提案する。
本稿では,ガウス混合モデル(GMM)の半教師付き変種について,クラスタのコンパクト性と分離性を調べてプロトタイプを動的に決定する確率分割・マージ機構を提案する。
これらのプロトタイプでは,ラベル付きデータの制約を受ける部分ラベル付きデータに対する表現学習に,原型的コントラスト学習を利用する。
我々の枠組みは収束するまでこの2つのステップを交互に行う。
エラーのないインスタンスのクラスタ割り当ては、最も近いプロトタイプを識別することで検索できる。
汎用画像分類データセットと細粒度オブジェクト認識データセットの両方に関する枠組みを網羅的に評価し、最先端の性能を達成する。
関連論文リスト
- Contrastive Mean-Shift Learning for Generalized Category Discovery [45.19923199324919]
一般化圏発見(GCD)の問題に対処する。
我々は平均シフトアルゴリズム、すなわちモード探索のための強力な手法を再検討し、これを対照的な学習フレームワークに組み込む。
提案手法はContrastive Mean-Shift(CMS)学習と呼ばれ,より優れたクラスタリング特性を持つ表現を生成するためにイメージエンコーダを訓練する。
論文 参考訳(メタデータ) (2024-04-15T04:31:24Z) - No Representation Rules Them All in Category Discovery [115.53747187400626]
一般化カテゴリー発見(GCD)の課題に取り組む
ラベル付きおよびアンラベル画像のデータセットが与えられた場合、そのタスクはすべての画像をアンラベル画像のサブセットにまとめることである。
カテゴリー発見のための合成データセット「Clevr-4」を提案する。
論文 参考訳(メタデータ) (2023-11-28T18:59:46Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - CiPR: An Efficient Framework with Cross-instance Positive Relations for Generalized Category Discovery [21.380021266251426]
一般化圏発見(GCD)は、部分的にラベル付けされたデータセットを自動的にクラスタリングするオープンワールドの問題を考える。
本稿では,非競合データに対する未知のカテゴリ数を用いて,GCD問題に対処する。
我々はCiPRというフレームワークを提案し、クロスインスタンスポジティヴリレーションを利用して表現をブートストラップする。
論文 参考訳(メタデータ) (2023-04-14T05:25:52Z) - AutoNovel: Automatically Discovering and Learning Novel Visual
Categories [138.80332861066287]
本稿では,他のクラスをラベル付けしたイメージコレクションにおける新しいクラス発見問題に対処するため,AutoNovelと呼ばれる新しいアプローチを提案する。
我々はAutoNovelを標準分類ベンチマークで評価し、新しいカテゴリー発見の手法をかなり上回っている。
論文 参考訳(メタデータ) (2021-06-29T11:12:16Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - Unsupervised Person Re-identification via Softened Similarity Learning [122.70472387837542]
人物再識別(re-ID)はコンピュータビジョンにおいて重要なトピックである。
本稿では,ラベル付き情報を必要としないre-IDの教師なし設定について検討する。
2つの画像ベースおよびビデオベースデータセットの実験は、最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-04-07T17:16:41Z) - Automatically Discovering and Learning New Visual Categories with
Ranking Statistics [145.89790963544314]
我々は,他のクラスをラベル付けした画像コレクションにおいて,新しいクラスを発見する問題に対処する。
汎用クラスタリングモデルを学び、後者を用いて、非競合データ中の新しいクラスを識別する。
我々は,標準分類ベンチマークに対するアプローチと,新しいカテゴリー発見法の性能を,有意なマージンで評価した。
論文 参考訳(メタデータ) (2020-02-13T18:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。