論文の概要: Active Generalized Category Discovery
- arxiv url: http://arxiv.org/abs/2403.04272v1
- Date: Thu, 7 Mar 2024 07:12:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 14:56:52.374325
- Title: Active Generalized Category Discovery
- Title(参考訳): アクティブな一般化カテゴリー発見
- Authors: Shijie Ma, Fei Zhu, Zhun Zhong, Xu-Yao Zhang, Cheng-Lin Liu
- Abstract要約: GCD(Generalized Category Discovery)は、新しいクラスと古いクラスの未ラベルのサンプルをクラスタ化するための取り組みである。
我々は,能動的学習の精神を取り入れて,能動的一般化カテゴリー発見(AGCD)という新たな設定を提案する。
提案手法は, 汎用および微粒なデータセット上での最先端性能を実現する。
- 参考スコア(独自算出の注目度): 60.69060965936214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalized Category Discovery (GCD) is a pragmatic and challenging
open-world task, which endeavors to cluster unlabeled samples from both novel
and old classes, leveraging some labeled data of old classes. Given that
knowledge learned from old classes is not fully transferable to new classes,
and that novel categories are fully unlabeled, GCD inherently faces intractable
problems, including imbalanced classification performance and inconsistent
confidence between old and new classes, especially in the low-labeling regime.
Hence, some annotations of new classes are deemed necessary. However, labeling
new classes is extremely costly. To address this issue, we take the spirit of
active learning and propose a new setting called Active Generalized Category
Discovery (AGCD). The goal is to improve the performance of GCD by actively
selecting a limited amount of valuable samples for labeling from the oracle. To
solve this problem, we devise an adaptive sampling strategy, which jointly
considers novelty, informativeness and diversity to adaptively select novel
samples with proper uncertainty. However, owing to the varied orderings of
label indices caused by the clustering of novel classes, the queried labels are
not directly applicable to subsequent training. To overcome this issue, we
further propose a stable label mapping algorithm that transforms ground truth
labels to the label space of the classifier, thereby ensuring consistent
training across different active selection stages. Our method achieves
state-of-the-art performance on both generic and fine-grained datasets. Our
code is available at https://github.com/mashijie1028/ActiveGCD
- Abstract(参考訳): Generalized Category Discovery (GCD)は、新しいクラスと古いクラスの両方からラベルなしのサンプルをクラスタリングし、古いクラスのラベル付きデータを活用する、実用的で挑戦的なオープンワールドタスクである。
古いクラスから学んだ知識が新しいクラスに完全に移行できないことや、新しいカテゴリが完全にラベル付けされていないことを考えると、gcdは本質的に不均衡な分類性能や古いクラスと新しいクラスの間の一貫性の欠如といった難題に直面している。
そのため、新しいクラスのアノテーションが必要になる。
しかし、新しいクラスのラベル付けは非常にコストがかかる。
この問題に対処するために,我々はアクティブラーニングの精神を取り入れ,active generalized category discovery (agcd) と呼ばれる新しい設定を提案する。
目的は、オラクルからラベル付けするための貴重なサンプルを限定的に選択することで、GCDの性能を向上させることである。
そこで本研究では,新規性,情報性,多様性を共同で考慮し,適切な不確実性を有する新規標本を適応的に選択する適応サンプリング戦略を考案する。
しかし,新クラスのクラスタリングによるラベル表示の順序の多様性から,クエリされたラベルはその後のトレーニングには直接適用されない。
この問題を克服するため,本研究では,基底真理ラベルを分類器のラベル空間に変換する安定なラベルマッピングアルゴリズムを提案する。
提案手法は,汎用および微細なデータセット上での最先端性能を実現する。
私たちのコードはhttps://github.com/mashijie1028/ActiveGCDで利用可能です。
関連論文リスト
- Happy: A Debiased Learning Framework for Continual Generalized Category Discovery [54.54153155039062]
本稿では,C-GCD(Continuous Generalized Category Discovery)の未探索課題について考察する。
C-GCDは、学習済みのクラスを認識する能力を維持しながら、ラベルのないデータから新しいクラスを漸進的に発見することを目的としている。
本稿では,ハードネスを意識したプロトタイプサンプリングとソフトエントロピー正規化を特徴とする,偏りのある学習フレームワークであるHappyを紹介する。
論文 参考訳(メタデータ) (2024-10-09T04:18:51Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Novel Class Discovery for Long-tailed Recognition [17.464885951359047]
我々は,新しいクラスと既知のクラスの分布が長い尾を持つ,新しいクラス発見のためのより現実的な設定を考える。
この問題に対処するために,クラスを等角的に表現した適応型自己ラベル方式を提案する。
本手法は, 緩和された最適輸送問題の解法により, 新たなクラスに対して高品質な擬似ラベルを推論する。
論文 参考訳(メタデータ) (2023-08-06T02:15:19Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - TagRec++: Hierarchical Label Aware Attention Network for Question
Categorization [0.3683202928838613]
オンライン学習システムは、階層的な性質の明確に定義された分類に従ってコンテンツを整理する。
階層ラベルへの入力を分類するタスクは通常、フラットな多クラス分類問題として扱われる。
各コンテンツに対して適切な階層ラベルを検索するために,タスクを高密度検索問題として定式化する。
論文 参考訳(メタデータ) (2022-08-10T05:08:37Z) - A Unified Objective for Novel Class Discovery [48.1003877511578]
新たなクラスを発見するための統一目的関数(UNO)を導入する。
UNOは教師なし学習と教師なし学習の相乗効果を好んでいる。
その単純さにもかかわらず、UNOはいくつかのベンチマークで最先端の技術を誇っている。
論文 参考訳(メタデータ) (2021-08-19T07:22:29Z) - A Closer Look at Self-training for Zero-Label Semantic Segmentation [53.4488444382874]
トレーニング中に見られないクラスをセグメント化できることは、ディープラーニングにおいて重要な技術的課題です。
事前のゼロラベルセマンティクスセグメンテーションは、ビジュアル・セマンティクスの埋め込みや生成モデルを学ぶことによってこのタスクにアプローチする。
本研究では,同一画像の異なる増分から生じる擬似ラベルの交点を取り出し,ノイズの多い擬似ラベルをフィルタリングする整合性正規化器を提案する。
論文 参考訳(メタデータ) (2021-04-21T14:34:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。