論文の概要: A Simple Parametric Classification Baseline for Generalized Category
Discovery
- arxiv url: http://arxiv.org/abs/2211.11727v1
- Date: Mon, 21 Nov 2022 18:47:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 18:55:26.159500
- Title: A Simple Parametric Classification Baseline for Generalized Category
Discovery
- Title(参考訳): 一般化カテゴリー発見のための簡易パラメトリック分類基準
- Authors: Xin Wen, Bingchen Zhao, Xiaojuan Qi
- Abstract要約: 一般化カテゴリ発見(GCD)は、未ラベルデータセット内で新しいカテゴリを発見することを目標とする問題設定である。
GCDの最近の研究は、半教師付き$k$-meansで形成された非パラメトリック分類器は強い基底線より優れていると主張している。
本稿では,従来のパラメトリック分類器がGCDの新しいクラスを認識できない理由を再考する。
- 参考スコア(独自算出の注目度): 51.09356006473245
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalized category discovery (GCD) is a problem setting where the goal is
to discover novel categories within an unlabelled dataset using the knowledge
learned from a set of labelled samples. Recent works in GCD argue that a
non-parametric classifier formed using semi-supervised $k$-means can outperform
strong baselines which use parametric classifiers as it can alleviate the
over-fitting to seen categories in the labelled set. In this paper, we revisit
the reason that makes previous parametric classifiers fail to recognise new
classes for GCD. By investigating the design choices of parametric classifiers
from the perspective of model architecture, representation learning, and
classifier learning, we conclude that the less discriminative representations
and unreliable pseudo-labelling strategy are key factors that make parametric
classifiers lag behind non-parametric ones. Motivated by our investigation, we
present a simple yet effective parametric classification baseline that
outperforms the previous best methods by a large margin on multiple popular GCD
benchmarks. We hope the investigations and the simple baseline can serve as a
cornerstone to facilitate future studies. Our code is available at:
https://github.com/CVMI-Lab/SimGCD.
- Abstract(参考訳): 一般化カテゴリ発見(GCD)は、ラベル付きサンプルの集合から学習した知識を用いて、ラベル付きデータセット内で新しいカテゴリを発見することを目的とする問題である。
gcdの最近の研究によると、半教師付き$k$-meansで形成された非パラメトリック分類器は、ラベル付き集合で見られるカテゴリへの過剰適合を緩和できるため、パラメトリック分類器を使用する強力なベースラインを上回ることができる。
本稿では,従来のパラメトリック分類器がGCDの新しいクラスを認識できない理由を再考する。
モデルアーキテクチャ,表現学習,分類器学習の観点から,パラメトリック分類器の設計選択を検討することにより,識別性の低い表現と信頼できない擬似ラベリング戦略が,非パラメトリック分類器に遅れを生じさせる重要な要因であると結論付ける。
本研究の動機として,複数のGCDベンチマークにおいて,従来のベストメソッドよりも高い性能を示す簡易かつ効果的なパラメトリック分類基準を提案する。
我々は、調査と単純なベースラインが将来の研究を促進するための基礎となることを望んでいる。
私たちのコードは、https://github.com/CVMI-Lab/SimGCDで利用可能です。
関連論文リスト
- Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - When in Doubt: Improving Classification Performance with Alternating
Normalization [57.39356691967766]
分類のための非パラメトリック後処理ステップである交互正規化(CAN)を用いた分類を導入する。
CANは、予測されたクラス確率分布を再調整することで、挑戦的な例の分類精度を向上させる。
多様な分類課題にまたがってその効果を実証的に示す。
論文 参考訳(メタデータ) (2021-09-28T02:55:42Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z) - Unbiased Subdata Selection for Fair Classification: A Unified Framework
and Scalable Algorithms [0.8376091455761261]
このフレームワーク内の多くの分類モデルが混合整数凸プログラムとして再キャストできることを示した。
そして,提案問題において,分類結果の「解決不能な部分データ選択」が強く解決可能であることを示す。
これにより、分類インスタンスを解決するための反復精錬戦略(IRS)の開発を動機付けます。
論文 参考訳(メタデータ) (2020-12-22T21:09:38Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Predicting Classification Accuracy When Adding New Unobserved Classes [8.325327265120283]
そこで本研究では,より大規模で未観測のクラスに対して,期待する精度を推定するために,分類器の性能をどのように利用することができるかを検討する。
ニューラルネットワークに基づく頑健なアルゴリズム "CleaneX" を定式化し,任意のサイズのクラスに対して,そのような分類器の精度を推定する。
論文 参考訳(メタデータ) (2020-10-28T14:37:25Z) - Interpretable Sequence Classification via Discrete Optimization [26.899228003677138]
医療監視や侵入検知といった多くの応用において、早期分類は介入を促すために不可欠である。
本研究では、進化する観測トレースから早期分類を好む配列分類器を学習する。
我々の分類器は解釈可能であり, 説明, 反実的推論, 人為的ループ修正を行う。
論文 参考訳(メタデータ) (2020-10-06T15:31:07Z) - Classifier uncertainty: evidence, potential impact, and probabilistic
treatment [0.0]
本稿では,混乱行列の確率モデルに基づいて,分類性能指標の不確かさを定量化する手法を提案する。
我々は、不確実性は驚くほど大きく、性能評価を制限できることを示した。
論文 参考訳(メタデータ) (2020-06-19T12:49:19Z) - Certified Robustness to Label-Flipping Attacks via Randomized Smoothing [105.91827623768724]
機械学習アルゴリズムは、データ中毒攻撃の影響を受けやすい。
任意の関数に対するランダム化スムージングの統一的なビューを示す。
本稿では,一般的なデータ中毒攻撃に対して,ポイントワイズで確実に堅牢な分類器を構築するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2020-02-07T21:28:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。