論文の概要: A Practical Approach to Novel Class Discovery in Tabular Data
- arxiv url: http://arxiv.org/abs/2311.05440v1
- Date: Thu, 9 Nov 2023 15:24:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-10 14:52:08.133837
- Title: A Practical Approach to Novel Class Discovery in Tabular Data
- Title(参考訳): 表データにおける新しいクラス発見への実践的アプローチ
- Authors: Colin Troisemaine, Alexandre Reiffers-Masson, St\'ephane Gosselin,
Vincent Lemaire, Sandrine Vaton
- Abstract要約: 新規クラスディスカバリー(英: Novel Class Discovery, NCD)は、未知のクラスを正確に分割するために、ラベル付けされた既知のクラスの集合から知識を抽出する問題である。
本研究では、$k$-foldのクロスバリデーションプロセスを適用し、既知のクラスの一部を各フォルダに隠すことで、NCDメソッドのハイパーパラメータを調整することを提案する。
この手法の潜在空間は,新規クラスの数を確実に推定するために有効であることがわかった。
- 参考スコア(独自算出の注目度): 40.34185280098731
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The problem of Novel Class Discovery (NCD) consists in extracting knowledge
from a labeled set of known classes to accurately partition an unlabeled set of
novel classes. While NCD has recently received a lot of attention from the
community, it is often solved on computer vision problems and under unrealistic
conditions. In particular, the number of novel classes is usually assumed to be
known in advance, and their labels are sometimes used to tune hyperparameters.
Methods that rely on these assumptions are not applicable in real-world
scenarios. In this work, we focus on solving NCD in tabular data when no prior
knowledge of the novel classes is available. To this end, we propose to tune
the hyperparameters of NCD methods by adapting the $k$-fold cross-validation
process and hiding some of the known classes in each fold. Since we have found
that methods with too many hyperparameters are likely to overfit these hidden
classes, we define a simple deep NCD model. This method is composed of only the
essential elements necessary for the NCD problem and performs impressively well
under realistic conditions. Furthermore, we find that the latent space of this
method can be used to reliably estimate the number of novel classes.
Additionally, we adapt two unsupervised clustering algorithms ($k$-means and
Spectral Clustering) to leverage the knowledge of the known classes. Extensive
experiments are conducted on 7 tabular datasets and demonstrate the
effectiveness of the proposed method and hyperparameter tuning process, and
show that the NCD problem can be solved without relying on knowledge from the
novel classes.
- Abstract(参考訳): 新規クラス発見(ncd)の問題は、既知のクラスのラベル付き集合から知識を抽出して、ラベルのない新しいクラスの集合を正確に分割することである。
ncdは最近コミュニティから多くの注目を集めているが、コンピュータビジョンの問題や非現実的な状況下でしばしば解決されている。
特に、新しいクラスの数は通常事前に知られており、そのラベルは時折ハイパーパラメータをチューニングするために使われる。
これらの仮定に依存する手法は現実のシナリオでは適用できない。
本研究は,新規クラスの事前知識が得られない場合の表データによるncdの解決に焦点をあてる。
この目的のために,$k$-fold のクロスバリデーションプロセスを適用し,既知のクラスを各フォールドに隠して ncd メソッドのハイパーパラメータを調整することを提案する。
過パラメータが多すぎるメソッドがこれらの隠れクラスに過度に適合することを発見したので、単純な深いNCDモデルを定義する。
本手法は, NCD問題に必要な必須要素のみで構成され, 現実的な条件下では優れた性能を発揮する。
さらに,本手法の潜在空間を用いて,新規クラスの数を確実に推定できることを見いだした。
さらに、既知のクラスの知識を活用するために、2つの教師なしクラスタリングアルゴリズム(k$-meansとSpectral Clustering)を適用する。
7つの表型データセットについて広範な実験を行い,提案手法とハイパーパラメータチューニングプロセスの有効性を実証し,新しいクラスからの知識を頼らずにncd問題を解決できることを示した。
関連論文リスト
- Happy: A Debiased Learning Framework for Continual Generalized Category Discovery [54.54153155039062]
本稿では,C-GCD(Continuous Generalized Category Discovery)の未探索課題について考察する。
C-GCDは、学習済みのクラスを認識する能力を維持しながら、ラベルのないデータから新しいクラスを漸進的に発見することを目的としている。
本稿では,ハードネスを意識したプロトタイプサンプリングとソフトエントロピー正規化を特徴とする,偏りのある学習フレームワークであるHappyを紹介する。
論文 参考訳(メタデータ) (2024-10-09T04:18:51Z) - When and How Does Known Class Help Discover Unknown Ones? Provable
Understanding Through Spectral Analysis [35.57142091571271]
新規クラス発見 (NCD) は、既知のクラスを持つラベル付きセットからの事前知識を活用することにより、ラベルなしセットで新しいクラスを推論することを目的としている。
本稿では, クラスがいつ, どのようにして新しいクラスを発見できるかを定式化し, 研究するための分析フレームワークを提供することで, ギャップを埋める。
論文 参考訳(メタデータ) (2023-08-09T15:27:21Z) - An Interactive Interface for Novel Class Discovery in Tabular Data [54.11148718494725]
新規クラスディスカバリー(英: Novel Class Discovery、NCD)とは、異なるクラスがラベル付けされていることを考慮し、ラベル付けされていないセットで新しいクラスを発見しようとする問題である。
現在提案されているNCD法の大部分は画像データにのみ対応している。
このインターフェースにより、ドメインの専門家は表データでNCDのための最先端のアルゴリズムを簡単に実行することができる。
論文 参考訳(メタデータ) (2023-06-22T14:32:53Z) - NEV-NCD: Negative Learning, Entropy, and Variance regularization based
novel action categories discovery [23.17093125627668]
新たなカテゴリディスカバリ(NCD)は、部分的にアノテートされたラベル空間からの学習を容易にする。
そこで我々は,新しい一段階共同最適化型NCD法,負学習,エントロピー,分散正規化NCDを提案する。
ビデオ行動認識のNCD応用におけるNEV-NCDの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-14T19:20:26Z) - Large-scale Pre-trained Models are Surprisingly Strong in Incremental Novel Class Discovery [76.63807209414789]
我々は,クラスiNCDにおける現状問題に挑戦し,クラス発見を継続的に,真に教師なしで行う学習パラダイムを提案する。
凍結したPTMバックボーンと学習可能な線形分類器から構成される単純なベースラインを提案する。
論文 参考訳(メタデータ) (2023-03-28T13:47:16Z) - D\'ecouvrir de nouvelles classes dans des donn\'ees tabulaires [54.11148718494725]
Novel Class Discovery (NCD) において、ゴールは、既知のクラスと異なるクラスのラベル付きセットが与えられたラベルのないセットで新しいクラスを見つけることである。
異種データにおける新しいクラスの発見過程を導くために,すでに知られているクラスから知識を抽出する方法を示す。
論文 参考訳(メタデータ) (2022-11-28T09:48:55Z) - A Method for Discovering Novel Classes in Tabular Data [54.11148718494725]
Novel Class Discovery (NCD) において、ゴールは、既知のクラスと異なるクラスのラベル付きセットが与えられたラベルのないセットで新しいクラスを見つけることである。
異種データにおける新しいクラスの発見過程を導くために,すでに知られているクラスから知識を抽出する方法を示す。
論文 参考訳(メタデータ) (2022-09-02T11:45:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。