論文の概要: A Practical Approach to Novel Class Discovery in Tabular Data
- arxiv url: http://arxiv.org/abs/2311.05440v3
- Date: Mon, 3 Jun 2024 08:49:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-04 20:31:18.098804
- Title: A Practical Approach to Novel Class Discovery in Tabular Data
- Title(参考訳): 語彙データにおける新しいクラス発見への実践的アプローチ
- Authors: Colin Troisemaine, Alexandre Reiffers-Masson, Stéphane Gosselin, Vincent Lemaire, Sandrine Vaton,
- Abstract要約: 新規クラスディスカバリー(英: Novel Class Discovery, NCD)は、未知のクラスを正確に分割するために、ラベル付けされた既知のクラスの集合から知識を抽出する問題である。
本研究では、$k$-foldのクロスバリデーションプロセスを適用し、既知のクラスの一部を各フォルダに隠すことで、NCDメソッドのハイパーパラメータを調整することを提案する。
この手法の潜在空間は,新規クラスの数を確実に推定するために有効であることがわかった。
- 参考スコア(独自算出の注目度): 38.41548083078336
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The problem of Novel Class Discovery (NCD) consists in extracting knowledge from a labeled set of known classes to accurately partition an unlabeled set of novel classes. While NCD has recently received a lot of attention from the community, it is often solved on computer vision problems and under unrealistic conditions. In particular, the number of novel classes is usually assumed to be known in advance, and their labels are sometimes used to tune hyperparameters. Methods that rely on these assumptions are not applicable in real-world scenarios. In this work, we focus on solving NCD in tabular data when no prior knowledge of the novel classes is available. To this end, we propose to tune the hyperparameters of NCD methods by adapting the $k$-fold cross-validation process and hiding some of the known classes in each fold. Since we have found that methods with too many hyperparameters are likely to overfit these hidden classes, we define a simple deep NCD model. This method is composed of only the essential elements necessary for the NCD problem and performs impressively well under realistic conditions. Furthermore, we find that the latent space of this method can be used to reliably estimate the number of novel classes. Additionally, we adapt two unsupervised clustering algorithms ($k$-means and Spectral Clustering) to leverage the knowledge of the known classes. Extensive experiments are conducted on 7 tabular datasets and demonstrate the effectiveness of the proposed method and hyperparameter tuning process, and show that the NCD problem can be solved without relying on knowledge from the novel classes.
- Abstract(参考訳): 新規クラス発見(NCD)の問題は、ラベル付けされた既知のクラスの集合から知識を抽出して、ラベル付けされていない新しいクラスの集合を正確に分割することにある。
NCDは最近、コミュニティから多くの注目を集めているが、コンピュータビジョンの問題や非現実的な条件下ではしばしば解決されている。
特に、新しいクラスの数は通常事前に知られており、そのラベルは時折ハイパーパラメータをチューニングするために使われる。
これらの仮定に依存する手法は現実のシナリオでは適用できない。
本研究では,新しい授業の事前知識が得られない場合に,表形式でNCDを解くことに焦点を当てる。
この目的のために、$k$-foldのクロスバリデーションプロセスを適用し、既知のクラスの一部を各フォルダに隠すことにより、NCD法のハイパーパラメータを調整することを提案する。
過パラメータが多すぎるメソッドがこれらの隠れクラスに過度に適合することを発見したので、単純な深いNCDモデルを定義する。
本手法は, NCD問題に必要な必須要素のみで構成され, 現実的な条件下では優れた性能を発揮する。
さらに,本手法の潜伏空間を用いて,新規クラスの数を確実に推定できることがわかった。
さらに、既知のクラスの知識を活用するために、2つの教師なしクラスタリングアルゴリズム(k$-meansとSpectral Clustering)を適用する。
提案手法とハイパーパラメータチューニングプロセスの有効性を実証し,新しいクラスからの知識を頼らずにNCD問題を解くことができることを示す。
関連論文リスト
- When and How Does Known Class Help Discover Unknown Ones? Provable
Understanding Through Spectral Analysis [35.57142091571271]
新規クラス発見 (NCD) は、既知のクラスを持つラベル付きセットからの事前知識を活用することにより、ラベルなしセットで新しいクラスを推論することを目的としている。
本稿では, クラスがいつ, どのようにして新しいクラスを発見できるかを定式化し, 研究するための分析フレームワークを提供することで, ギャップを埋める。
論文 参考訳(メタデータ) (2023-08-09T15:27:21Z) - An Interactive Interface for Novel Class Discovery in Tabular Data [54.11148718494725]
新規クラスディスカバリー(英: Novel Class Discovery、NCD)とは、異なるクラスがラベル付けされていることを考慮し、ラベル付けされていないセットで新しいクラスを発見しようとする問題である。
現在提案されているNCD法の大部分は画像データにのみ対応している。
このインターフェースにより、ドメインの専門家は表データでNCDのための最先端のアルゴリズムを簡単に実行することができる。
論文 参考訳(メタデータ) (2023-06-22T14:32:53Z) - NEV-NCD: Negative Learning, Entropy, and Variance regularization based
novel action categories discovery [23.17093125627668]
新たなカテゴリディスカバリ(NCD)は、部分的にアノテートされたラベル空間からの学習を容易にする。
そこで我々は,新しい一段階共同最適化型NCD法,負学習,エントロピー,分散正規化NCDを提案する。
ビデオ行動認識のNCD応用におけるNEV-NCDの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-14T19:20:26Z) - Large-scale Pre-trained Models are Surprisingly Strong in Incremental Novel Class Discovery [76.63807209414789]
我々は,クラスiNCDにおける現状問題に挑戦し,クラス発見を継続的に,真に教師なしで行う学習パラダイムを提案する。
凍結したPTMバックボーンと学習可能な線形分類器から構成される単純なベースラインを提案する。
論文 参考訳(メタデータ) (2023-03-28T13:47:16Z) - D\'ecouvrir de nouvelles classes dans des donn\'ees tabulaires [54.11148718494725]
Novel Class Discovery (NCD) において、ゴールは、既知のクラスと異なるクラスのラベル付きセットが与えられたラベルのないセットで新しいクラスを見つけることである。
異種データにおける新しいクラスの発見過程を導くために,すでに知られているクラスから知識を抽出する方法を示す。
論文 参考訳(メタデータ) (2022-11-28T09:48:55Z) - A Method for Discovering Novel Classes in Tabular Data [54.11148718494725]
Novel Class Discovery (NCD) において、ゴールは、既知のクラスと異なるクラスのラベル付きセットが与えられたラベルのないセットで新しいクラスを見つけることである。
異種データにおける新しいクラスの発見過程を導くために,すでに知られているクラスから知識を抽出する方法を示す。
論文 参考訳(メタデータ) (2022-09-02T11:45:24Z) - Spacing Loss for Discovering Novel Categories [72.52222295216062]
新たなクラスディスカバリ(NCD)は、マシンラーニングモデルがラベルのないデータからインスタンスを意味的にグループ化する、学習パラダイムである。
まず,ラベル付きデータとラベルなしデータを併用する必要があるかどうかに基づいて,既存のNCD手法を1段階および2段階の手法に特徴付ける。
多次元スケーリングのキューを用いて、潜在空間における分離性を強制する単純で強力な損失関数を考案する。
論文 参考訳(メタデータ) (2022-04-22T09:37:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。