論文の概要: How many classes do we need to see for novel class discovery?
- arxiv url: http://arxiv.org/abs/2509.15585v1
- Date: Fri, 19 Sep 2025 04:38:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:10.997292
- Title: How many classes do we need to see for novel class discovery?
- Title(参考訳): 斬新なクラス発見のために何つのクラスを見る必要があるか?
- Authors: Akanksha Sarkar, Been Kim, Jennifer J. Sun,
- Abstract要約: 本研究では,既知のクラス数と発見性能の関係と,既知のクラス「カバレッジ」が新たなクラス発見に与える影響について検討する。
実験結果から,既知のクラス数の利点は,発見性能が低下する飽和点に達することが示唆された。
- 参考スコア(独自算出の注目度): 10.313030109592377
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Novel class discovery is essential for ML models to adapt to evolving real-world data, with applications ranging from scientific discovery to robotics. However, these datasets contain complex and entangled factors of variation, making a systematic study of class discovery difficult. As a result, many fundamental questions are yet to be answered on why and when new class discoveries are more likely to be successful. To address this, we propose a simple controlled experimental framework using the dSprites dataset with procedurally generated modifying factors. This allows us to investigate what influences successful class discovery. In particular, we study the relationship between the number of known/unknown classes and discovery performance, as well as the impact of known class 'coverage' on discovering new classes. Our empirical results indicate that the benefit of the number of known classes reaches a saturation point beyond which discovery performance plateaus. The pattern of diminishing return across different settings provides an insight for cost-benefit analysis for practitioners and a starting point for more rigorous future research of class discovery on complex real-world datasets.
- Abstract(参考訳): 新しいクラス発見は、科学的な発見からロボティクスまで、MLモデルが現実世界のデータに適応するために不可欠である。
しかし、これらのデータセットは複雑で絡み合った変動要因を含んでおり、クラス発見の体系的な研究を困難にしている。
結果として、なぜ、いつ新しいクラス発見が成功するかという根本的な疑問は、まだ答えられていない。
そこで本稿では,dSpritesデータセットと手続き的に生成された修正因子を用いた簡易制御実験フレームワークを提案する。
これにより、クラス発見の成功にどんな影響を及ぼすかを調べることができる。
特に,既知のクラス数と発見性能の関係と,既知のクラス「カバレッジ」が新たなクラス発見に与える影響について検討する。
実験結果から,既知のクラス数の利点は,発見性能が低下する飽和点に達することが示唆された。
異なる設定にまたがるリターンを減少させるパターンは、実践者にとってコストベネフィット分析の洞察と、複雑な実世界のデータセットにおけるクラス発見に関するより厳密な研究の出発点となる。
関連論文リスト
- Self-Cooperation Knowledge Distillation for Novel Class Discovery [8.984031974257274]
新たなクラス発見(NCD)は、既知のクラスについて既に学んだ知識を活用することで、ラベルのないセットで未知のクラスと新しいクラスを発見することを目的としている。
本研究では, 自己協調的知識蒸留法 (SCKD) を提案し, 各トレーニングサンプル(既知の, 新規, ラベル付, ラベル付, 未ラベル) を, レビューと発見の両方に活用する。
論文 参考訳(メタデータ) (2024-07-02T03:49:48Z) - Class-relation Knowledge Distillation for Novel Class Discovery [16.461242381109276]
主な課題は、既知のクラスデータの知識を新しいクラスの学習に転送することである。
本稿では,既知のクラスに基づいて学習したモデルの予測クラス分布に基づいて,新しいクラスに対するクラス関係表現を提案する。
本稿では,クラス関係表現を利用して新しいクラスの学習を規則化する新しい知識蒸留フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-18T11:35:57Z) - Recognizing Unseen Objects via Multimodal Intensive Knowledge Graph
Propagation [68.13453771001522]
画像の領域と対応するセマンティック埋め込みとをマッチングする多モード集中型ZSLフレームワークを提案する。
我々は、大規模な実世界のデータに基づいて、広範囲な実験を行い、そのモデルを評価する。
論文 参考訳(メタデータ) (2023-06-14T13:07:48Z) - Novel Class Discovery without Forgetting [72.52222295216062]
我々は NCDwF: Novel Class Discovery without Forgetting の新たな実用的問題設定を特定し,定式化する。
ラベルのないデータから新しいカテゴリのインスタンスを段階的に発見する機械学習モデルを提案する。
CIFAR-10, CIFAR-100, ImageNet-1000に基づく実験プロトコルを導入し, 知識保持と新しいクラス発見のトレードオフを測定する。
論文 参考訳(メタデータ) (2022-07-21T17:54:36Z) - LifeLonger: A Benchmark for Continual Disease Classification [59.13735398630546]
MedMNISTコレクションの連続的な疾患分類のためのベンチマークであるLifeLongerを紹介する。
タスクとクラスでの病気の漸進的な学習は、モデルをスクラッチから再トレーニングすることなく、新しいサンプルを分類する問題に対処する。
クロスドメインインクリメンタル学習は、これまで得られた知識を維持しながら、異なる機関から派生したデータセットを扱う問題に対処する。
論文 参考訳(メタデータ) (2022-04-12T12:25:05Z) - Learning Open Set Network with Discriminative Reciprocal Points [70.28322390023546]
オープンセット認識は、事前に定義されたクラスからサンプルを同時に分類し、残りを「未知」として識別することを目的としている。
本稿では,各既知圏に対応するクラス外空間のポテンシャル表現であるReciprocal Pointを提案する。
相互点によって構成される有界空間に基づいて、未知のリスクは多圏相互作用によって減少する。
論文 参考訳(メタデータ) (2020-10-31T03:20:31Z) - Few-Shot Class-Incremental Learning [68.75462849428196]
本稿では,FSCIL問題に焦点をあてる。
FSCIL は CNN モデルに対して,学習済みのクラスを忘れることなく,ラベル付きサンプルのごく少数から新たなクラスを漸進的に学習することを求めている。
我々は,異なるクラスで形成される特徴多様体のトポロジーを学習し,保存するニューラルネットワーク(NG)ネットワークを用いて,知識を表現する。
論文 参考訳(メタデータ) (2020-04-23T03:38:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。