論文の概要: Generalized Category Discovery via Token Manifold Capacity Learning
- arxiv url: http://arxiv.org/abs/2505.14044v1
- Date: Tue, 20 May 2025 07:40:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:52.86953
- Title: Generalized Category Discovery via Token Manifold Capacity Learning
- Title(参考訳): Token Manifold Capacity Learningによる一般化カテゴリー探索
- Authors: Luyao Tang, Kunze Huang, Chaoqi Chen, Cheng Chen,
- Abstract要約: 一般カテゴリー発見(GCD)は、オープンワールドシナリオにおけるディープラーニングモデルの堅牢性向上に不可欠である。
従来のGCD法はクラスタ内の変動を最小限に抑え、しばしば多様体の容量を犠牲にする。
本稿では,データの多様性と複雑性を維持するために,クラストークンの多様体容量を優先する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 11.529179734339365
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generalized category discovery (GCD) is essential for improving deep learning models' robustness in open-world scenarios by clustering unlabeled data containing both known and novel categories. Traditional GCD methods focus on minimizing intra-cluster variations, often sacrificing manifold capacity, which limits the richness of intra-class representations. In this paper, we propose a novel approach, Maximum Token Manifold Capacity (MTMC), that prioritizes maximizing the manifold capacity of class tokens to preserve the diversity and complexity of data. MTMC leverages the nuclear norm of singular values as a measure of manifold capacity, ensuring that the representation of samples remains informative and well-structured. This method enhances the discriminability of clusters, allowing the model to capture detailed semantic features and avoid the loss of critical information during clustering. Through theoretical analysis and extensive experiments on coarse- and fine-grained datasets, we demonstrate that MTMC outperforms existing GCD methods, improving both clustering accuracy and the estimation of category numbers. The integration of MTMC leads to more complete representations, better inter-class separability, and a reduction in dimensional collapse, establishing MTMC as a vital component for robust open-world learning. Code is in github.com/lytang63/MTMC.
- Abstract(参考訳): 一般カテゴリ発見(GCD)は、既知のカテゴリと新しいカテゴリの両方を含むラベルのないデータをクラスタリングすることで、オープンワールドシナリオにおけるディープラーニングモデルの堅牢性を改善するために不可欠である。
従来のGCD法は、クラス内の表現の豊かさを制限するため、しばしば多様体容量を犠牲にするクラスタ内の変動を最小限にすることに焦点を当てている。
本稿では,データの多様性と複雑さを維持するために,クラストークンの多様体容量の最大化を優先する,MTMC(Maximum Token Manifold Capacity)を提案する。
MTMCは特異値の核ノルムを多様体の容量の尺度として利用し、サンプルの表現が情報的かつよく構造化されていることを保証している。
この方法はクラスタの識別可能性を高め、モデルが詳細なセマンティックな特徴をキャプチャし、クラスタリング中に重要な情報が失われないようにする。
MTMCが既存のGCD法より優れており,クラスタリング精度とカテゴリ数の推定精度が向上していることを示す。
MTMCの統合により、より完全な表現、クラス間分離性の向上、次元の崩壊が減少し、MTMCは堅牢なオープンワールド学習の不可欠な要素となる。
コードはgithub.com/lytang63/MTMCにある。
関連論文リスト
- Unbiased Max-Min Embedding Classification for Transductive Few-Shot Learning: Clustering and Classification Are All You Need [83.10178754323955]
わずかなショットラーニングにより、モデルがいくつかのラベル付き例から一般化できる。
本稿では,Unbiased Max-Min Embedding Classification (UMMEC)法を提案する。
本手法は最小ラベル付きデータを用いて分類性能を著しく向上させ, 注釈付きLの最先端化を推し進める。
論文 参考訳(メタデータ) (2025-03-28T07:23:07Z) - Revisiting Self-Supervised Heterogeneous Graph Learning from Spectral Clustering Perspective [52.662463893268225]
自己教師付きヘテロジニアスグラフ学習(SHGL)は様々なシナリオにおいて有望な可能性を示している。
既存のSHGLメソッドには2つの大きな制限がある。
ランクと二重整合性制約によって強化された新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2024-12-01T09:33:20Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Cross-Modality Clustering-based Self-Labeling for Multimodal Data Classification [2.666791490663749]
CMCSL(Cross-Modality Clustering-based Self-Labeling)
CMCSLは、深い特徴空間の各モードに属するインスタンスをグループ化し、その結果のクラスタ内で既知のラベルを伝搬する。
MM-IMDbデータセットから抽出した20個のデータセットに対する実験的検討
論文 参考訳(メタデータ) (2024-08-05T15:43:56Z) - Memetic Differential Evolution Methods for Semi-Supervised Clustering [0.8681835475119588]
MDEClustの半教師付き最小二乗クラスタリング(MSSC)問題に対する拡張を提案する。
我々の新しいフレームワークであるS-MDEClustは、最適な実現可能なソリューションを生成するために設計された最初のメメカティックな方法論である。
論文 参考訳(メタデータ) (2024-03-07T08:37:36Z) - Multi-View Clustering via Semi-non-negative Tensor Factorization [120.87318230985653]
半負のテンソル因子分解(Semi-NTF)に基づく新しいマルチビュークラスタリングを開発する。
本モデルは、ビュー間の関係を直接考慮し、ビュー間の補完情報を利用する。
さらに,提案手法の最適化アルゴリズムを提案し,そのアルゴリズムが常に定常KKT点に収束することを数学的に証明する。
論文 参考訳(メタデータ) (2023-03-29T14:54:19Z) - Deep Attention-guided Graph Clustering with Dual Self-supervision [49.040136530379094]
デュアル・セルフ・スーパービジョン(DAGC)を用いたディープアテンション誘導グラフクラスタリング法を提案する。
我々は,三重項Kulback-Leibler分散損失を持つソフトな自己スーパービジョン戦略と,擬似的な監督損失を持つハードな自己スーパービジョン戦略からなる二重自己スーパービジョンソリューションを開発する。
提案手法は6つのベンチマークデータセットにおける最先端の手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-10T06:53:03Z) - Deep Conditional Gaussian Mixture Model for Constrained Clustering [7.070883800886882]
制約付きクラスタリングは、部分的にラベル付けされたデータの増加量に関する事前情報を利用することができる。
本稿では、直感的で解釈可能で、勾配変動推論の枠組みで効率的に訓練できる制約付きクラスタリングのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-11T13:38:09Z) - Joint Optimization of an Autoencoder for Clustering and Embedding [22.16059261437617]
本稿では,自動エンコーダとクラスタリングを同時に学習する代替手法を提案する。
この単純なニューラルネットワークはクラスタリングモジュールと呼ばれ、ディープオートエンコーダに統合され、ディープクラスタリングモデルとなる。
論文 参考訳(メタデータ) (2020-12-07T14:38:10Z) - TCGM: An Information-Theoretic Framework for Semi-Supervised
Multi-Modality Learning [35.76792527025377]
半教師付きマルチモーダル学習のための新しい情報理論アプローチである textbfTotal textbfCorrelation textbfGain textbfMaximization (TCGM) を提案する。
本手法を様々なタスクに適用し,ニュース分類,感情認識,疾患予測など,最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-07-14T03:32:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。