論文の概要: InfoSculpt: Sculpting the Latent Space for Generalized Category Discovery
- arxiv url: http://arxiv.org/abs/2601.10098v1
- Date: Thu, 15 Jan 2026 06:00:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-16 19:43:19.009839
- Title: InfoSculpt: Sculpting the Latent Space for Generalized Category Discovery
- Title(参考訳): InfoSculpt: 一般化されたカテゴリー発見のための潜在空間の彫刻
- Authors: Wenwen Liao, Hang Ruan, Jianbo Yu, Yuansong Wang, Qingchao Jiang, Xiaofeng Yang,
- Abstract要約: Generalized Category Discovery (GCD)は、既知のカテゴリと新しいカテゴリの両方から、大規模にラベル付けされていないデータセットのインスタンスを分類することを目的としている。
両条件相互情報(CMI)の目的を最小化することにより,表現空間を体系的に彫刻する新しいフレームワークであるInfoSculptを紹介する。
- 参考スコア(独自算出の注目度): 7.797804082289705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalized Category Discovery (GCD) aims to classify instances from both known and novel categories within a large-scale unlabeled dataset, a critical yet challenging task for real-world, open-world applications. However, existing methods often rely on pseudo-labeling, or two-stage clustering, which lack a principled mechanism to explicitly disentangle essential, category-defining signals from instance-specific noise. In this paper, we address this fundamental limitation by re-framing GCD from an information-theoretic perspective, grounded in the Information Bottleneck (IB) principle. We introduce InfoSculpt, a novel framework that systematically sculpts the representation space by minimizing a dual Conditional Mutual Information (CMI) objective. InfoSculpt uniquely combines a Category-Level CMI on labeled data to learn compact and discriminative representations for known classes, and a complementary Instance-Level CMI on all data to distill invariant features by compressing augmentation-induced noise. These two objectives work synergistically at different scales to produce a disentangled and robust latent space where categorical information is preserved while noisy, instance-specific details are discarded. Extensive experiments on 8 benchmarks demonstrate that InfoSculpt validating the effectiveness of our information-theoretic approach.
- Abstract(参考訳): Generalized Category Discovery (GCD)は、既知のカテゴリと新しいカテゴリの両方から、大規模な未ラベルデータセットにインスタンスを分類することを目的としている。
しかし、既存の手法は、しばしば擬似ラベルや2段階のクラスタリングに依存しており、インスタンス固有のノイズから必須のカテゴリ定義シグナルを明示的に切り離すための原則的なメカニズムが欠如している。
本稿では,情報ボトルネック(IB)の原理に基づき,情報理論の観点からGCDを再フレーミングすることで,この基本的な制限に対処する。
両条件相互情報(CMI)の目的を最小化することにより,表現空間を体系的に彫刻する新しいフレームワークであるInfoSculptを紹介する。
InfoSculptは、ラベル付きデータ上のカテゴリレベルCMIと、既知のクラスに対するコンパクトで差別的な表現を学習するためのカテゴリレベルCMIと、すべてのデータ上で補完的なインスタンスレベルCMIとを組み合わせて、拡張誘起ノイズを圧縮することで不変性を蒸留する。
これらの2つの目的は異なるスケールでシナジスティックに働き、カテゴリー情報が保存され、ノイズ、インスタンス固有の詳細が破棄される、アンタングルで頑健な潜在空間を生成する。
8つのベンチマークの大規模な実験は、InfoSculptが我々の情報理論的アプローチの有効性を検証していることを示している。
関連論文リスト
- Generalized Fine-Grained Category Discovery with Multi-Granularity Conceptual Experts [81.68203255687051]
Generalized Category Discoveryは、部分的にラベル付けされたカテゴリの知識を活用することでラベル付けされていないデータをクラスタリングする、オープンワールドな問題である。
既存のアプローチでは、視覚データにおいて複数の粒度の概念情報を活用できない。
精度の高いカテゴリ発見のための多粒度知識を統合した多粒度エキスパートフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-30T13:25:11Z) - Component Adaptive Clustering for Generalized Category Discovery [13.322393552334063]
本稿では、適応スロット注意(AdaSlot)を一般化カテゴリー発見(GCD)フレームワークに組み込んだクラスタ中心のコントラスト学習フレームワークを提案する。
AdaSlotはデータ複雑性に基づいて最適なスロット数を動的に決定し、事前に定義されたスロットカウントを不要にする。
本手法は,実世界のシナリオにおけるクラス発見を改善するために,インスタンス固有の特徴と空間的にクラスタリングされた特徴の両方をキャプチャする。
論文 参考訳(メタデータ) (2025-07-02T13:41:30Z) - Generalized Semantic Contrastive Learning via Embedding Side Information for Few-Shot Object Detection [52.490375806093745]
マイクロショットオブジェクト検出(FSOD)の目的は、少数のトレーニングサンプルで新しいオブジェクトを検出することである。
本稿では,特徴空間とサンプル視点から得られる負の影響を緩和する側面情報を紹介する。
我々のモデルは従来の最先端手法よりも優れており、ほとんどのショット/スプリットにおけるFSODの能力は大幅に向上している。
論文 参考訳(メタデータ) (2025-04-09T17:24:05Z) - When Segmentation Meets Hyperspectral Image: New Paradigm for Hyperspectral Image Classification [4.179738334055251]
ハイパースペクトル画像(HSI)分類は、リモートセンシングの基盤であり、豊富なスペクトル情報を通じて正確な材料と土地被覆の識別を可能にする。
ディープラーニングはこのタスクに大きな進歩をもたらしたが、小さなパッチベースの分類器は進歩の90%以上を占めており、制限に直面している。
本研究では, HSI分類のための新しいパラダイムとベースラインであるHSIsegを提案し, これらの課題を克服するために, 分割手法と新しい動的シフト地域変換器(DSRT)を組み合わせる。
論文 参考訳(メタデータ) (2025-02-18T05:04:29Z) - Sampling-enabled scalable manifold learning unveils the discriminative cluster structure of high-dimensional data [17.411028691739897]
大規模・高次元データに対して一様および識別的埋め込み(SUDE)を可能にする,サンプリングベースでスケーラブルな多様体学習手法を提案する。
合成データセットと実世界のベンチマークにおけるSUDEの有効性を実証的に検証し, 単細胞データの解析と心電図信号の異常検出に応用した。
論文 参考訳(メタデータ) (2024-01-02T08:43:06Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - Capturing scattered discriminative information using a deep architecture
in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。
我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。
2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文 参考訳(メタデータ) (2020-07-09T08:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。