論文の概要: Generalized Fine-Grained Category Discovery with Multi-Granularity Conceptual Experts
- arxiv url: http://arxiv.org/abs/2509.26227v1
- Date: Tue, 30 Sep 2025 13:25:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:45:00.142728
- Title: Generalized Fine-Grained Category Discovery with Multi-Granularity Conceptual Experts
- Title(参考訳): 多粒性概念エキスパートによる一般化細粒カテゴリー発見
- Authors: Haiyang Zheng, Nan Pu, Wenjing Li, Nicu Sebe, Zhun Zhong,
- Abstract要約: Generalized Category Discoveryは、部分的にラベル付けされたカテゴリの知識を活用することでラベル付けされていないデータをクラスタリングする、オープンワールドな問題である。
既存のアプローチでは、視覚データにおいて複数の粒度の概念情報を活用できない。
精度の高いカテゴリ発見のための多粒度知識を統合した多粒度エキスパートフレームワークを提案する。
- 参考スコア(独自算出の注目度): 81.68203255687051
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalized Category Discovery (GCD) is an open-world problem that clusters unlabeled data by leveraging knowledge from partially labeled categories. A key challenge is that unlabeled data may contain both known and novel categories. Existing approaches suffer from two main limitations. First, they fail to exploit multi-granularity conceptual information in visual data, which limits representation quality. Second, most assume that the number of unlabeled categories is known during training, which is impractical in real-world scenarios. To address these issues, we propose a Multi-Granularity Conceptual Experts (MGCE) framework that adaptively mines visual concepts and integrates multi-granularity knowledge for accurate category discovery. MGCE consists of two modules: (1) Dynamic Conceptual Contrastive Learning (DCCL), which alternates between concept mining and dual-level representation learning to jointly optimize feature learning and category discovery; and (2) Multi-Granularity Experts Collaborative Learning (MECL), which extends the single-expert paradigm by introducing additional experts at different granularities and by employing a concept alignment matrix for effective cross-expert collaboration. Importantly, MGCE can automatically estimate the number of categories in unlabeled data, making it suitable for practical open-world settings. Extensive experiments on nine fine-grained visual recognition benchmarks demonstrate that MGCE achieves state-of-the-art results, particularly in novel-class accuracy. Notably, even without prior knowledge of category numbers, MGCE outperforms parametric approaches that require knowing the exact number of categories, with an average improvement of 3.6\%. Code is available at https://github.com/HaiyangZheng/MGCE.
- Abstract(参考訳): Generalized Category Discovery (GCD) は、部分的にラベル付けされたカテゴリの知識を活用することでラベル付けされていないデータをクラスタリングするオープンワールド問題である。
重要な課題は、ラベルのないデータには既知のカテゴリと新しいカテゴリの両方が含まれる可能性があることだ。
既存のアプローチには2つの大きな制限がある。
まず、視覚データにおける多粒性概念情報の利用に失敗し、表現品質を制限した。
第二に、ラベルなしのカテゴリの数は、実世界のシナリオでは非現実的であるトレーニング中に知られていると仮定する者が多い。
これらの課題に対処するために,視覚的概念を適応的にマイニングし,複数粒度知識を統合して正確なカテゴリ発見を行う多言語概念エキスパート(MGCE)フレームワークを提案する。
MGCEは,(1)概念マイニングと二重レベル表現学習を交互に組み合わせて特徴学習とカテゴリー発見を最適化する動的概念コントラスト学習(DCCL),(2)多言語専門家協調学習(MECL)の2つのモジュールから構成される。
重要なことは、MGCEはラベルのないデータ内のカテゴリの数を自動で推定し、実用的なオープンワールド設定に適していることである。
9つのきめ細かい視覚認識ベンチマークに関する大規模な実験は、MGCEが最先端の結果、特に新しいクラスの精度で達成できることを実証している。
特に、カテゴリー番号の事前の知識がなくても、MGCEはカテゴリの正確な数を知る必要があるパラメトリックアプローチより優れており、平均的な改善は3.6\%である。
コードはhttps://github.com/HaiyangZheng/MGCEで入手できる。
関連論文リスト
- Generalized Category Discovery via Token Manifold Capacity Learning [11.529179734339365]
一般カテゴリー発見(GCD)は、オープンワールドシナリオにおけるディープラーニングモデルの堅牢性向上に不可欠である。
従来のGCD法はクラスタ内の変動を最小限に抑え、しばしば多様体の容量を犠牲にする。
本稿では,データの多様性と複雑性を維持するために,クラストークンの多様体容量を優先する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-05-20T07:40:31Z) - Prototypical Hash Encoding for On-the-Fly Fine-Grained Category Discovery [65.16724941038052]
カテゴリ対応プロトタイプ生成(CPG)とディスクリミカテゴリ5.3%(DCE)が提案されている。
CPGは、各カテゴリを複数のプロトタイプで表現することで、カテゴリ内の多様性を完全にキャプチャすることを可能にする。
DCEは生成されたカテゴリプロトタイプのガイダンスによってハッシュコードの識別能力を向上する。
論文 参考訳(メタデータ) (2024-10-24T23:51:40Z) - Contextuality Helps Representation Learning for Generalized Category Discovery [5.885208652383516]
本稿では、文脈性の概念を活用することにより、一般化カテゴリー発見(GCD)への新たなアプローチを提案する。
我々のモデルでは,コントラスト学習に最も近いコンテキストが使用されるインスタンスレベルと,コントラスト学習を利用するクラスタレベルという,2つのコンテキストレベルを統合している。
文脈情報の統合は、特徴学習を効果的に改善し、その結果、すべてのカテゴリの分類精度が向上する。
論文 参考訳(メタデータ) (2024-07-29T07:30:41Z) - Textual Knowledge Matters: Cross-Modality Co-Teaching for Generalized Visual Class Discovery [65.16724941038052]
Generalized Category Discovery (GCD)は、既知のカテゴリと未知のカテゴリの両方からラベルのないデータをクラスタすることを目的としている。
現在のGCD法は、新しい視覚カテゴリーを発見する際に、人間の認知過程の多様性知覚性を無視する視覚的手がかりのみに依存している。
マルチモーダルなGCDを実現するための2段階のTextGCDフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-12T07:06:50Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Parametric Information Maximization for Generalized Category Discovery [20.373038652827788]
一般化カテゴリー発見(GCD)問題に対するパラメトリック情報最大化(PIM)モデルを提案する。
我々のPIMモデルは、6つの異なるデータセットにまたがってGCDに新しい最先端のパフォーマンスを一貫して設定していることを示す。
論文 参考訳(メタデータ) (2022-12-01T07:41:48Z) - Novel Visual Category Discovery with Dual Ranking Statistics and Mutual
Knowledge Distillation [16.357091285395285]
我々は、新しいクラスから異なるセマンティックパーティションに非ラベリングなイメージをグループ化する問題に取り組む。
これは従来の半教師付き学習よりも現実的で難しい設定です。
本稿では,局所的な部分レベル情報に焦点をあてた2分岐学習フレームワークと,全体特性に焦点をあてた2分岐学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-07-07T17:14:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。