論文の概要: Prototypical Hash Encoding for On-the-Fly Fine-Grained Category Discovery
- arxiv url: http://arxiv.org/abs/2410.19213v1
- Date: Thu, 24 Oct 2024 23:51:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-28 13:36:38.168657
- Title: Prototypical Hash Encoding for On-the-Fly Fine-Grained Category Discovery
- Title(参考訳): オンザフライファイングレードカテゴリー発見のためのプロトタイプハッシュ符号化
- Authors: Haiyang Zheng, Nan Pu, Wenjing Li, Nicu Sebe, Zhun Zhong,
- Abstract要約: カテゴリ対応プロトタイプ生成(CPG)とディスクリミカテゴリ5.3%(DCE)が提案されている。
CPGは、各カテゴリを複数のプロトタイプで表現することで、カテゴリ内の多様性を完全にキャプチャすることを可能にする。
DCEは生成されたカテゴリプロトタイプのガイダンスによってハッシュコードの識別能力を向上する。
- 参考スコア(独自算出の注目度): 65.16724941038052
- License:
- Abstract: In this paper, we study a practical yet challenging task, On-the-fly Category Discovery (OCD), aiming to online discover the newly-coming stream data that belong to both known and unknown classes, by leveraging only known category knowledge contained in labeled data. Previous OCD methods employ the hash-based technique to represent old/new categories by hash codes for instance-wise inference. However, directly mapping features into low-dimensional hash space not only inevitably damages the ability to distinguish classes and but also causes "high sensitivity" issue, especially for fine-grained classes, leading to inferior performance. To address these issues, we propose a novel Prototypical Hash Encoding (PHE) framework consisting of Category-aware Prototype Generation (CPG) and Discriminative Category Encoding (DCE) to mitigate the sensitivity of hash code while preserving rich discriminative information contained in high-dimension feature space, in a two-stage projection fashion. CPG enables the model to fully capture the intra-category diversity by representing each category with multiple prototypes. DCE boosts the discrimination ability of hash code with the guidance of the generated category prototypes and the constraint of minimum separation distance. By jointly optimizing CPG and DCE, we demonstrate that these two components are mutually beneficial towards an effective OCD. Extensive experiments show the significant superiority of our PHE over previous methods, e.g., obtaining an improvement of +5.3% in ALL ACC averaged on all datasets. Moreover, due to the nature of the interpretable prototypes, we visually analyze the underlying mechanism of how PHE helps group certain samples into either known or unknown categories. Code is available at https://github.com/HaiyangZheng/PHE.
- Abstract(参考訳): 本稿では,ラベル付きデータに含まれる既知のカテゴリ知識のみを活用することで,既知のクラスと未知クラスの両方に属する新たなストリームデータのオンライン発見を目的とした,実践的かつ困難なOCD(On-the-fly Category Discovery)について検討する。
従来のOCD手法ではハッシュベースの手法を使用して、ハッシュコードを用いて古いカテゴリや新しいカテゴリを表現している。
しかし、機能を直接低次元のハッシュ空間にマッピングすることは、必然的にクラスを区別する能力を損なうだけでなく、「高感度」問題を引き起こす。
これらの課題に対処するため,高次元特徴空間に含まれるリッチな識別情報を2段階の投影方式で保存しつつ,ハッシュコードの感度を緩和するために,カテゴリー認識型プロトタイプ生成(CPG)と識別カテゴリー符号化(DCE)からなる新しいプロトタイプハッシュ符号化(PHE)フレームワークを提案する。
CPGは、各カテゴリを複数のプロトタイプで表現することで、カテゴリ内の多様性を完全にキャプチャすることを可能にする。
DCEは、生成されたカテゴリプロトタイプと最小分離距離の制約により、ハッシュコードの識別能力を向上する。
CPGとDCEを協調的に最適化することにより、これらの2つのコンポーネントが効果的なOCDに対して相互に有益であることを示す。
大規模な実験では、従来の手法よりもPHEの顕著な優位性が示され、例えば、すべてのデータセットで平均されるALLACCの+5.3%の改善が得られた。
さらに、解釈可能なプロトタイプの性質から、PHEが特定のサンプルを未知または未知のカテゴリに分類する方法の基盤となるメカニズムを視覚的に分析する。
コードはhttps://github.com/HaiyangZheng/PHEで入手できる。
関連論文リスト
- Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - HieNet: Bidirectional Hierarchy Framework for Automated ICD Coding [2.9373912230684573]
International Classification of Diseases (ICD) は、医学記録の分類コードである。
本研究では,その課題に対処する新しい双方向階層フレームワーク(HieNet)を提案する。
具体的には、コードのコリレーションをキャプチャするパーソナライズされたPageRankルーチンと、コードの階層的表現をキャプチャする双方向階層パスエンコーダと、予測のセマンティック検索空間を狭めるプログレッシブ予測手法を提案する。
論文 参考訳(メタデータ) (2022-12-09T14:51:12Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Automatically Discovering Novel Visual Categories with Self-supervised
Prototype Learning [68.63910949916209]
本稿では,大規模な画像収集において未知のカテゴリを識別することを目的とした,新しいカテゴリ発見(NCD)の課題に取り組む。
本稿では,プロトタイプ表現学習とプロトタイプ自己学習という,2つの主要な段階からなる適応型プロトタイプ学習手法を提案する。
本研究では,4つのベンチマークデータセットについて広範な実験を行い,提案手法の有効性とロバスト性を示す。
論文 参考訳(メタデータ) (2022-08-01T16:34:33Z) - Deep Asymmetric Hashing with Dual Semantic Regression and Class
Structure Quantization [9.539842235137376]
本稿では,三重制約の下で識別ハッシュを生成する二項意味非対称ハッシュ(DSAH)法を提案する。
これら3つの主要コンポーネントにより、ネットワークを介して高品質なハッシュコードを生成することができる。
論文 参考訳(メタデータ) (2021-10-24T16:14:36Z) - Channel DropBlock: An Improved Regularization Method for Fine-Grained
Visual Classification [58.07257910065007]
既存のアプローチは主に、識別的部分を見つけるための注意機構や、高度にパラメータ化された特徴を弱教師付きで抽出する特徴符号化アプローチを導入することでこの問題に対処している。
本研究では,CDB(Channel DropBlock)と呼ばれる軽量で効果的な正規化手法を提案する。
論文 参考訳(メタデータ) (2021-06-07T09:03:02Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。