論文の概要: Generate, Refine, and Encode: Leveraging Synthesized Novel Samples for On-the-Fly Fine-Grained Category Discovery
- arxiv url: http://arxiv.org/abs/2507.04051v1
- Date: Sat, 05 Jul 2025 14:20:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.993975
- Title: Generate, Refine, and Encode: Leveraging Synthesized Novel Samples for On-the-Fly Fine-Grained Category Discovery
- Title(参考訳): 生成、精製、エンコード:生合成された新しいサンプルをオンザフライで微粒なカテゴリー発見に活用する
- Authors: Xiao Liu, Nan Pu, Haiyang Zheng, Wenjing Li, Nicu Sebe, Zhun Zhong,
- Abstract要約: 本稿では,未知のカテゴリと未知のカテゴリの両方に属する可能性のある,新たに到着したストリームデータのオンライン識別について検討する。
既存のOCD法はラベル付きデータのみから転送可能な知識を完全にマイニングするものである。
本稿では,DiffGREと呼ばれる拡散型OCDフレームワークを提案する。
- 参考スコア(独自算出の注目度): 64.83837781610907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we investigate a practical yet challenging task: On-the-fly Category Discovery (OCD). This task focuses on the online identification of newly arriving stream data that may belong to both known and unknown categories, utilizing the category knowledge from only labeled data. Existing OCD methods are devoted to fully mining transferable knowledge from only labeled data. However, the transferability learned by these methods is limited because the knowledge contained in known categories is often insufficient, especially when few annotated data/categories are available in fine-grained recognition. To mitigate this limitation, we propose a diffusion-based OCD framework, dubbed DiffGRE, which integrates Generation, Refinement, and Encoding in a multi-stage fashion. Specifically, we first design an attribute-composition generation method based on cross-image interpolation in the diffusion latent space to synthesize novel samples. Then, we propose a diversity-driven refinement approach to select the synthesized images that differ from known categories for subsequent OCD model training. Finally, we leverage a semi-supervised leader encoding to inject additional category knowledge contained in synthesized data into the OCD models, which can benefit the discovery of both known and unknown categories during the on-the-fly inference process. Extensive experiments demonstrate the superiority of our DiffGRE over previous methods on six fine-grained datasets.
- Abstract(参考訳): 本稿では,OCD(On-the-fly Category Discovery)の実践的かつ困難な課題について検討する。
本課題は、ラベル付きデータのみからのカテゴリ知識を利用して、未知のカテゴリの両方に属する可能性のある、新たに到着したストリームデータのオンライン識別に焦点を当てる。
既存のOCD法は、ラベル付きデータのみから転送可能な知識を完全にマイニングするものである。
しかし、これらの手法によって学習される伝達性は、既知のカテゴリに含まれる知識が不十分であることが多いため、特に微粒な認識において、注釈付きデータ/カテゴリが少ない場合に限られる。
この制限を緩和するために,DiffGREと呼ばれる拡散型OCDフレームワークを提案する。
具体的には,拡散潜時空間におけるクロスイメージ補間に基づく属性合成生成法を設計し,新しい試料を合成する。
そこで本研究では,OCDモデルトレーニングにおける既知カテゴリとは異なる合成画像を選択するために,多様性駆動型精細化手法を提案する。
最後に、半教師付きリーダエンコーディングを利用して、合成データに含まれる追加のカテゴリ知識をOCDモデルに注入し、オンザフライ推論プロセスにおいて、既知のカテゴリと未知のカテゴリの両方の発見に役立てる。
6つのきめ細かいデータセットで過去の手法よりもDiffGREの方が優れていることを示す大規模な実験を行った。
関連論文リスト
- Freeze and Cluster: A Simple Baseline for Rehearsal-Free Continual Category Discovery [13.68907640197364]
本稿では,RF-CCD(Rehearsal-Free Continual Category Discovery)の問題に対処する。
RF-CCDはラベル付きデータからの知識を活用することで、新しいクラスを継続的に識別することに焦点を当てている。
従来のアプローチでは、両方のドメインの高度なテクニックを効果的に統合することに苦労していた。
論文 参考訳(メタデータ) (2025-03-12T06:46:32Z) - Solving the Catastrophic Forgetting Problem in Generalized Category Discovery [46.63232918739251]
Generalized Category Discovery (GCD)は、ラベルなしデータセット内の既知のカテゴリと新しいカテゴリの混合を識別することを目的としている。
最近の最先端手法SimGCDは、既知のクラスデータからの知識を、偏りのある学習を通して、新しいクラスの学習に転送する。
本稿では,従来の手法にシームレスに統合された新しい学習手法であるLegoGCDを提案する。
論文 参考訳(メタデータ) (2025-01-09T14:31:54Z) - Prototypical Hash Encoding for On-the-Fly Fine-Grained Category Discovery [65.16724941038052]
カテゴリ対応プロトタイプ生成(CPG)とディスクリミカテゴリ5.3%(DCE)が提案されている。
CPGは、各カテゴリを複数のプロトタイプで表現することで、カテゴリ内の多様性を完全にキャプチャすることを可能にする。
DCEは生成されたカテゴリプロトタイプのガイダンスによってハッシュコードの識別能力を向上する。
論文 参考訳(メタデータ) (2024-10-24T23:51:40Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。