論文の概要: Generalized Category Discovery under the Long-Tailed Distribution
- arxiv url: http://arxiv.org/abs/2506.12515v2
- Date: Fri, 20 Jun 2025 10:11:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 12:57:34.481024
- Title: Generalized Category Discovery under the Long-Tailed Distribution
- Title(参考訳): 長期分布下における一般カテゴリー発見
- Authors: Bingchen Zhao, Kai Han,
- Abstract要約: 本稿では,長期分布下での一般カテゴリー発見(GCD)の問題に対処する。
これらの課題に対処するために,自信あるサンプル選択と密度に基づくクラスタリングに基づくフレームワークを提案する。
本手法の有効性を実証するために, 長い尾を持つGCDデータセットと従来のGCDデータセットの比較実験を行った。
- 参考スコア(独自算出の注目度): 19.597592179538257
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses the problem of Generalized Category Discovery (GCD) under a long-tailed distribution, which involves discovering novel categories in an unlabelled dataset using knowledge from a set of labelled categories. Existing works assume a uniform distribution for both datasets, but real-world data often exhibits a long-tailed distribution, where a few categories contain most examples, while others have only a few. While the long-tailed distribution is well-studied in supervised and semi-supervised settings, it remains unexplored in the GCD context. We identify two challenges in this setting - balancing classifier learning and estimating category numbers - and propose a framework based on confident sample selection and density-based clustering to tackle them. Our experiments on both long-tailed and conventional GCD datasets demonstrate the effectiveness of our method.
- Abstract(参考訳): 本稿では,ラベル付きカテゴリの集合からの知識を用いて,ラベル付きデータセットにおける新しいカテゴリの発見を伴う,長期分布下での一般化カテゴリー発見(GCD)の問題に対処する。
既存の研究は両方のデータセットに一様分布を仮定するが、実世界のデータはしばしば長い尾の分布を示す。
長い尾の分布は教師付きおよび半教師付き設定でよく研究されているが、GCDの文脈では探索されていない。
この設定において、分類器学習とカテゴリ数の推定のバランスをとるという2つの課題を特定し、信頼度の高いサンプル選択とそれに取り組むための密度に基づくクラスタリングに基づくフレームワークを提案する。
本手法の有効性を実証するために, 長い尾を持つGCDデータセットと従来のGCDデータセットの比較実験を行った。
関連論文リスト
- Generalized Category Discovery in Event-Centric Contexts: Latent Pattern Mining with LLMs [34.06878654462158]
イベント中心のGCDは,長い複雑な物語と高度に不均衡なクラス分布を特徴とする。
クラスタクラスのアライメントを改善するためのイベントパターンの抽出と精巧化にLLMを活用するフレームワークであるPaMAを提案する。
新たに構築されたScam Reportデータセットを含む2つのEC-GCDベンチマークの評価は、PaMAが12.58%のHスコアゲインで先行メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2025-05-29T10:02:04Z) - Generalized Categories Discovery for Long-tailed Recognition [8.69033435074757]
一般化されたクラスディスカバリは、既知のカテゴリと未知のカテゴリの両方をラベルのないデータセットから識別する上で重要な役割を果たす。
我々の研究は、長い尾の一般カテゴリー発見(Long-tailed GCD)パラダイムに焦点をあてて、この断線を橋渡ししようと試みています。
長い尾を持つGCDがもたらす特異な課題に対応するため、2つの戦略正則化に固定された頑健な方法論を提案する。
論文 参考訳(メタデータ) (2023-12-04T09:21:30Z) - Towards Distribution-Agnostic Generalized Category Discovery [51.52673017664908]
データ不均衡とオープンエンドの分布は、現実の視覚世界の本質的な特性である。
我々は,BaCon(Self-Balanced Co-Advice contrastive framework)を提案する。
BaConは、対照的な学習ブランチと擬似ラベルブランチで構成され、DA-GCDタスクを解決するためのインタラクティブな監視を提供するために協力して動作する。
論文 参考訳(メタデータ) (2023-10-02T17:39:58Z) - Concept Drift and Long-Tailed Distribution in Fine-Grained Visual Categorization: Benchmark and Method [84.68818879525568]
コンセプションドリフトとLong-Tailed Distributionデータセットを提案する。
インスタンスの特徴は時間によって異なり、長い尾の分布を示す傾向がある。
本稿ではCDLTに関連する学習課題に対処する機能組換えフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-04T12:42:45Z) - Tackling Long-Tailed Category Distribution Under Domain Shifts [50.21255304847395]
既存のアプローチでは、両方の問題が存在するシナリオに対処できません。
本研究では,分散校正型分類損失,視覚意味マッピング,セマンティック類似性誘導拡張の3つの新しい機能ブロックを設計した。
AWA2-LTSとImageNet-LTSという2つの新しいデータセットが提案された。
論文 参考訳(メタデータ) (2022-07-20T19:07:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。