論文の概要: Unleashing the Potential of Model Bias for Generalized Category Discovery
- arxiv url: http://arxiv.org/abs/2412.12501v1
- Date: Tue, 17 Dec 2024 03:05:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 14:02:14.753897
- Title: Unleashing the Potential of Model Bias for Generalized Category Discovery
- Title(参考訳): 一般化カテゴリー発見のためのモデルバイアスの可能性
- Authors: Wenbin An, Haonan Lin, Jiahao Nie, Feng Tian, Wenkai Shi, Yaqiang Wu, Qianying Wang, Ping Chen,
- Abstract要約: 一般化カテゴリー発見(Generalized Category Discovery)は、既知のカテゴリーと未定義のカテゴリの両方を特定することを目的とした重要なタスクである。
主な課題は、既知のカテゴリのみに対する事前学習によって引き起こされるモデルバイアスと、新しいカテゴリに対する正確な監督の欠如である。
本稿では,これらの課題に対処するため,SDC(Self-Debiasing)という新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 9.552403124453614
- License:
- Abstract: Generalized Category Discovery is a significant and complex task that aims to identify both known and undefined novel categories from a set of unlabeled data, leveraging another labeled dataset containing only known categories. The primary challenges stem from model bias induced by pre-training on only known categories and the lack of precise supervision for novel ones, leading to category bias towards known categories and category confusion among different novel categories, which hinders models' ability to identify novel categories effectively. To address these challenges, we propose a novel framework named Self-Debiasing Calibration (SDC). Unlike prior methods that regard model bias towards known categories as an obstacle to novel category identification, SDC provides a novel insight into unleashing the potential of the bias to facilitate novel category learning. Specifically, the output of the biased model serves two key purposes. First, it provides an accurate modeling of category bias, which can be utilized to measure the degree of bias and debias the output of the current training model. Second, it offers valuable insights for distinguishing different novel categories by transferring knowledge between similar categories. Based on these insights, SDC dynamically adjusts the output logits of the current training model using the output of the biased model. This approach produces less biased logits to effectively address the issue of category bias towards known categories, and generates more accurate pseudo labels for unlabeled data, thereby mitigating category confusion for novel categories. Experiments on three benchmark datasets show that SDC outperforms SOTA methods, especially in the identification of novel categories. Our code and data are available at \url{https://github.com/Lackel/SDC}.
- Abstract(参考訳): Generalized Category Discoveryは、既知のカテゴリのみを含む別のラベル付きデータセットを活用することで、ラベルなしデータの集合から既知のカテゴリと未定義の新規カテゴリの両方を識別することを目的とした、重要で複雑なタスクである。
主な課題は、既知のカテゴリのみに対する事前訓練によって引き起こされるモデルバイアスと、新しいカテゴリに対する正確な監督の欠如から生じ、既知のカテゴリに対するカテゴリーバイアスと、新しいカテゴリを効果的に識別するモデルの能力を妨げる新しいカテゴリ間のカテゴリ混乱に繋がる。
これらの課題に対処するため、我々はSDC(Self-Debiasing Calibration)という新しいフレームワークを提案する。
既知のカテゴリに対するモデルバイアスを、新しいカテゴリ識別の障害と見なす従来の方法とは異なり、SDCは、新しいカテゴリ学習を促進するためにバイアスの可能性を解き放つための新しい洞察を提供する。
具体的には、偏りのあるモデルの出力は2つの重要な目的を果たす。
まず、カテゴリーバイアスの正確なモデリングを提供し、これはバイアスの度合いを測定し、現在のトレーニングモデルの出力をデバイアスするために利用することができる。
第2に、類似のカテゴリ間で知識を伝達することで、異なる新しいカテゴリを区別するための貴重な洞察を提供する。
これらの知見に基づき、SDCはバイアスモデルの出力を用いて、現在のトレーニングモデルの出力ロジットを動的に調整する。
このアプローチは、既知のカテゴリに対するカテゴリバイアスの問題を効果的に解決するためにバイアスの少ないロジットを生成し、ラベルなしデータのより正確な擬似ラベルを生成し、新しいカテゴリのカテゴリ混乱を緩和する。
3つのベンチマークデータセットの実験により、SDCはSOTA法、特に新しいカテゴリの同定において優れていることが示された。
我々のコードとデータは \url{https://github.com/Lackel/SDC} で利用可能です。
関連論文リスト
- Solving the Catastrophic Forgetting Problem in Generalized Category Discovery [46.63232918739251]
Generalized Category Discovery (GCD)は、ラベルなしデータセット内の既知のカテゴリと新しいカテゴリの混合を識別することを目的としている。
最近の最先端手法SimGCDは、既知のクラスデータからの知識を、偏りのある学習を通して、新しいクラスの学習に転送する。
本稿では,従来の手法にシームレスに統合された新しい学習手法であるLegoGCDを提案する。
論文 参考訳(メタデータ) (2025-01-09T14:31:54Z) - Transfer and Alignment Network for Generalized Category Discovery [11.37283148391564]
一般カテゴリー発見(Generalized Category Discovery)は、現実世界における重要な課題である。
既知のカテゴリのパフォーマンスが向上したにもかかわらず、現在の手法は新しいカテゴリでは性能が良くない。
ラベル付きデータとラベルなしデータの間のバイアス付き知識伝達と、ラベルなしデータに対するノイズの多い表現学習である。
本稿では,2つの知識伝達機構を組み込んだ伝達・アライメントネットワーク(TAN)と,2つの特徴アライメント機構による識別的特徴の学習を提案する。
論文 参考訳(メタデータ) (2023-12-27T08:35:47Z) - Blueprinting the Future: Automatic Item Categorization using
Hierarchical Zero-Shot and Few-Shot Classifiers [6.907552533477328]
本研究では,ゼロショットおよび少数ショット生成事前学習変換器(GPT)を用いた階層的項目分類手法を提案する。
検査ブループリントの階層的な性質はシームレスにナビゲートされ、複数のレベルの項目を階層的に分類することができる。
人工データによる初期シミュレーションは、この方法の有効性を示し、F1スコアで測定された平均精度92.91%を達成する。
論文 参考訳(メタデータ) (2023-12-06T15:51:49Z) - Learn to Categorize or Categorize to Learn? Self-Coding for Generalized
Category Discovery [49.1865089933055]
テスト時に未知のカテゴリを発見できる新しい,効率的かつ自己管理手法を提案する。
このアプローチの健全な特徴は、個々のデータインスタンスに最小長のカテゴリコードの割り当てである。
試行錯誤による評価は, 提案手法の有効性を実証するものである。
論文 参考訳(メタデータ) (2023-10-30T17:45:32Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Generalized Category Discovery with Decoupled Prototypical Network [27.1635162759448]
Decoupled Prototypeal Network (DPN) と呼ばれる新しいモデルを提案する。
カテゴリプロトタイプの2部マッチング問題を定式化することにより、DPNは異なるトレーニング目標を効果的に達成することができる。
DPNは、SPL(Semantic-aware Prototypeal Learning)によって、既知のカテゴリと新しいカテゴリの両方のより差別的な特徴を学習することができる。
論文 参考訳(メタデータ) (2022-11-28T08:05:45Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Automatically Discovering Novel Visual Categories with Self-supervised
Prototype Learning [68.63910949916209]
本稿では,大規模な画像収集において未知のカテゴリを識別することを目的とした,新しいカテゴリ発見(NCD)の課題に取り組む。
本稿では,プロトタイプ表現学習とプロトタイプ自己学習という,2つの主要な段階からなる適応型プロトタイプ学習手法を提案する。
本研究では,4つのベンチマークデータセットについて広範な実験を行い,提案手法の有効性とロバスト性を示す。
論文 参考訳(メタデータ) (2022-08-01T16:34:33Z) - Novel Class Discovery without Forgetting [72.52222295216062]
我々は NCDwF: Novel Class Discovery without Forgetting の新たな実用的問題設定を特定し,定式化する。
ラベルのないデータから新しいカテゴリのインスタンスを段階的に発見する機械学習モデルを提案する。
CIFAR-10, CIFAR-100, ImageNet-1000に基づく実験プロトコルを導入し, 知識保持と新しいクラス発見のトレードオフを測定する。
論文 参考訳(メタデータ) (2022-07-21T17:54:36Z) - Class-incremental Novel Class Discovery [76.35226130521758]
クラス増進型新規クラス発見(class-iNCD)の課題について検討する。
基本クラスに関する過去の情報を忘れないようにする,クラスiNCDのための新しい手法を提案する。
3つの共通ベンチマークで実施した実験により,本手法が最先端の手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2022-07-18T13:49:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。