論文の概要: Unsupervised Learning for Class Distribution Mismatch
- arxiv url: http://arxiv.org/abs/2505.06948v1
- Date: Sun, 11 May 2025 11:29:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.127599
- Title: Unsupervised Learning for Class Distribution Mismatch
- Title(参考訳): クラス分散ミスマッチのための教師なし学習
- Authors: Pan Du, Wangbo Zhao, Xinai Lu, Nian Liu, Zhikai Li, Chaoyu Gong, Suyun Zhao, Hong Chen, Cuiping Li, Kai Wang, Yang You,
- Abstract要約: クラス分布ミスマッチ(英: Class Distribution mismatch、CDM)とは、訓練データにおけるクラス分布と目標タスクとの相違をいう。
ラベルのないデータから正負のペアを構成するUCDM(Unsupervised Learning for Class Distribution Mismatch)を提案する。
提案手法では,画像のランダムなサンプリングと拡散モデルを用いてセマンティッククラスや多様なトレーニングペアの追加や削除を行う。
- 参考スコア(独自算出の注目度): 35.94294492756003
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Class distribution mismatch (CDM) refers to the discrepancy between class distributions in training data and target tasks. Previous methods address this by designing classifiers to categorize classes known during training, while grouping unknown or new classes into an "other" category. However, they focus on semi-supervised scenarios and heavily rely on labeled data, limiting their applicability and performance. To address this, we propose Unsupervised Learning for Class Distribution Mismatch (UCDM), which constructs positive-negative pairs from unlabeled data for classifier training. Our approach randomly samples images and uses a diffusion model to add or erase semantic classes, synthesizing diverse training pairs. Additionally, we introduce a confidence-based labeling mechanism that iteratively assigns pseudo-labels to valuable real-world data and incorporates them into the training process. Extensive experiments on three datasets demonstrate UCDM's superiority over previous semi-supervised methods. Specifically, with a 60% mismatch proportion on Tiny-ImageNet dataset, our approach, without relying on labeled data, surpasses OpenMatch (with 40 labels per class) by 35.1%, 63.7%, and 72.5% in classifying known, unknown, and new classes.
- Abstract(参考訳): クラス分布ミスマッチ(英: Class Distribution mismatch、CDM)とは、訓練データにおけるクラス分布と目標タスクとの相違をいう。
以前のメソッドでは、トレーニング中に既知のクラスを分類するように分類器を設計し、未知のクラスや新しいクラスを"別の"カテゴリに分類することで、この問題に対処していた。
しかし、彼らは半教師付きシナリオに集中し、ラベル付きデータに強く依存し、適用性とパフォーマンスを制限した。
そこで本研究では,非ラベル付きデータから正負のペアを構成するUnsupervised Learning for Class Distribution Mismatch (UCDM)を提案する。
提案手法では,画像のランダムなサンプリングと拡散モデルを用いてセマンティッククラスの追加や削除を行い,多様なトレーニングペアを合成する。
さらに、疑似ラベルを価値ある現実世界のデータに反復的に割り当て、トレーニングプロセスに組み込む信頼に基づくラベリング機構を導入する。
3つのデータセットに対する大規模な実験は、以前の半教師付き手法よりもUCDMの方が優れていることを示している。
具体的には、Tiny-ImageNetデータセットの60%のミスマッチ比率で、ラベル付きデータに頼ることなく、OpenMatch(クラス毎に40のラベルを持つ)を35.1%、63.7%、72.5%で上回っている。
関連論文リスト
- Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - JointMatch: A Unified Approach for Diverse and Collaborative
Pseudo-Labeling to Semi-Supervised Text Classification [65.268245109828]
半教師付きテキスト分類(SSTC)は、ラベルのないデータを活用する能力によって注目を集めている。
擬似ラベルに基づく既存のアプローチは、擬似ラベルバイアスと誤り蓄積の問題に悩まされる。
我々は、最近の半教師付き学習からアイデアを統一することでこれらの課題に対処する、SSTCの総合的なアプローチであるJointMatchを提案する。
論文 参考訳(メタデータ) (2023-10-23T05:43:35Z) - On Non-Random Missing Labels in Semi-Supervised Learning [114.62655062520425]
Semi-Supervised Learning (SSL)は基本的にラベルの問題である。
SSL に "class" を明示的に組み込んでいます。
提案手法は,既存のベースラインを著しく上回るだけでなく,他のラベルバイアス除去SSL法を上回ります。
論文 参考訳(メタデータ) (2022-06-29T22:01:29Z) - Out-of-Distribution Detection without Class Labels [29.606812876314386]
異常検出方法は、データセットの正常な振る舞いから逸脱するサンプルを識別する。
現在の方法は、複数のクラスで構成されるがラベルを持たないトレーニングデータに直面すると苦労する。
まず,自己教師付き手法を用いて画像のクラスタ化を行い,各画像のクラスタラベルを取得する。
クラスタラベルによる画像の分類作業において,事前学習した特徴を微調整する。
論文 参考訳(メタデータ) (2021-12-14T18:58:32Z) - Improving Contrastive Learning on Imbalanced Seed Data via Open-World
Sampling [96.8742582581744]
我々は、Model-Aware K-center (MAK)と呼ばれるオープンワールドなラベルなしデータサンプリングフレームワークを提案する。
MAKは、尾性、近接性、多様性の3つの単純な原則に従う。
我々はMAKが学習した機能の全体的な表現品質とクラスバランス性の両方を継続的に改善できることを実証した。
論文 参考訳(メタデータ) (2021-11-01T15:09:41Z) - Re-distributing Biased Pseudo Labels for Semi-supervised Semantic
Segmentation: A Baseline Investigation [30.688753736660725]
疑似ラベルを生成するために,DARS法とDARS法を提案する。
我々の手法は最先端の手法と比較して好適に機能する。
論文 参考訳(メタデータ) (2021-07-23T14:45:14Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - Automatically Discovering and Learning New Visual Categories with
Ranking Statistics [145.89790963544314]
我々は,他のクラスをラベル付けした画像コレクションにおいて,新しいクラスを発見する問題に対処する。
汎用クラスタリングモデルを学び、後者を用いて、非競合データ中の新しいクラスを識別する。
我々は,標準分類ベンチマークに対するアプローチと,新しいカテゴリー発見法の性能を,有意なマージンで評価した。
論文 参考訳(メタデータ) (2020-02-13T18:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。