論文の概要: Keep It on a Leash: Controllable Pseudo-label Generation Towards Realistic Long-Tailed Semi-Supervised Learning
- arxiv url: http://arxiv.org/abs/2510.03993v1
- Date: Sun, 05 Oct 2025 01:52:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.377158
- Title: Keep It on a Leash: Controllable Pseudo-label Generation Towards Realistic Long-Tailed Semi-Supervised Learning
- Title(参考訳): リーシュに維持する: 現実的な長手半教師付き学習に向けた制御可能な擬似ラベル生成
- Authors: Yaxin Hou, Bo Han, Yuheng Jia, Hui Liu, Junhui Hou,
- Abstract要約: ラベル付きデータセットから信頼できる擬似ラベルでラベル付きデータセットを拡張するための制御可能な擬似ラベル生成(CPG)フレームワークを提案する。
CPGは制御可能な自己強化最適化サイクルを介して動作する。
CPGは一貫した改善を達成し、最先端の手法を最大で textbf15.97% の精度で上回っている。
- 参考スコア(独自算出の注目度): 88.48555005545694
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current long-tailed semi-supervised learning methods assume that labeled data exhibit a long-tailed distribution, and unlabeled data adhere to a typical predefined distribution (i.e., long-tailed, uniform, or inverse long-tailed). However, the distribution of the unlabeled data is generally unknown and may follow an arbitrary distribution. To tackle this challenge, we propose a Controllable Pseudo-label Generation (CPG) framework, expanding the labeled dataset with the progressively identified reliable pseudo-labels from the unlabeled dataset and training the model on the updated labeled dataset with a known distribution, making it unaffected by the unlabeled data distribution. Specifically, CPG operates through a controllable self-reinforcing optimization cycle: (i) at each training step, our dynamic controllable filtering mechanism selectively incorporates reliable pseudo-labels from the unlabeled dataset into the labeled dataset, ensuring that the updated labeled dataset follows a known distribution; (ii) we then construct a Bayes-optimal classifier using logit adjustment based on the updated labeled data distribution; (iii) this improved classifier subsequently helps identify more reliable pseudo-labels in the next training step. We further theoretically prove that this optimization cycle can significantly reduce the generalization error under some conditions. Additionally, we propose a class-aware adaptive augmentation module to further improve the representation of minority classes, and an auxiliary branch to maximize data utilization by leveraging all labeled and unlabeled samples. Comprehensive evaluations on various commonly used benchmark datasets show that CPG achieves consistent improvements, surpassing state-of-the-art methods by up to \textbf{15.97\%} in accuracy. The code is available at https://github.com/yaxinhou/CPG.
- Abstract(参考訳): 現在の長い尾を持つ半教師付き学習法では、ラベル付きデータは長い尾を持つ分布を示し、ラベル付きデータは典型的な事前定義された分布(例えば、長い尾を持つ、一様、逆の長い尾を持つ)に従うと仮定している。
しかし、ラベルなしデータの分布は一般に不明であり、任意の分布に従う可能性がある。
この課題に対処するために、ラベル付きデータセットをラベル付きデータセットから段階的に識別された信頼できる疑似ラベルで拡張し、更新されたラベル付きデータセット上のモデルを既知の分布でトレーニングする制御可能な擬似ラベル生成(CPG)フレームワークを提案する。
具体的には、CPGは制御可能な自己強化最適化サイクルを通している。
i) トレーニングの各ステップにおいて、動的制御可能なフィルタリング機構は、ラベル付きデータセットから信頼できる疑似ラベルをラベル付きデータセットに選択的に組み込んで、更新されたラベル付きデータセットが既知の分布に従うことを保証します。
(ii)更新されたラベル付きデータ分布に基づいてロジット調整を用いたベイズ最適分類器を構築する。
三 この改良された分類器は、次の訓練段階において、より信頼性の高い擬似ラベルを特定するのに役立ちます。
さらに、この最適化サイクルがいくつかの条件下での一般化誤差を著しく低減できることを理論的に証明する。
さらに、少数クラスの表現をさらに改善するためのクラス対応適応拡張モジュールと、ラベル付きおよびラベルなしの全てのサンプルを活用することでデータ利用を最大化するための補助ブランチを提案する。
様々な一般的なベンチマークデータセットに対する総合的な評価は、CPGが一貫した改善を達成し、最先端のメソッドを最大で textbf{15.97\%} の精度で上回っていることを示している。
コードはhttps://github.com/yaxinhou/CPG.comで公開されている。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - All Points Matter: Entropy-Regularized Distribution Alignment for
Weakly-supervised 3D Segmentation [67.30502812804271]
擬似ラベルは、弱い教師付き3Dセグメンテーションタスクに広く使われており、学習に使えるのはスパース・グラウンド・トラス・ラベルのみである。
本稿では,生成した擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭めるための新しい学習戦略を提案する。
論文 参考訳(メタデータ) (2023-05-25T08:19:31Z) - Revisiting Self-Training with Regularized Pseudo-Labeling for Tabular
Data [0.0]
我々は、勾配向上決定木を含むあらゆる種類のアルゴリズムに適用可能な自己学習を再考する。
疑似ラベルの可能性に基づいて信頼度を正則化する新しい擬似ラベル手法を提案する。
論文 参考訳(メタデータ) (2023-02-27T18:12:56Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - Re-distributing Biased Pseudo Labels for Semi-supervised Semantic
Segmentation: A Baseline Investigation [30.688753736660725]
疑似ラベルを生成するために,DARS法とDARS法を提案する。
我々の手法は最先端の手法と比較して好適に機能する。
論文 参考訳(メタデータ) (2021-07-23T14:45:14Z) - In Defense of Pseudo-Labeling: An Uncertainty-Aware Pseudo-label
Selection Framework for Semi-Supervised Learning [53.1047775185362]
Pseudo-labeling (PL) は一般的な SSL アプローチで、この制約はありませんが、当初の処方では比較的不十分です。
PLは不整合モデルからの誤った高い信頼度予測により性能が低下していると論じる。
そこで本研究では,疑似ラベリング精度を向上させるための不確実性認識型擬似ラベル選択(ups)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-15T23:29:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。