論文の概要: Semi-supervised Long-tailed Recognition using Alternate Sampling
- arxiv url: http://arxiv.org/abs/2105.00133v1
- Date: Sat, 1 May 2021 00:43:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-06 04:38:43.071939
- Title: Semi-supervised Long-tailed Recognition using Alternate Sampling
- Title(参考訳): オルタナトサンプリングを用いた半教師付きロングテール認識
- Authors: Bo Liu, Haoxiang Li, Hao Kang, Nuno Vasconcelos, Gang Hua
- Abstract要約: ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
- 参考スコア(独自算出の注目度): 95.93760490301395
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Main challenges in long-tailed recognition come from the imbalanced data
distribution and sample scarcity in its tail classes. While techniques have
been proposed to achieve a more balanced training loss and to improve tail
classes data variations with synthesized samples, we resort to leverage readily
available unlabeled data to boost recognition accuracy. The idea leads to a new
recognition setting, namely semi-supervised long-tailed recognition. We argue
this setting better resembles the real-world data collection and annotation
process and hence can help close the gap to real-world scenarios. To address
the semi-supervised long-tailed recognition problem, we present an alternate
sampling framework combining the intuitions from successful methods in these
two research areas. The classifier and feature embedding are learned separately
and updated iteratively. The class-balanced sampling strategy has been
implemented to train the classifier in a way not affected by the pseudo labels'
quality on the unlabeled data. A consistency loss has been introduced to limit
the impact from unlabeled data while leveraging them to update the feature
embedding. We demonstrate significant accuracy improvements over other
competitive methods on two datasets.
- Abstract(参考訳): ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
よりバランスの取れたトレーニング損失を達成し、合成サンプルによるテールクラスのデータ変動を改善する技術が提案されているが、容易に利用可能なラベルなしデータを活用することで認識精度を向上させる。
このアイデアは、半教師付きロングテール認識という新しい認識設定につながる。
この設定は現実世界のデータ収集やアノテーションのプロセスによく似ており、現実のシナリオとのギャップを埋めるのに役立ちます。
半教師付きロングテール認識問題に対処するため,この2つの研究分野における手法の直感と組み合わせた代替サンプリングフレームワークを提案する。
分類器と特徴埋め込みは別々に学習され、反復的に更新される。
非ラベルデータにおける擬似ラベルの品質に影響されない方法で分類器を訓練するために、クラスバランスサンプリング戦略を実装した。
ラベルのないデータの影響を制限し、機能の埋め込みを更新できる一貫性の損失が導入された。
2つのデータセットにおいて,他の競合手法よりも精度が大幅に向上することを示す。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - Learning from Noisy Labels for Long-tailed Data via Optimal Transport [2.8821062918162146]
本稿では,長周期分布と雑音ラベルの両方を特徴とするデータ管理手法を提案する。
そこで我々は,半教師付き学習方式で擬似ラベルを生成するために,最適な輸送戦略を採用した。
論文 参考訳(メタデータ) (2024-08-07T14:15:18Z) - Fairness Improves Learning from Noisily Labeled Long-Tailed Data [119.0612617460727]
長い尾とノイズの多いラベル付きデータは、現実世界のアプリケーションに頻繁に現れ、学習に重大な課題を課す。
2つのサブポピュレーション間のパフォーマンスギャップを正規化することから着想を得たFairness Regularizer(FR)を導入する。
導入したフェアネス正則化器は,尾部のサブポピュレーションと全体的な学習性能を向上することを示す。
論文 参考訳(メタデータ) (2023-03-22T03:46:51Z) - Learning with Noisy labels via Self-supervised Adversarial Noisy Masking [33.87292143223425]
対向雑音マスキングと呼ばれる新しいトレーニング手法を提案する。
入力データとラベルを同時に調整し、ノイズの多いサンプルが過度に収まらないようにする。
合成および実世界のノイズデータセットの両方でテストされる。
論文 参考訳(メタデータ) (2023-02-14T03:13:26Z) - SoftMatch: Addressing the Quantity-Quality Trade-off in Semi-supervised
Learning [101.86916775218403]
本稿では, サンプル重み付けを統一した定式化により, 一般的な擬似ラベル法を再検討する。
トレーニング中の擬似ラベルの量と質を両立させることでトレードオフを克服するSoftMatchを提案する。
実験では、画像、テキスト、不均衡な分類など、さまざまなベンチマークで大幅に改善されている。
論文 参考訳(メタデータ) (2023-01-26T03:53:25Z) - Contrastive Regularization for Semi-Supervised Learning [46.020125061295886]
そこで本稿では, ラベルのないデータの特徴量により, 整合正則化の効率性と精度を両立させるために, 対照的な正則化を提案する。
また,提案手法は,ラベルなしデータに分布しないサンプルを含むオープンセット半教師付き学習において,頑健な性能を示す。
論文 参考訳(メタデータ) (2022-01-17T07:20:11Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - BiSTF: Bilateral-Branch Self-Training Framework for Semi-Supervised
Large-scale Fine-Grained Recognition [28.06659482245647]
半教師付きファイングラインド認識は、データ不均衡、高いクラス間類似性、ドメインミスマッチによる課題である。
本稿では,バイラテラルブランチ・セルフトレーニング・フレームワーク (Bilateral-Branch Self-Training Framework, BiSTF) を提案する。
BiSTFはSemi-iNatデータセット上で既存の最先端SSLよりも優れています。
論文 参考訳(メタデータ) (2021-07-14T15:28:54Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。