論文の概要: PLM: Partial Label Masking for Imbalanced Multi-label Classification
- arxiv url: http://arxiv.org/abs/2105.10782v1
- Date: Sat, 22 May 2021 18:07:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 15:16:49.524539
- Title: PLM: Partial Label Masking for Imbalanced Multi-label Classification
- Title(参考訳): PLM:不均衡なマルチラベル分類のための部分ラベルマスキング
- Authors: Kevin Duarte, Yogesh S. Rawat, Mubarak Shah
- Abstract要約: 長いラベルの分布を持つ実世界のデータセットで訓練されたニューラルネットワークは、頻繁なクラスに偏りがあり、頻繁なクラスでは不十分である。
本稿では,この比率を利用したPLM(Partial Label Masking)を提案する。
本手法は,マルチラベル (MultiMNIST と MSCOCO) とシングルラベル (CIFAR-10 と CIFAR-100) の2つの画像分類データセットにおいて,既存の手法と比較して高い性能を実現する。
- 参考スコア(独自算出の注目度): 59.68444804243782
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural networks trained on real-world datasets with long-tailed label
distributions are biased towards frequent classes and perform poorly on
infrequent classes. The imbalance in the ratio of positive and negative samples
for each class skews network output probabilities further from ground-truth
distributions. We propose a method, Partial Label Masking (PLM), which utilizes
this ratio during training. By stochastically masking labels during loss
computation, the method balances this ratio for each class, leading to improved
recall on minority classes and improved precision on frequent classes. The
ratio is estimated adaptively based on the network's performance by minimizing
the KL divergence between predicted and ground-truth distributions. Whereas
most existing approaches addressing data imbalance are mainly focused on
single-label classification and do not generalize well to the multi-label case,
this work proposes a general approach to solve the long-tail data imbalance
issue for multi-label classification. PLM is versatile: it can be applied to
most objective functions and it can be used alongside other strategies for
class imbalance. Our method achieves strong performance when compared to
existing methods on both multi-label (MultiMNIST and MSCOCO) and single-label
(imbalanced CIFAR-10 and CIFAR-100) image classification datasets.
- Abstract(参考訳): 長いラベル分布を持つ実世界のデータセットでトレーニングされたニューラルネットワークは、頻繁なクラスに偏り、不適切なクラスでパフォーマンスが低い。
各クラスにおける正と負のサンプルの比率の不均衡は、地上分布からさらにネットワーク出力確率を歪める。
本稿では,この比を訓練中に利用する部分ラベルマスキング(plm)法を提案する。
損失計算中にラベルを確率的にマスキングすることにより、各クラスに対するこの比率のバランスを保ち、マイノリティクラスのリコールを改善し、頻繁なクラスの精度を向上する。
予測分布と接地分布のkl発散を最小化することにより、ネットワークの性能に基づいてその比率を適応的に推定する。
データ不均衡に対処する既存のほとんどのアプローチは、主にシングルラベル分類に重点を置いており、マルチラベルの場合とよく一致しないが、本研究では、マルチラベル分類のためのロングテールデータ不均衡問題を解決するための一般的なアプローチを提案する。
PLMは汎用性があり、ほとんどの目的関数に適用でき、クラス不均衡のための他の戦略と併用することができる。
本手法は,マルチラベル (MultiMNIST と MSCOCO) とシングルラベル (CIFAR-10 と CIFAR-100 の両画像分類データセット) の既存手法と比較して高い性能を実現する。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - Exploring Vacant Classes in Label-Skewed Federated Learning [113.65301899666645]
クライアント間の局所的なラベル分布の相違を特徴とするラベルスキューは、連合学習において大きな課題となる。
本稿では, ラベルスキュード・フェデレート学習における新しい手法であるFedVLSについて紹介する。
論文 参考訳(メタデータ) (2024-01-04T16:06:31Z) - Flexible Distribution Alignment: Towards Long-tailed Semi-supervised Learning with Proper Calibration [18.376601653387315]
Longtailed semi-supervised learning (LTSSL)は、半教師付きアプリケーションのための実践的なシナリオである。
この問題は、ラベル付きとラベルなしのクラス分布の相違によってしばしば悪化する。
本稿では,新しい適応ロジット調整型損失フレームワークFlexDAを紹介する。
論文 参考訳(メタデータ) (2023-06-07T17:50:59Z) - Class-Imbalanced Complementary-Label Learning via Weighted Loss [8.934943507699131]
補完ラベル学習(Complementary-label Learning, CLL)は、弱い教師付き分類において広く用いられている。
クラス不均衡のトレーニングサンプルに直面すると、現実世界のデータセットでは大きな課題に直面します。
多クラス分類のためのクラス不均衡補完ラベルからの学習を可能にする新しい問題設定を提案する。
論文 参考訳(メタデータ) (2022-09-28T16:02:42Z) - Evolving Multi-Label Fuzzy Classifier [5.53329677986653]
マルチラベル分類は、同時に複数のクラスに1つのサンプルを割り当てるという問題に対処するために、機械学習コミュニティで多くの注目を集めている。
本稿では,新たなマルチラベルサンプルをインクリメンタルかつシングルパスで自己適応・自己展開可能な多ラベルファジィ分類器(EFC-ML)を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:01:03Z) - Learning from Label Proportions by Learning with Label Noise [30.7933303912474]
ラベル比例(LLP)からの学習は、データポイントをバッグに分類する弱い教師付き分類問題である。
ラベル雑音による学習の低減に基づくLLPに対する理論的基礎的なアプローチを提案する。
このアプローチは、複数のデータセットやアーキテクチャにわたるディープラーニングシナリオにおける経験的パフォーマンスの向上を実証する。
論文 参考訳(メタデータ) (2022-03-04T18:52:21Z) - Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced
Semi-Supervised Learning [80.05441565830726]
本稿では,疑似ラベルの重み付けがモデル性能に悪影響を及ぼすような,不均衡な半教師付き学習に対処する。
本稿では,この観測の動機となるバイアスに対処する,一般的な擬似ラベルフレームワークを提案する。
不均衡SSLのための新しい擬似ラベルフレームワークを、DASO(Distributed-Aware Semantics-Oriented Pseudo-label)と呼ぶ。
論文 参考訳(メタデータ) (2021-06-10T11:58:25Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - In Defense of Pseudo-Labeling: An Uncertainty-Aware Pseudo-label
Selection Framework for Semi-Supervised Learning [53.1047775185362]
Pseudo-labeling (PL) は一般的な SSL アプローチで、この制約はありませんが、当初の処方では比較的不十分です。
PLは不整合モデルからの誤った高い信頼度予測により性能が低下していると論じる。
そこで本研究では,疑似ラベリング精度を向上させるための不確実性認識型擬似ラベル選択(ups)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-15T23:29:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。