論文の概要: Highly Efficient Representation and Active Learning Framework for
Imbalanced Data and its Application to COVID-19 X-Ray Classification
- arxiv url: http://arxiv.org/abs/2103.05109v2
- Date: Thu, 18 Mar 2021 21:26:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 00:49:51.606071
- Title: Highly Efficient Representation and Active Learning Framework for
Imbalanced Data and its Application to COVID-19 X-Ray Classification
- Title(参考訳): 不均衡データのための高能率表現とアクティブラーニングフレームワークとそのCOVID-19 X線分類への応用
- Authors: Heng Hao, Sima Didari, Jae Oh Woo, Hankyu Moon, and Patrick Bangert
- Abstract要約: 胸部X線を分類するためのデータ効率の高い分類および能動的学習フレームワークを提案する。
これは(1)畳み込みニューラルネットワークの教師なし表現学習と(2)ガウス過程法に基づいている。
利用可能なラベルのトレーニングから正確性に到達するには、ラベル付きデータの10%の$simしか必要ありません。
- 参考スコア(独自算出の注目度): 0.7829352305480284
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We propose a highly data-efficient classification and active learning
framework for classifying chest X-rays. It is based on (1) unsupervised
representation learning of a Convolutional Neural Network and (2) the Gaussian
Process method. The unsupervised representation learning employs
self-supervision that does not require class labels, and the learned features
are proven to achieve label-efficient classification. GP is a kernel-based
Bayesian approach that also leads to data-efficient predictions with the added
benefit of estimating each decision's uncertainty. Our novel framework combines
these two elements in sequence to achieve highly data and label efficient
classifications. Moreover, both elements are less sensitive to the prevalent
and challenging class imbalance issue, thanks to the (1) feature learned
without labels and (2) the Bayesian nature of GP. The GP-provided uncertainty
estimates enable active learning by ranking samples based on the uncertainty
and selectively labeling samples showing higher uncertainty. We apply this
novel combination to the data-deficient and severely imbalanced case of
COVID-19 chest X-ray classification. We demonstrate that only $\sim 10\%$ of
the labeled data is needed to reach the accuracy from training all available
labels. Its application to the COVID-19 data in a fully supervised
classification scenario shows that our model, with a generic ResNet backbone,
outperforms (COVID-19 case by 4\%) the state-of-the-art model with a highly
tuned architecture. Our model architecture and proposed framework are general
and straightforward to apply to a broader class of datasets, with expected
success.
- Abstract(参考訳): 胸部X線を分類するためのデータ効率の高い分類および能動的学習フレームワークを提案する。
これは(1)畳み込みニューラルネットワークの教師なし表現学習と(2)ガウス過程法に基づいている。
教師なし表現学習では、クラスラベルを必要としない自己スーパービジョンを採用しており、学習した特徴はラベル効率のよい分類を実現することが証明されている。
gpはカーネルベースのベイズアプローチであり、各決定の不確かさを推定することでデータ効率のよい予測を可能にする。
提案手法は,これら2つの要素を連続的に組み合わせ,高度データとラベルの効率的な分類を実現する。
さらに,(1)ラベル無しで学習した特徴と(2)gpのベイズ的性質により,両要素ともクラス不均衡問題に対する感受性が低下する。
GPによる不確実性推定は、不確実性に基づいてサンプルをランク付けし、高い不確実性を示すサンプルを選択的にラベル付けすることで、アクティブな学習を可能にする。
この新しい組み合わせは、新型コロナウイルスの胸部x線分類におけるデータ不足と深刻な不均衡に応用する。
すべてのラベルのトレーニングから正確性に到達するためには、ラベル付きデータの$\sim 10\%$だけが必要であることを実証する。
完全に管理された分類シナリオにおけるCOVID-19データへの適用は、私たちのモデルが、一般的なResNetのバックボーンによって、高度に調整されたアーキテクチャを備えた最先端モデル(COVID-19のケースは4\%)を上回っていることを示している。
我々のモデルアーキテクチャと提案されたフレームワークは、より広範なデータセットのクラスに適用し、期待される成功を収める。
関連論文リスト
- Memory Consistency Guided Divide-and-Conquer Learning for Generalized
Category Discovery [56.172872410834664]
一般カテゴリー発見(GCD)は、半教師付き学習のより現実的で挑戦的な設定に対処することを目的としている。
メモリ一貫性を誘導する分枝・分枝学習フレームワーク(MCDL)を提案する。
本手法は,画像認識の目に見えるクラスと見えないクラスの両方において,最先端のモデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-01-24T09:39:45Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - NorMatch: Matching Normalizing Flows with Discriminative Classifiers for
Semi-Supervised Learning [8.749830466953584]
Semi-Supervised Learning (SSL)は、小さなラベル付きセットと大量のラベルなしデータを使ってモデルを学習することを目的としている。
この作業では、NorMatchというSSLの新しいフレームワークを紹介します。
数値的および視覚的な結果を通して、NorMatchはいくつかのデータセットで最先端のパフォーマンスを達成することを実証する。
論文 参考訳(メタデータ) (2022-11-17T15:39:18Z) - 2nd Place Solution for ICCV 2021 VIPriors Image Classification
Challenge: An Attract-and-Repulse Learning Approach [41.346232387426944]
畳み込みニューラルネットワーク(CNN)は、大規模なデータセットを利用することで、画像分類において大きな成功を収めた。
特徴表現を豊かにするContrastive Regularization(CR)と、異なるクラスに対する適合性のバランスをとるSymmetric Cross Entropy(SCE)からなるAttract-and-Repulseを提案する。
具体的には、SCEとCRは、クラス(トラクション)とインスタンス(リパルス)の情報間の適応的トレードオフによる過度な適合を緩和しながら、識別表現を学習する。
論文 参考訳(メタデータ) (2022-06-13T13:54:33Z) - Robust Neural Network Classification via Double Regularization [2.41710192205034]
本稿では、分類モデルの複雑さに対するペナルティと、学習観察の最適な再重み付けを組み合わせた、ニューラルネットワークトレーニング損失の新しい二重正則化を提案する。
我々は, (i) MNIST と (ii) CIFAR-10 のニューラルネット分類のための DRFit について, 両者の相違点について実証した。
論文 参考訳(メタデータ) (2021-12-15T13:19:20Z) - Boosting Active Learning via Improving Test Performance [35.9303900799961]
勾配ノルムの高いラベル付きデータを選択すると、テスト損失の上限が低くなることを示す。
本稿では,期待次数とエントロピー次数という2つのスキームを提案する。
本手法は最先端技術に対して優れた性能を発揮する。
論文 参考訳(メタデータ) (2021-12-10T17:25:14Z) - Self-Supervised Class Incremental Learning [51.62542103481908]
既存のクラスインクリメンタルラーニング(CIL)手法は、データラベルに敏感な教師付き分類フレームワークに基づいている。
新しいクラスデータに基づいて更新する場合、それらは破滅的な忘れがちである。
本稿では,SSCILにおける自己指導型表現学習のパフォーマンスを初めて考察する。
論文 参考訳(メタデータ) (2021-11-18T06:58:19Z) - SCARF: Self-Supervised Contrastive Learning using Random Feature
Corruption [72.35532598131176]
本稿では,特徴のランダムなサブセットを乱してビューを形成するコントラスト学習手法であるSCARFを提案する。
SCARFは既存の戦略を補完し、オートエンコーダのような代替手段より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-29T08:08:33Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Unified Robust Training for Graph NeuralNetworks against Label Noise [12.014301020294154]
半監督設定でノイズの多いラベルをグラフ上で学習するための新しいフレームワークである UnionNET を提案します。
提案手法は,GNNを頑健に訓練し,ラベル修正を同時に行うための統一的なソリューションを提供する。
論文 参考訳(メタデータ) (2021-03-05T01:17:04Z) - CoMatch: Semi-supervised Learning with Contrastive Graph Regularization [86.84486065798735]
CoMatchは、支配的なアプローチを統一する、新しい半教師付き学習手法である。
複数のデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-11-23T02:54:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。