論文の概要: Correcting Data Imbalance for Semi-Supervised Covid-19 Detection Using
X-ray Chest Images
- arxiv url: http://arxiv.org/abs/2008.08496v2
- Date: Thu, 20 Aug 2020 20:53:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 09:16:44.710293
- Title: Correcting Data Imbalance for Semi-Supervised Covid-19 Detection Using
X-ray Chest Images
- Title(参考訳): X線胸部画像を用いた半監督型Covid-19検出のための補正データ不均衡
- Authors: Saul Calderon-Ramirez, Shengxiang-Yang, Armaghan Moemeni, David
Elizondo, Simon Colreavy-Donnelly, Luis Fernando Chavarria-Estrada, Miguel A.
Molina-Cabello
- Abstract要約: 半教師付きディープラーニングアーキテクチャMixMatchの性能評価を行った。
新しいデータセットは、コスタリカの成人患者の胸部X線画像からなる検証データセットに含まれる。
- 参考スコア(独自算出の注目度): 4.1950566803514935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Corona Virus (COVID-19) is an internationalpandemic that has quickly
propagated throughout the world. The application of deep learning for image
classification of chest X-ray images of Covid-19 patients, could become a novel
pre-diagnostic detection methodology. However, deep learning architectures
require large labelled datasets. This is often a limitation when the subject of
research is relatively new as in the case of the virus outbreak, where dealing
with small labelled datasets is a challenge. Moreover, in the context of a new
highly infectious disease, the datasets are also highly imbalanced,with few
observations from positive cases of the new disease. In this work we evaluate
the performance of the semi-supervised deep learning architecture known as
MixMatch using a very limited number of labelled observations and highly
imbalanced labelled dataset. We propose a simple approach for correcting data
imbalance, re-weight each observationin the loss function, giving a higher
weight to the observationscorresponding to the under-represented class. For
unlabelled observations, we propose the usage of the pseudo and augmentedlabels
calculated by MixMatch to choose the appropriate weight. The MixMatch method
combined with the proposed pseudo-label based balance correction improved
classification accuracy by up to 10%, with respect to the non balanced MixMatch
algorithm, with statistical significance. We tested our proposed approach with
several available datasets using 10, 15 and 20 labelledobservations.
Additionally, a new dataset is included among thetested datasets, composed of
chest X-ray images of Costa Rican adult patients
- Abstract(参考訳): コロナウイルス(covid-19)は、世界中で急速に伝播した国際パンデミックである。
Covid-19患者の胸部X線画像の画像分類におけるディープラーニングの応用は、新しい診断前検出法となる可能性がある。
しかし、ディープラーニングアーキテクチャは大きなラベル付きデータセットを必要とする。
新型コロナウイルスの流行が比較的新しい研究対象の場合、小さなラベル付きデータセットを扱うことが課題となる場合、これはしばしば制限となる。
さらに、新たな高感染性疾患の文脈では、データセットは極めて不均衡であり、新しい疾患の陽性例からはほとんど観察されていない。
本研究では,MixMatchと呼ばれる半教師付きディープラーニングアーキテクチャの性能を,非常に限られたラベル付き観測と高度に不均衡なラベル付きデータセットを用いて評価する。
本稿では,データ不均衡を補正する簡単な手法を提案し,損失関数の観測値を再重み付けし,下級クラスに対応する観測値に高い重みを与える。
ラベルなしの観察では,mixmatch が計算した擬似ラベルと拡張ラベルを用いて適切な重みを求める。
MixMatch法と疑似ラベルに基づくバランス補正法を組み合わせることで、非バランスのMixMatchアルゴリズムに対して、統計的に有意な分類精度が最大10%向上した。
提案手法を10,15,20のラベル付きオブザーバを使用して,利用可能なデータセットでテストした。
さらに、コスタリカ成人患者の胸部X線画像からなる検査データセットに新しいデータセットが含まれている。
関連論文リスト
- A Semi-Supervised Algorithm for Improving the Consistency of
Crowdsourced Datasets: The COVID-19 Case Study on Respiratory Disorder
Classification [4.431270735024064]
聴覚信号の分類は、新型コロナウイルス(COVID-19)などの呼吸器疾患のスクリーニングに有用なツールである。
多くの研究チームは、COUGHVIDデータセットを生成するために行われたように、音声データを素早く収集するためにクラウドソーシングに移行した。
COUGHVIDデータセットは、専門家の医師に、限られた数のアップロードされた記録に存在する基礎疾患の診断を依頼した。
この研究は、半教師付き学習(SSL)アプローチを使用して、COUGHVIDデータセットのラベル付け一貫性を改善し、新型コロナウイルスの健全な音分類に対する堅牢性を向上させる。
論文 参考訳(メタデータ) (2022-09-09T15:44:26Z) - Information Gain Sampling for Active Learning in Medical Image
Classification [3.1619162190378787]
本研究は,ラベル付け対象プールからの最適な画像選択を誘導する情報理論のアクティブラーニングフレームワークを提案する。
2つの異なる医用画像分類データセットで実験を行う。
論文 参考訳(メタデータ) (2022-08-01T16:25:53Z) - Self-Supervised Learning as a Means To Reduce the Need for Labeled Data
in Medical Image Analysis [64.4093648042484]
胸部X線画像のデータセットとバウンディングボックスラベルを用いて,13種類の異常の分類を行った。
ラベル付きデータの平均精度と精度を60%に抑えることで,完全教師付きモデルと同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:20:30Z) - Weakly-supervised Generative Adversarial Networks for medical image
classification [1.479639149658596]
Weakly-Supervised Generative Adversarial Networks (WSGAN) と呼ばれる新しい医用画像分類アルゴリズムを提案する。
WSGANは、ラベルのない少数の実画像のみを使用して、偽画像やマスク画像を生成し、トレーニングセットのサンプルサイズを拡大する。
ラベル付きデータやラベルなしデータの少ない使用により,WSGANは比較的高い学習性能が得られることを示す。
論文 参考訳(メタデータ) (2021-11-29T15:38:48Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Dealing with Distribution Mismatch in Semi-supervised Deep Learning for
Covid-19 Detection Using Chest X-ray Images: A Novel Approach Using Feature
Densities [0.6882042556551609]
半教師付きディープラーニングは、大きなラベル付きデータセットの魅力的な代替手段である。
実世界の使用状況設定では、ラベル付きデータセットとは異なる分布を示す可能性がある。
これにより、ラベル付きデータセットとラベル付きデータセットの分散ミスマッチが発生します。
論文 参考訳(メタデータ) (2021-08-17T00:35:43Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - RCoNet: Deformable Mutual Information Maximization and High-order
Uncertainty-aware Learning for Robust COVID-19 Detection [12.790651338952005]
2019年のコロナウイルス(COVID-19)感染は世界中に広まり、現在、世界中で大きな医療課題となっている。
胸部X線(CXR)画像中のCOVID-19の検出はCTよりも高速で低コストであり, 診断, 評価, 治療に有用である。
Em Deformable Mutual Information Maximization (DeIM), em Mixed High-order Moment Feature (MMMF) と em Multi- を併用した,ロバストな COVID-19 検出のための新しいディープネットワークである em RCoNet$k_s$ を提案する。
論文 参考訳(メタデータ) (2021-02-22T15:13:42Z) - Improved Slice-wise Tumour Detection in Brain MRIs by Computing
Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。
本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。
本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-24T14:02:09Z) - Multi-label Thoracic Disease Image Classification with Cross-Attention
Networks [65.37531731899837]
胸部X線画像から胸部疾患を自動分類するためのCAN(Cross-Attention Networks)を提案する。
また,クロスエントロピー損失を超える新たな損失関数を設計し,クラス間の不均衡を克服する。
論文 参考訳(メタデータ) (2020-07-21T14:37:00Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。