論文の概要: Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability
- arxiv url: http://arxiv.org/abs/2102.09616v1
- Date: Thu, 18 Feb 2021 21:14:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-22 13:18:23.723032
- Title: Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability
- Title(参考訳): 胸部CT画像を用いた深層学習型COVID-19肺炎分類:モデル一般化可能性
- Authors: Dan Nguyen, Fernando Kay, Jun Tan, Yulong Yan, Yee Seng Ng, Puneeth
Iyengar, Ron Peshock, Steve Jiang
- Abstract要約: 深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
- 参考スコア(独自算出の注目度): 54.86482395312936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Since the outbreak of the COVID-19 pandemic, worldwide research efforts have
focused on using artificial intelligence (AI) technologies on various medical
data of COVID-19-positive patients in order to identify or classify various
aspects of the disease, with promising reported results. However, concerns have
been raised over their generalizability, given the heterogeneous factors in
training datasets. This study aims to examine the severity of this problem by
evaluating deep learning (DL) classification models trained to identify
COVID-19-positive patients on 3D computed tomography (CT) datasets from
different countries. We collected one dataset at UT Southwestern (UTSW), and
three external datasets from different countries: CC-CCII Dataset (China),
COVID-CTset (Iran), and MosMedData (Russia). We divided the data into 2
classes: COVID-19-positive and COVID-19-negative patients. We trained nine
identical DL-based classification models by using combinations of the datasets
with a 72% train, 8% validation, and 20% test data split. The models trained on
a single dataset achieved accuracy/area under the receiver operating
characteristics curve (AUC) values of 0.87/0.826 (UTSW), 0.97/0.988 (CC-CCCI),
and 0.86/0.873 (COVID-CTset) when evaluated on their own dataset. The models
trained on multiple datasets and evaluated on a test set from one of the
datasets used for training performed better. However, the performance dropped
close to an AUC of 0.5 (random guess) for all models when evaluated on a
different dataset outside of its training datasets. Including the MosMedData,
which only contained positive labels, into the training did not necessarily
help the performance on the other datasets. Multiple factors likely contribute
to these results, such as patient demographics and differences in image
acquisition or reconstruction, causing a data shift among different study
cohorts.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)のパンデミックが流行して以来、世界中の研究は、新型コロナウイルス感染者のさまざまな医療データを人工知能(AI)技術で分析し、疾患のさまざまな側面を特定し分類することに注力してきた。
しかし、トレーニングデータセットの不均一な要素を考えると、その一般化性に関する懸念が持ち上がっている。
本研究は, 各国の3DCTデータセットを用いて, 深層学習(DL)分類モデルを用いて, 重症度を評価することを目的としている。
UTサウスウェスタン(UTSW)で1つのデータセットを収集し、CC-CCII Dataset(中国)、COVID-CTset(イラン)、MosMedData(ロシア)の3つの外部データセットを収集した。
データは、COVID-19陽性とCOVID-19陰性の2つのクラスに分けた。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
1つのデータセットでトレーニングされたモデルは、受信機動作特性曲線(AUC)の精度/領域を0.87/0.826(UTSW)、0.97/0.988(CC-CCCI)、0.86/0.873(COVID-CTset)と評価した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
しかし、トレーニングデータセット以外の異なるデータセットで評価すると、すべてのモデルに対するAUCは0.5(ランダムに推測される)に近づいた。
ポジティブなラベルのみを含むMosMedDataをトレーニングに含めることは、必ずしも他のデータセットのパフォーマンスに役立ちませんでした。
患者人口や画像取得や再構成の違いなど、複数の要因がこれらの結果に寄与し、異なる研究コホート間でデータシフトを引き起こしている。
関連論文リスト
- The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Virtual imaging trials improved the transparency and reliability of AI systems in COVID-19 imaging [1.6040478776985583]
本研究は、CTと胸部X線撮影(CXR)を用いた新型コロナウイルス診断における畳み込みニューラルネットワーク(CNN)の使用に焦点を当てる。
複数のAIモデル、すなわち3D ResNet-likeと2D EfficientNetv2アーキテクチャを開発し、テストした。
最も多様なデータセットでトレーニングされたモデルでは、AUCがCTで0.73から0.76、CXRで0.70から0.73まで、最高の外部テスト性能を示した。
論文 参考訳(メタデータ) (2023-08-17T19:12:32Z) - Evaluating Generalizability of Deep Learning Models Using
Indian-COVID-19 CT Dataset [5.398550081886242]
臨床環境でのCTスキャン画像の自動処理のためのma-chine learning (ML)アプローチは、公開されているCOVID-19データの限定的で偏りのあるサブセットに基づいて訓練される。
これにより、トレーニング中にモデルに見られない外部データセット上で、これらのモデルの一般化性に関する懸念が持ち上がった。
これらの問題に対処するために、この研究では、最も大きなパブリックリポジトリの1つから得られた確認されたCOVID-19データからのCTスキャン画像を用いて、機械学習モデルのトレーニングと内部バリデーションにCOVIDx CT 2Aを使用した。
論文 参考訳(メタデータ) (2022-12-28T16:23:18Z) - A Generalizable Artificial Intelligence Model for COVID-19
Classification Task Using Chest X-ray Radiographs: Evaluated Over Four
Clinical Datasets with 15,097 Patients [6.209420804714487]
トレーニングされたモデルの一般化性は、4つの異なる実世界の臨床データセットを用いて遡及的に評価された。
単一ソースの臨床データセットを使用してトレーニングされたAIモデルは、内部時間テストセットに適用すると、AUCが0.82に達した。
医療画像・データ資源センターが収集した多施設のCOVID-19データセットに適用すると、AUCは0.79に達した。
論文 参考訳(メタデータ) (2022-10-04T04:12:13Z) - The pitfalls of using open data to develop deep learning solutions for
COVID-19 detection in chest X-rays [64.02097860085202]
深層学習モデルは、胸部X線から新型コロナウイルスを識別するために開発された。
オープンソースデータのトレーニングやテストでは,結果は異例です。
データ分析とモデル評価は、人気のあるオープンソースデータセットであるCOVIDxが実際の臨床問題を代表していないことを示している。
論文 参考訳(メタデータ) (2021-09-14T10:59:11Z) - Systematic investigation into generalization of COVID-19 CT deep
learning models with Gabor ensemble for lung involvement scoring [9.94980188821453]
本研究は,COVID-19 CTデータを用いたキーパブリッシュモデルの一般化可能性について検討する。
次に、独立した新しいデータセットを使用して、新型コロナウイルスの重症度に関するこれらのモデルの予測能力を評価する。
論文 参考訳(メタデータ) (2021-04-20T03:49:48Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Federated Semi-Supervised Learning for COVID Region Segmentation in
Chest CT using Multi-National Data from China, Italy, Japan [14.776338073000526]
新型コロナウイルスはSARS-CoV-2感染の診断と管理に緊急に必要なものとなっている。
近年の取り組みはコンピュータによる特徴付けと診断に重点を置いている。
臨床データセンター間のデータのドメインシフトは、学習ベースのモデルをデプロイする際に深刻な課題となる。
論文 参考訳(メタデータ) (2020-11-23T21:51:26Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。