論文の概要: Rethinking annotation granularity for overcoming deep shortcut learning:
A retrospective study on chest radiographs
- arxiv url: http://arxiv.org/abs/2104.10553v1
- Date: Wed, 21 Apr 2021 14:21:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 14:16:05.979302
- Title: Rethinking annotation granularity for overcoming deep shortcut learning:
A retrospective study on chest radiographs
- Title(参考訳): 深部ショートカット学習を克服するためのアノテーションの粒度再考:胸部X線写真を用いた研究
- Authors: Luyang Luo, Hao Chen, Yongjie Xiao, Yanning Zhou, Xi Wang, Varut
Vardhanabhuti, Mingxiang Wu, Pheng-Ann Heng
- Abstract要約: 一般的な胸部疾患分類モデルであるCheXNetと胸部病変検出モデルであるCheXDetを比較した。
外部トレーニングデータを組み込むことで、chexnetのパフォーマンスが低下することさえわかった。
モデルの意思決定領域を可視化することにより,chexnetは対象病変以外のパターンを学習した。
- 参考スコア(独自算出の注目度): 43.43732218093039
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deep learning has demonstrated radiograph screening performances that are
comparable or superior to radiologists. However, recent studies show that deep
models for thoracic disease classification usually show degraded performance
when applied to external data. Such phenomena can be categorized into shortcut
learning, where the deep models learn unintended decision rules that can fit
the identically distributed training and test set but fail to generalize to
other distributions. A natural way to alleviate this defect is explicitly
indicating the lesions and focusing the model on learning the intended
features. In this paper, we conduct extensive retrospective experiments to
compare a popular thoracic disease classification model, CheXNet, and a
thoracic lesion detection model, CheXDet. We first showed that the two models
achieved similar image-level classification performance on the internal test
set with no significant differences under many scenarios. Meanwhile, we found
incorporating external training data even led to performance degradation for
CheXNet. Then, we compared the models' internal performance on the lesion
localization task and showed that CheXDet achieved significantly better
performance than CheXNet even when given 80% less training data. By further
visualizing the models' decision-making regions, we revealed that CheXNet
learned patterns other than the target lesions, demonstrating its shortcut
learning defect. Moreover, CheXDet achieved significantly better external
performance than CheXNet on both the image-level classification task and the
lesion localization task. Our findings suggest improving annotation granularity
for training deep learning systems as a promising way to elevate future deep
learning-based diagnosis systems for clinical usage.
- Abstract(参考訳): 深層学習は、放射線学者に匹敵する、あるいは優れた放射線検査性能を示す。
しかし,近年の研究では,胸部疾患分類の深部モデルでは,外部データに適用した場合の劣化がみられた。
このような現象はショートカット学習に分類され、深層モデルは同一の分散トレーニングとテストセットに適合するが、他の分布に一般化できない意図しない決定ルールを学ぶ。
この欠陥を緩和する自然な方法は、病変を明確に示し、モデルを意図した特徴を学ぶことに集中することである。
本稿では,一般的な胸部疾患分類モデルであるCheXNetと胸部病変検出モデルであるCheXDetを比較するために,広範囲にわたる振り返り実験を行った。
まず,この2つのモデルが内部テストセットで類似した画像レベルの分類性能を達成し,多くのシナリオにおいて有意な差は認められなかった。
一方、外部トレーニングデータを組み込むことで、chexnetのパフォーマンスが低下することさえわかった。
次に、病変局所化タスクにおけるモデルの内部性能を比較し、CheXDetが80%のトレーニングデータを与えられた場合でも、CheXNetよりも大幅にパフォーマンスが向上したことを示した。
モデルの意思決定領域をさらに可視化することにより,CheXNetは対象病変以外のパターンを学習し,その短絡学習欠陥を実証した。
さらに、画像レベルの分類タスクと病変局所化タスクの両方において、CheXDetはCheXNetよりもはるかに優れた外部パフォーマンスを実現した。
本研究は, 将来的な深層学習に基づく臨床応用診断システムを構築するために, 深層学習システム訓練のためのアノテーションの粒度向上を期待するものである。
関連論文リスト
- Comparative study of Deep Learning Models for Binary Classification on
Combined Pulmonary Chest X-ray Dataset [0.0]
DenseNet 121, DenseNet 169, DenseNet 201, EffecientNet b0, EffecientNet lite4, GoogleNet, MobileNet, ResNet18。
肺胸部X線画像データセットでは,他のモデルと異なる性能を示した。
論文 参考訳(メタデータ) (2023-09-16T11:58:04Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Improving Classification Model Performance on Chest X-Rays through Lung
Segmentation [63.45024974079371]
本稿では, セグメンテーションによる異常胸部X線(CXR)識別性能を向上させるための深層学習手法を提案する。
提案手法は,CXR画像中の肺領域を局所化するための深層ニューラルネットワーク(XLSor)と,大規模CXRデータセットで事前学習した自己教師あり運動量コントラスト(MoCo)モデルのバックボーンを用いたCXR分類モデルである。
論文 参考訳(メタデータ) (2022-02-22T15:24:06Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Interpretable COVID-19 Chest X-Ray Classification via Orthogonality
Constraint [10.190872613479632]
胸部X線画像からのCOVID-19症例の分類にOrthogonal Spheres(OS)制約を用いることの利点について検討した。
これまでの研究では、このような制約をディープラーニングモデルに適用する大きなメリットが実証されてきた。
提案手法は,2クラス・3クラス分類における精度を1.6%,4.8%向上させる。
論文 参考訳(メタデータ) (2021-02-02T11:35:28Z) - Advancing diagnostic performance and clinical usability of neural
networks via adversarial training and dual batch normalization [2.1699022621790736]
6人の放射線学者がX線、CT、磁気共鳴画像スキャンのデータセットにおける塩分濃度マップの解釈可能性を評価する。
その結果, 十分大きなデータセットと二重バッチノルムを用いた場合, 逆学習モデルの精度は標準モデルに等しいことがわかった。
論文 参考訳(メタデータ) (2020-11-25T20:41:01Z) - Learning Invariant Feature Representation to Improve Generalization
across Chest X-ray Datasets [55.06983249986729]
我々は、トレーニングデータと同じデータセットでテストすると、ディープラーニングモデルが、異なるソースからデータセットでテストされると、パフォーマンスが低下し始めることを示す。
対戦型トレーニング戦略を用いることで、ネットワークはソース不変表現を学習せざるを得ないことを示す。
論文 参考訳(メタデータ) (2020-08-04T07:41:15Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z) - Iteratively Pruned Deep Learning Ensembles for COVID-19 Detection in
Chest X-rays [3.785818062712446]
この病気は、SARS-CoV-2(SARS-CoV-2)ウイルスによって引き起こされる。
カスタム畳み込みニューラルネットワークとImageNet事前訓練モデルの選択を患者レベルでトレーニングし、評価する。
学習した知識は、パフォーマンスと一般化を改善するために伝達され、微調整される。
論文 参考訳(メタデータ) (2020-04-16T00:09:29Z) - An Adversarial Approach for the Robust Classification of Pneumonia from
Chest Radiographs [9.462808515258464]
ディープラーニングモデルは、しばしばデータセットシフトによるパフォーマンス損失を示す。
1つの病院システムからのデータを用いてトレーニングされたモデルは、同一病院のデータでテストすると高い予測性能を得るが、異なる病院システムでテストした場合は著しく悪化する。
我々は,共同創設者に依存しないより堅牢なモデルを学ぶことができる,逆最適化に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-13T03:49:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。