論文の概要: A novel method to enhance pneumonia detection via a model-level
ensembling of CNN and vision transformer
- arxiv url: http://arxiv.org/abs/2401.02358v1
- Date: Thu, 4 Jan 2024 16:58:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-05 14:32:45.683682
- Title: A novel method to enhance pneumonia detection via a model-level
ensembling of CNN and vision transformer
- Title(参考訳): CNNと視覚変換器のモデルレベルアンサンブルによる新規肺炎検出法
- Authors: Sandeep Angara, Nishith Reddy Mannuru, Aashrith Mannuru, Sharath
Thirunagaru
- Abstract要約: 肺炎は世界中で致死率と死亡率の主要な原因である。
深層学習は胸部X線(CXR)画像から肺炎を検出する大きな可能性を示している。
我々は,モデルレベルのアンサンブルにより,畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマーネットワークを融合させる新しいモデルを開発した。
- 参考スコア(独自算出の注目度): 0.7499722271664147
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pneumonia remains a leading cause of morbidity and mortality worldwide. Chest
X-ray (CXR) imaging is a fundamental diagnostic tool, but traditional analysis
relies on time-intensive expert evaluation. Recently, deep learning has shown
immense potential for automating pneumonia detection from CXRs. This paper
explores applying neural networks to improve CXR-based pneumonia diagnosis. We
developed a novel model fusing Convolution Neural networks (CNN) and Vision
Transformer networks via model-level ensembling. Our fusion architecture
combines a ResNet34 variant and a Multi-Axis Vision Transformer small model.
Both base models are initialized with ImageNet pre-trained weights. The output
layers are removed, and features are combined using a flattening layer before
final classification. Experiments used the Kaggle pediatric pneumonia dataset
containing 1,341 normal and 3,875 pneumonia CXR images. We compared our model
against standalone ResNet34, Vision Transformer, and Swin Transformer Tiny
baseline models using identical training procedures. Extensive data
augmentation, Adam optimization, learning rate warmup, and decay were employed.
The fusion model achieved a state-of-the-art accuracy of 94.87%, surpassing the
baselines. We also attained excellent sensitivity, specificity, kappa score,
and positive predictive value. Confusion matrix analysis confirms fewer
misclassifications. The ResNet34 and Vision Transformer combination enables
jointly learning robust features from CNNs and Transformer paradigms. This
model-level ensemble technique effectively integrates their complementary
strengths for enhanced pneumonia classification.
- Abstract(参考訳): 肺炎は世界中で主要な死因であり、死亡率も高い。
胸部X線画像(CXR)は基本的な診断ツールであるが、従来の分析は時間集約的な専門家評価に依存している。
近年, 深層学習はCXRによる肺炎検出の自動化に大きな可能性を秘めている。
本稿ではCXRによる肺炎の診断を改善するためにニューラルネットワークを適用した。
畳み込みニューラルネットワーク(cnn)と視覚トランスフォーマーネットワークをモデルレベルセンスリングで融合した新しいモデルを開発した。
我々の融合アーキテクチャはResNet34変種とMulti-Axis Vision Transformer小モデルを組み合わせたものである。
両方のベースモデルは、ImageNetで事前訓練されたウェイトで初期化される。
出力層を除去し、最終分類の前に平坦層を用いて特徴を結合する。
1,341枚の正常および3,875個の肺炎cxr画像を含むカグル小児肺炎データセットを用いた。
我々は,スタンドアロンのResNet34,Vision Transformer,Swin Transformer Tinyのベースラインモデルと比較した。
広範なデータ拡張、adam最適化、学習率ウォームアップ、減衰が採用された。
融合モデルは94.87%の精度を達成し、ベースラインを上回った。
また,優れた感度,特異性,kappaスコア,正の予測値を得た。
融合行列解析は誤分類を減らす。
ResNet34とVision Transformerの組み合わせにより、CNNとTransformerのパラダイムから堅牢な機能を学ぶことができる。
このモデルレベルのアンサンブル技術は肺炎の分類に補完的な強みを効果的に統合する。
関連論文リスト
- Brain Tumor Classification on MRI in Light of Molecular Markers [61.77272414423481]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - Efficient and Accurate Pneumonia Detection Using a Novel Multi-Scale Transformer Approach [1.2233362977312945]
胸部X線からの肺炎検出を促進するために,ディープラーニングとトランスフォーマーに基づく注意機構を組み合わせた新しいアプローチを提案する。
本手法は,トランスUNetモデルを用いて肺のセグメンテーションから開始する。
提案手法は,Kermanyデータセットで92.79%,Cohenデータセットで95.11%の精度を達成する。
論文 参考訳(メタデータ) (2024-08-08T08:06:42Z) - Pneumonia Detection on chest X-ray images Using Ensemble of Deep
Convolutional Neural Networks [7.232767871756102]
本稿では, 胸部X線画像の診断過程を簡略化するために, EL(Ensemble Learning) と呼ばれるコンピュータ支援型肺炎分類法を提案する。
提案手法は,CNNモデルをスクラッチからトレーニングする代わりに,近年,多くの医療タスクのパフォーマンス向上に採用されているCNNモデルである畳み込みニューラルネットワーク(Convolutional Neural Network, CNN)モデルに基づく。
提案したELアプローチは他の最先端手法よりも優れており、テスト段階では93.91%、F1スコアは93.88%の精度が得られる。
論文 参考訳(メタデータ) (2023-12-13T08:28:21Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Vision Transformer-based Model for Severity Quantification of Lung
Pneumonia Using Chest X-ray Images [11.12596879975844]
我々は、新型コロナウイルスや他の肺疾患の重症度を定量化するために、少数のトレーニング可能なパラメータに依存するビジョントランスフォーマーベースのニューラルネットワークモデルを提案する。
本モデルでは,比較的低い計算コストで高一般化性で重大度を定量化する上で,ピーク性能を提供することができる。
論文 参考訳(メタデータ) (2023-03-18T12:38:23Z) - Unsupervised Contrastive Learning based Transformer for Lung Nodule
Detection [6.693379403133435]
CTによる肺結節の早期発見は,肺癌患者の長期生存と生活の質の向上に不可欠である。
CAD (Computer-Aided Detection/diagnosis) はこの文脈において第2または同時読影器として有用である。
肺結節の正確な検出は、サイズ、位置、および肺結節の出現のばらつきにより、CADシステムや放射線技師にとって依然として困難である。
近年のコンピュータビジョン技術に触発されて,肺結節を同定するための自己教師付き領域ベース3次元トランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2022-04-30T01:19:00Z) - Wide & Deep neural network model for patch aggregation in CNN-based
prostate cancer detection systems [51.19354417900591]
前立腺癌(PCa)は、2020年に約141万件の新規感染者と約37万5000人の死者を出した男性の死因の1つである。
自動診断を行うには、まず前立腺組織サンプルをギガピクセル分解能全スライド画像にデジタイズする。
パッチと呼ばれる小さなサブイメージが抽出され、予測され、パッチレベルの分類が得られる。
論文 参考訳(メタデータ) (2021-05-20T18:13:58Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - A Multi-Stage Attentive Transfer Learning Framework for Improving
COVID-19 Diagnosis [49.3704402041314]
新型コロナの診断を改善するための多段階集中移動学習フレームワークを提案する。
提案するフレームワークは、複数のソースタスクと異なるドメインのデータから知識を学習し、正確な診断モデルを訓練する3つの段階からなる。
本稿では,肺CT画像のマルチスケール表現を学習するための自己教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-01-14T01:39:19Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - Detection of Coronavirus (COVID-19) Associated Pneumonia based on
Generative Adversarial Networks and a Fine-Tuned Deep Transfer Learning Model
using Chest X-ray Dataset [4.664495510551646]
本稿では, 限られたデータセットに対して, 微調整深層移動学習を施したGANを用いた肺炎胸部X線検出法を提案する。
この研究で使用されるデータセットは、正常と肺炎の2つのカテゴリを持つ5863のX線画像で構成されている。
論文 参考訳(メタデータ) (2020-04-02T08:14:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。