論文の概要: Comparative Analysis of Vision Transformers and Traditional Deep Learning Approaches for Automated Pneumonia Detection in Chest X-Rays
- arxiv url: http://arxiv.org/abs/2507.10589v1
- Date: Fri, 11 Jul 2025 16:26:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:02.755632
- Title: Comparative Analysis of Vision Transformers and Traditional Deep Learning Approaches for Automated Pneumonia Detection in Chest X-Rays
- Title(参考訳): 胸部X線自動肺炎検出のための視覚変換器と従来の深層学習手法の比較解析
- Authors: Gaurav Singh,
- Abstract要約: 肺炎は、特に新型コロナウイルスなどの疾患によって引き起こされた場合、迅速かつ正確な診断を必要とする世界的な健康上の重要な課題である。
本研究は,胸部X線を用いた自動肺炎検出のための従来の機械学習と最先端の深層学習の総合的な比較を行った。
我々はビジョントランスフォーマー、特にクロスビットアーキテクチャが88.25%の精度と99.42%のリコールで優れた性能を発揮することを示した。
- 参考スコア(独自算出の注目度): 1.2310316230437004
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pneumonia, particularly when induced by diseases like COVID-19, remains a critical global health challenge requiring rapid and accurate diagnosis. This study presents a comprehensive comparison of traditional machine learning and state-of-the-art deep learning approaches for automated pneumonia detection using chest X-rays (CXRs). We evaluate multiple methodologies, ranging from conventional machine learning techniques (PCA-based clustering, Logistic Regression, and Support Vector Classification) to advanced deep learning architectures including Convolutional Neural Networks (Modified LeNet, DenseNet-121) and various Vision Transformer (ViT) implementations (Deep-ViT, Compact Convolutional Transformer, and Cross-ViT). Using a dataset of 5,856 pediatric CXR images, we demonstrate that Vision Transformers, particularly the Cross-ViT architecture, achieve superior performance with 88.25% accuracy and 99.42% recall, surpassing traditional CNN approaches. Our analysis reveals that architectural choices impact performance more significantly than model size, with Cross-ViT's 75M parameters outperforming larger models. The study also addresses practical considerations including computational efficiency, training requirements, and the critical balance between precision and recall in medical diagnostics. Our findings suggest that Vision Transformers offer a promising direction for automated pneumonia detection, potentially enabling more rapid and accurate diagnosis during health crises.
- Abstract(参考訳): 肺炎は、特に新型コロナウイルスなどの疾患によって引き起こされた場合、迅速かつ正確な診断を必要とする世界的な健康上の重要な課題である。
本研究は,胸部X線(CXR)を用いた自動肺炎検出のための,従来の機械学習と最先端のディープラーニングアプローチの総合的な比較を行った。
我々は、従来の機械学習技術(PCAベースのクラスタリング、ロジスティック回帰、サポートベクトル分類)から、畳み込みニューラルネットワーク(改良されたLeNet、DenseNet-121)や様々な視覚変換器(ディープ-ViT、コンパクト畳み込み変換器、クロス-ViT)を含む先進的なディープラーニングアーキテクチャまで、さまざまな手法を評価する。
5,856枚のCXR画像のデータセットを用いて、ビジョントランスフォーマー、特にクロスビットアーキテクチャは、88.25%の精度と99.42%のリコールで、従来のCNNのアプローチよりも優れた性能を達成していることを示した。
分析の結果,Cross-ViTの75Mパラメータはより大きなモデルよりも高い性能を示した。
この研究は、計算効率、トレーニング要件、医療診断における精度とリコールの臨界バランスなど、実践的な考察にも取り組んでいる。
以上の結果から,Vision Transformersは肺炎の自動検出に有望な方向を示し,健康危機時により迅速かつ正確な診断を可能にする可能性が示唆された。
関連論文リスト
- An Integrated Deep Learning Framework Leveraging NASNet and Vision Transformer with MixProcessing for Accurate and Precise Diagnosis of Lung Diseases [0.12277343096128711]
NASNet-ViTモデルは、98.9%の精度、0.99の感度、0.989のF1スコア、0.987の特異性を実現している。
これらの結果は,NASNet-ViTが有意な特徴を抽出し,様々な種類の肺疾患を高い精度で認識する上で,高品質な能力を反映している。
論文 参考訳(メタデータ) (2025-02-27T22:17:38Z) - Lung Disease Detection with Vision Transformers: A Comparative Study of Machine Learning Methods [0.0]
本研究では,機械学習における最先端アーキテクチャであるビジョントランスフォーマー(ViT)の胸部X線解析への応用について検討する。
胸部X線像と肺分画領域に焦点を当てた2つのViT法の比較検討を行った。
論文 参考訳(メタデータ) (2024-11-18T08:40:25Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - A novel method to enhance pneumonia detection via a model-level
ensembling of CNN and vision transformer [0.7499722271664147]
肺炎は世界中で致死率と死亡率の主要な原因である。
深層学習は胸部X線(CXR)画像から肺炎を検出する大きな可能性を示している。
我々は,モデルレベルのアンサンブルにより,畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマーネットワークを融合させる新しいモデルを開発した。
論文 参考訳(メタデータ) (2024-01-04T16:58:31Z) - Swin-Tempo: Temporal-Aware Lung Nodule Detection in CT Scans as Video
Sequences Using Swin Transformer-Enhanced UNet [2.7547288571938795]
本稿では、畳み込みニューラルネットワークと視覚変換器の長所を利用する革新的なモデルを提案する。
ビデオ中の物体検出にインスパイアされた各3次元CT画像をビデオとして扱い、個々のスライスをフレームとして、肺結節をオブジェクトとして扱い、時系列アプリケーションを可能にする。
論文 参考訳(メタデータ) (2023-10-05T07:48:55Z) - Vision Transformer-based Model for Severity Quantification of Lung
Pneumonia Using Chest X-ray Images [11.12596879975844]
我々は、新型コロナウイルスや他の肺疾患の重症度を定量化するために、少数のトレーニング可能なパラメータに依存するビジョントランスフォーマーベースのニューラルネットワークモデルを提案する。
本モデルでは,比較的低い計算コストで高一般化性で重大度を定量化する上で,ピーク性能を提供することができる。
論文 参考訳(メタデータ) (2023-03-18T12:38:23Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - In-Line Image Transformations for Imbalanced, Multiclass Computer Vision
Classification of Lung Chest X-Rays [91.3755431537592]
本研究は、COVID-19 LCXRデータ不足のバランスをとるために画像変換を適用するために、文献の体系を活用することを目的としている。
convolutional neural networks(cnns)のようなディープラーニング技術は、健康状態と疾患状態を区別する特徴を選択することができる。
本研究は,CNNアーキテクチャを用いて高速多クラスLCXR分類を94%精度で行う。
論文 参考訳(メタデータ) (2021-04-06T02:01:43Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Diagnosis of Coronavirus Disease 2019 (COVID-19) with Structured Latent
Multi-View Representation Learning [48.05232274463484]
最近、コロナウイルス病2019(COVID-19)の流行は世界中で急速に広まっている。
多くの患者と医師の重労働のために、機械学習アルゴリズムによるコンピュータ支援診断が緊急に必要である。
本研究では,CT画像から抽出した一連の特徴を用いて,COVID-19の診断を行うことを提案する。
論文 参考訳(メタデータ) (2020-05-06T15:19:15Z) - Residual Attention U-Net for Automated Multi-Class Segmentation of
COVID-19 Chest CT Images [46.844349956057776]
新型コロナウイルス感染症(COVID-19)は世界中で急速に広がり、公衆衛生や経済に大きな影響を及ぼしている。
新型コロナウイルスによる肺感染症を効果的に定量化する研究はいまだにない。
複数の新型コロナウイルス感染症領域の自動セグメンテーションのための新しいディープラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-04-12T16:24:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。