論文の概要: A Computer Vision Hybrid Approach: CNN and Transformer Models for Accurate Alzheimer's Detection from Brain MRI Scans
- arxiv url: http://arxiv.org/abs/2601.15202v1
- Date: Wed, 21 Jan 2026 17:19:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.476073
- Title: A Computer Vision Hybrid Approach: CNN and Transformer Models for Accurate Alzheimer's Detection from Brain MRI Scans
- Title(参考訳): コンピュータビジョンハイブリッドアプローチ:脳MRI画像からの正確なアルツハイマー検出のためのCNNとトランスフォーマーモデル
- Authors: Md Mahmudul Hoque, Shuvo Karmaker, Md. Hadi Al-Amin, Md Modabberul Islam, Jisun Junayed, Farha Ulfat Mahi,
- Abstract要約: CNNアーキテクチャは強い性能を保ち、ResNet50は98.83%の精度を達成した。
トランスフォーマーモデルは競争上の一般化能力を示し、ViTは95.38%で最高精度を達成した。
提案したEvan_V2ハイブリッドモデルは、10のCNNとTransformerアーキテクチャの出力を機能レベルの融合によって統合し、99.99%の精度、0.9989 F1スコア、ROC AUCで最高のパフォーマンスを実現した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Early and accurate classification of Alzheimers disease (AD) from brain MRI scans is essential for timely clinical intervention and improved patient outcomes. This study presents a comprehensive comparative analysis of five CNN architectures (EfficientNetB0, ResNet50, DenseNet201, MobileNetV3, VGG16), five Transformer-based models (ViT, ConvTransformer, PatchTransformer, MLP-Mixer, SimpleTransformer), and a proposed hybrid model named Evan_V2. All models were evaluated on a four-class AD classification task comprising Mild Dementia, Moderate Dementia, Non-Demented, and Very Mild Dementia categories. Experimental findings show that CNN architectures consistently achieved strong performance, with ResNet50 attaining 98.83% accuracy. Transformer models demonstrated competitive generalization capabilities, with ViT achieving the highest accuracy among them at 95.38%. However, individual Transformer variants exhibited greater class-specific instability. The proposed Evan_V2 hybrid model, which integrates outputs from ten CNN and Transformer architectures through feature-level fusion, achieved the best overall performance with 99.99% accuracy, 0.9989 F1-score, and 0.9968 ROC AUC. Confusion matrix analysis further confirmed that Evan_V2 substantially reduced misclassification across all dementia stages, outperforming every standalone model. These findings highlight the potential of hybrid ensemble strategies in producing highly reliable and clinically meaningful diagnostic tools for Alzheimers disease classification.
- Abstract(参考訳): 脳MRI画像からのアルツハイマー病(AD)の早期かつ正確な分類は、タイムリーな臨床介入と患者の予後改善に不可欠である。
本研究では,5つのCNNアーキテクチャ(EfficientNetB0,ResNet50,DenseNet201,MobileNetV3,VGG16),5つのTransformerベースモデル(ViT,ConvTransformer,PatchTransformer,MLP-Mixer,SimpleTransformer)と,Evan_V2というハイブリッドモデルを提案する。
いずれのモデルも,軽度認知症,中等度認知症,非重度認知症,超軽度認知症を含む4段階のAD分類課題で評価した。
実験の結果、CNNアーキテクチャは強い性能を示し、ResNet50は98.83%の精度を達成した。
トランスフォーマーモデルは競争上の一般化能力を示し、ViTは95.38%で最高精度を達成した。
しかし、トランスフォーマーの個々の変種はクラス固有の不安定性を示した。
提案したEvan_V2ハイブリッドモデルは、10のCNNとTransformerアーキテクチャの出力を機能レベルの融合で統合し、99.99%の精度、0.9989 F1スコア、0.9968 ROC AUCで最高のパフォーマンスを達成した。
また, コンフュージョンマトリックス解析により, Evan_V2はすべての認知症段階における誤分類を著しく低減し, スタンドアローンモデルよりも優れていた。
これらの知見は、アルツハイマー病分類のための信頼性が高く、臨床的に有意義な診断ツールを作成するためのハイブリッドアンサンブル戦略の可能性を強調した。
関連論文リスト
- Transparent Early ICU Mortality Prediction with Clinical Transformer and Per-Case Modality Attribution [42.85462513661566]
ICU滞在後48時間から, 生理的時系列測定と非構造的臨床記録とを融合した, 軽量で透明なマルチモーダルアンサンブルを提案する。
ロジスティック回帰モデルは、バイタル用双方向LSTMとノート用微調整された臨床ModernBERT変換器の2つのモード固有モデルからの予測を組み合わせる。
MIMIC-IIIベンチマークでは、遅延融合アンサンブルは、よく校正された予測を維持しながら、最高の単一モデルに対する差別を改善する。
論文 参考訳(メタデータ) (2025-11-19T20:11:49Z) - Validating Vision Transformers for Otoscopy: Performance and Data-Leakage Effects [42.465094107111646]
本研究では、耳疾患の診断精度を高めるために、視覚トランスモデル、特にスウィントランスモデルの有効性を評価する。
この研究はチリ大学臨床病院の耳鼻咽喉科の実際のデータセットを利用した。
論文 参考訳(メタデータ) (2025-11-06T23:20:37Z) - MobileDenseAttn:A Dual-Stream Architecture for Accurate and Interpretable Brain Tumor Detection [0.0]
我々はMobileNetV2とDenseNet201の融合モデルであるMobileDenseAttnを紹介する。
MobileDenseAttnは、グリオーマ、髄膜腫、下垂体腫瘍、正常サンプルを表す6,020個のMRIスキャンのデータセットで訓練されている。
訓練精度99.75%、試験精度98.35%、安定したF1スコア0.9835を提供する。
論文 参考訳(メタデータ) (2025-08-22T13:24:38Z) - Skin Cancer Classification: Hybrid CNN-Transformer Models with KAN-Based Fusion [0.0]
Convolutional Kolmogorov-Arnold Network (CKAN) を用いた逐次および並列ハイブリッドCNN-Transformerモデルについて検討する。
そこでCNNは局所的な空間的特徴を抽出し、トランスフォーマーはグローバルな依存関係をモデル化し、CKANは表現学習を改善するために非線形な特徴融合を促進する。
HAM10000データセットで92.81%の精度と92.47%のF1スコア、PAD-UFESデータセットで97.83%のF1スコア、91.79%のF1スコア、91.17%のF1スコアを示す。
論文 参考訳(メタデータ) (2025-08-17T19:57:34Z) - GS-TransUNet: Integrated 2D Gaussian Splatting and Transformer UNet for Accurate Skin Lesion Analysis [44.99833362998488]
本稿では,2次元ガウススプラッティングとTransformer UNetアーキテクチャを組み合わせた皮膚癌自動診断手法を提案する。
セグメンテーションと分類の精度は著しく向上した。
この統合は、新しいベンチマークをこの分野に設定し、マルチタスク医療画像解析手法のさらなる研究の可能性を強調している。
論文 参考訳(メタデータ) (2025-02-23T23:28:47Z) - Early Diagnosis of Alzheimer's Diseases and Dementia from MRI Images Using an Ensemble Deep Learning [0.7510165488300369]
アルツハイマー病(英語: Alzheimer's Disease, AD)は、認知障害や認知失調を引き起こす進行性神経疾患である。
本研究では,ADの初期段階を正確に検出するために,IR-BRAINNETとModified-DEMNETの2つのCNNを提案する。
また、CNN間のばらつきを低減し、AD検出を向上させるために出力を平均化するアンサンブルモデルも導入した。
論文 参考訳(メタデータ) (2024-12-07T14:27:41Z) - Classification of Endoscopy and Video Capsule Images using CNN-Transformer Model [1.0994755279455526]
本研究では、トランスフォーマーと畳み込みニューラルネットワーク(CNN)の利点を組み合わせて分類性能を向上させるハイブリッドモデルを提案する。
GastroVisionデータセットでは,精度,リコール,F1スコア,精度,マシューズ相関係数(MCC)が0.8320,0.8386,0.8324,0.8386,0.8191であった。
論文 参考訳(メタデータ) (2024-08-20T11:05:32Z) - Comparative Performance Analysis of Transformer-Based Pre-Trained Models for Detecting Keratoconus Disease [0.0]
本研究は、変性眼疾患である角膜症(keratoconus)の診断のために、訓練済みの8つのCNNを比較した。
MobileNetV2は角膜と正常な症例を誤分類の少ない場合に最も正確なモデルであった。
論文 参考訳(メタデータ) (2024-08-16T20:15:24Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Vision Transformers for femur fracture classification [59.99241204074268]
Vision Transformer (ViT) はテスト画像の83%を正確に予測することができた。
史上最大かつ最もリッチなデータセットを持つサブフラクチャーで良い結果が得られた。
論文 参考訳(メタデータ) (2021-08-07T10:12:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。