論文の概要: Brain Stroke Detection and Classification Using CT Imaging with Transformer Models and Explainable AI
- arxiv url: http://arxiv.org/abs/2507.09630v1
- Date: Sun, 13 Jul 2025 13:50:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:23.662903
- Title: Brain Stroke Detection and Classification Using CT Imaging with Transformer Models and Explainable AI
- Title(参考訳): 変圧器モデルと説明可能なAIを用いたCT画像を用いた脳卒中の検出と分類
- Authors: Shomukh Qari, Maha A. Thafar,
- Abstract要約: 本研究では,CTスキャン画像を用いたマルチクラス脳卒中分類のための人工知能フレームワークを提案する。
提案手法は,画像ベースストローク分類の深層学習モデルとして,最先端のビジョン変換器であるMaxViTを採用した。
モデル一般化とアドレスクラス不均衡を改善するため,データ拡張手法を適用した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stroke is one of the leading causes of death globally, making early and accurate diagnosis essential for improving patient outcomes, particularly in emergency settings where timely intervention is critical. CT scans are the key imaging modality because of their speed, accessibility, and cost-effectiveness. This study proposed an artificial intelligence framework for multiclass stroke classification (ischemic, hemorrhagic, and no stroke) using CT scan images from a dataset provided by the Republic of Turkey's Ministry of Health. The proposed method adopted MaxViT, a state-of-the-art Vision Transformer, as the primary deep learning model for image-based stroke classification, with additional transformer variants (vision transformer, transformer-in-transformer, and ConvNext). To enhance model generalization and address class imbalance, we applied data augmentation techniques, including synthetic image generation. The MaxViT model trained with augmentation achieved the best performance, reaching an accuracy and F1-score of 98.00%, outperforming all other evaluated models and the baseline methods. The primary goal of this study was to distinguish between stroke types with high accuracy while addressing crucial issues of transparency and trust in artificial intelligence models. To achieve this, Explainable Artificial Intelligence (XAI) was integrated into the framework, particularly Grad-CAM++. It provides visual explanations of the model's decisions by highlighting relevant stroke regions in the CT scans and establishing an accurate, interpretable, and clinically applicable solution for early stroke detection. This research contributed to the development of a trustworthy AI-assisted diagnostic tool for stroke, facilitating its integration into clinical practice and enhancing access to timely and optimal stroke diagnosis in emergency departments, thereby saving more lives.
- Abstract(参考訳): ストロークは世界的な死因の1つであり、早期かつ正確な診断が患者の予後を改善するのに不可欠である。
CTスキャンはその速度、アクセシビリティ、費用対効果のために重要な画像モダリティである。
本研究では,トルコの厚生労働省が提供したデータセットからCTスキャン画像を用いて,マルチクラス脳卒中分類のための人工知能フレームワークを提案する。
提案手法は、画像ベースストローク分類における第一深層学習モデルとして、最新のVision TransformerであるMaxViTを採用し、新たな変圧器(visal transformer, transformer-in-transformer, ConvNext)を追加した。
モデル一般化とアドレスクラス不均衡を改善するため,合成画像生成を含むデータ拡張手法を適用した。
拡張で訓練されたMaxViTモデルは、精度とF1スコアが98.00%に達し、他の全ての評価されたモデルやベースライン法よりも優れていた。
本研究の主な目的は、人工知能モデルにおける透明性と信頼の重要な問題に対処しながら、高い精度で脳卒中型を区別することであった。
これを実現するため、Explainable Artificial Intelligence(XAI)がフレームワーク、特にGrad-CAM++に統合された。
これは、CTスキャンで関連する脳卒中領域を強調し、正確な、解釈可能で、臨床応用可能な早期脳卒中検出ソリューションを確立することによって、モデルの判断を視覚的に説明する。
この研究は、脳卒中のための信頼できるAI支援診断ツールの開発に貢献し、その臨床実践への統合を促進し、救急部門におけるタイムリーで最適な脳卒中診断へのアクセスを強化し、より多くの命を救った。
関連論文リスト
- Glioblastoma Overall Survival Prediction With Vision Transformers [6.318465743962574]
グリオ芽腫は最も攻撃的で一般的な脳腫瘍の1つで、生存期間は10~15ヶ月である。
本研究では,MRI画像を用いた総合生存(OS)予測のための新しい人工知能(AI)手法を提案する。
我々は視覚変換器(ViT)を用いてMRI画像から直接隠れた特徴を抽出し,腫瘍のセグメンテーションの必要性を排除した。
提案したモデルは、BRATSデータセットで評価され、テストセット上で62.5%の精度を達成した。
論文 参考訳(メタデータ) (2025-08-04T13:59:57Z) - An Explainable Transformer Model for Alzheimer's Disease Detection Using Retinal Imaging [5.3785187022022845]
アルツハイマー病(英: Alzheimer's disease、AD)は、世界中の何百万もの人に影響を及ぼす神経変性疾患である。
本研究では,網膜画像を用いたAD検出のための新しいトランスフォーマーアーキテクチャであるRetformerを提案する。
論文 参考訳(メタデータ) (2025-07-06T06:40:42Z) - An Efficient Deep Learning Framework for Brain Stroke Diagnosis Using Computed Tomography (CT) Images [0.0]
脳卒中は世界中で死亡率と長期障害の主な原因である。
ほとんどのストローク分類技術は、単一のスライスレベルの予測メカニズムを使用する。
本研究では,CTスキャン画像を用いた脳卒中早期予測のための機械学習モデルについて検討した。
論文 参考訳(メタデータ) (2025-07-04T13:11:29Z) - Enhancing Orthopox Image Classification Using Hybrid Machine Learning and Deep Learning Models [40.325359811289445]
本稿では、機械学習モデルと事前訓練されたディープラーニングモデルを組み合わせて、拡張データを必要とせずに、深い特徴表現を抽出する。
その結果, この特徴抽出法は, 最先端技術における他の手法と組み合わせることで, 優れた分類結果が得られることがわかった。
論文 参考訳(メタデータ) (2025-06-06T11:52:07Z) - Federated Learning with LoRA Optimized DeiT and Multiscale Patch Embedding for Secure Eye Disease Recognition [2.1358421658740214]
本研究では,AIを用いた医用イメージングと疾患検出を先進的に進めるために,データ効率画像変換器(DeIT)を用いたアプローチを提案する。
AUC、F1スコア、精度、最小損失、トップ5の精度で最先端のパフォーマンスを実現している。
Grad-CAM++視覚化は、重要な病理領域を強調し、モデルの臨床的関連性を高めることにより、解釈可能性を向上させる。
論文 参考訳(メタデータ) (2025-05-11T13:51:56Z) - GS-TransUNet: Integrated 2D Gaussian Splatting and Transformer UNet for Accurate Skin Lesion Analysis [44.99833362998488]
本稿では,2次元ガウススプラッティングとTransformer UNetアーキテクチャを組み合わせた皮膚癌自動診断手法を提案する。
セグメンテーションと分類の精度は著しく向上した。
この統合は、新しいベンチマークをこの分野に設定し、マルチタスク医療画像解析手法のさらなる研究の可能性を強調している。
論文 参考訳(メタデータ) (2025-02-23T23:28:47Z) - Multi-Scale Transformer Architecture for Accurate Medical Image Classification [4.578375402082224]
本研究では,トランスフォーマーアーキテクチャを改良したAIによる皮膚病変分類アルゴリズムを提案する。
マルチスケールな特徴融合機構の統合と自己認識プロセスの洗練により、このモデルはグローバルな特徴とローカルな特徴の両方を効果的に抽出する。
ISIC 2017データセットのパフォーマンス評価は、改良されたTransformerが既存のAIモデルを上回ることを示している。
論文 参考訳(メタデータ) (2025-02-10T08:22:25Z) - Object Detection for Medical Image Analysis: Insights from the RT-DETR Model [40.593685087097995]
本稿では,RT-DETRモデルに基づく複雑な画像データ解析のための新しい検出フレームワークの適用について述べる。
RT-DETRモデルはTransformerベースのアーキテクチャ上に構築され,高次元かつ複雑な視覚データ処理に優れ,堅牢性と精度が向上した。
論文 参考訳(メタデータ) (2025-01-27T20:02:53Z) - Efficient Precision Control in Object Detection Models for Enhanced and Reliable Ovarian Follicle Counting [37.9434503914985]
機械学習の大きな課題は、高いリコールを可能にしながら予測の精度を制御することである。
標準的なPrecision-Recallトレードオフを解決するために、オーバーパフォーマンスな方法を提供する複数のテスト手順を使用します。
モデルに依存しないので、この文脈選択手順は、再トレーニングすることなく、任意のモデルの性能を向上させる戦略の開発への道を開く。
論文 参考訳(メタデータ) (2025-01-23T19:04:47Z) - Transformer-Based Self-Supervised Learning for Histopathological Classification of Ischemic Stroke Clot Origin [0.0]
虚血性脳卒中における血栓塞栓源の同定は治療と二次予防に不可欠である。
本研究は,虚血性脳梗塞の発生源を分類するためのエンボリのデジタル病理学における自己教師型深層学習アプローチについて述べる。
論文 参考訳(メタデータ) (2024-05-01T23:40:12Z) - Classification of lung cancer subtypes on CT images with synthetic
pathological priors [41.75054301525535]
同症例のCT像と病理像との間には,画像パターンに大規模な関連性が存在する。
肺がんサブタイプをCT画像上で正確に分類するための自己生成型ハイブリッド機能ネットワーク(SGHF-Net)を提案する。
論文 参考訳(メタデータ) (2023-08-09T02:04:05Z) - Incremental Cross-view Mutual Distillation for Self-supervised Medical
CT Synthesis [88.39466012709205]
本稿では,スライス間の分解能を高めるために,新しい医療スライスを構築した。
臨床実践において, 根本・中間医療スライスは常に欠落していることを考慮し, 相互蒸留の段階的相互蒸留戦略を導入する。
提案手法は,最先端のアルゴリズムよりも明確なマージンで優れる。
論文 参考訳(メタデータ) (2021-12-20T03:38:37Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。