論文の概要: an interpretable vision transformer framework for automated brain tumor classification
- arxiv url: http://arxiv.org/abs/2604.21311v1
- Date: Thu, 23 Apr 2026 06:07:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.326787
- Title: an interpretable vision transformer framework for automated brain tumor classification
- Title(参考訳): 自動脳腫瘍分類のための解釈可能な視覚変換器フレームワーク
- Authors: Chinedu Emmanuel Mbonu, Tochukwu Sunday Belonwu, Okwuchukwu Ejike Chukwuogo, Kenechukwu Sylvanus Anigbogu,
- Abstract要約: 本稿では,脳腫瘍の自動分類のためのディープラーニングフレームワークを提案する。
提案システムは、ImageNet-21kで事前訓練されたViT-B/16(ViT-B/16)をバックボーンとして使用する。
提案モデルでは, 99.29%, マクロF1スコア99.25%, 健常および髄膜腫の両クラスで完全リコールが可能である。
- 参考スコア(独自算出の注目度): 0.04999814847776097
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Brain tumors represent one of the most critical neurological conditions, where early and accurate diagnosis is directly correlated with patient survival rates. Manual interpretation of Magnetic Resonance Imaging (MRI) scans is time-intensive, subject to inter-observer variability, and demands significant specialist expertise. This paper proposes a deep learning framework for automated four-class brain tumor classification distinguishing glioma, meningioma, pituitary tumor, and healthy brain tissue from a dataset of 7,023 MRI scans. The proposed system employs a Vision Transformer (ViT-B/16) pretrained on ImageNet-21k as the backbone, augmented with a clinically motivated preprocessing and training pipeline. Contrast Limited Adaptive Histogram Equalization (CLAHE) is applied to enhance local contrast and accentuate tumor boundaries invisible to standard normalization. A two-stage fine-tuning strategy is adopted: the classification head is warmed up with the backbone frozen, followed by full fine-tuning with discriminative learning rates. MixUp and CutMix augmentation is applied per batch to improve generalization. Exponential Moving Average (EMA) of weights and Test-Time Augmentation (TTA) further stabilize and boost performance. Attention Rollout visualization provides clinically interpretable heatmaps of the brain regions driving each prediction. The proposed model achieves a test accuracy of 99.29%, macro F1-score of 99.25%, and perfect recall on both healthy and meningioma classes, outperforming all CNN-based baselines
- Abstract(参考訳): 脳腫瘍は、早期かつ正確な診断が患者の生存率と直接相関している、最も重要な神経疾患の1つである。
磁気共鳴イメージング(MRI)スキャンのマニュアル解釈は、時間集約的であり、サーバ間の変動を考慮し、重要な専門知識を必要とする。
本稿では, グリオーマ, 髄膜腫, 下垂体腫瘍, 健常脳組織を7,023MRIのデータセットから識別する4種類の脳腫瘍の自動分類のためのディープラーニングフレームワークを提案する。
提案システムは、ImageNet-21kで事前訓練されたViT-B/16(ViT-B/16)をバックボーンとして使用し、臨床的に動機付けされた前処理およびトレーニングパイプラインで強化する。
造影CT(Contrast Limited Adaptive Histogram Equalization, CLAHE)を応用し, 局所コントラストを増強し, 標準正規化には見えない腫瘍の境界をアクセントする。
2段階の微調整戦略が採用され、分類ヘッドは背骨を凍結して温められ、次いで識別学習率で完全な微調整が行われる。
MixUpとCutMixの拡張は、一般化を改善するためにバッチ毎に適用される。
重量の指数移動平均(EMA)とTTA(Test-Time Augmentation)はさらに安定して性能を向上する。
アテンション・ロールアウトの可視化は、各予測を駆動する脳領域の臨床的に解釈可能なヒートマップを提供する。
提案モデルでは,99.29%,マクロF1スコア99.25%,健常および髄膜腫の両クラスにおいて完全リコールが達成され,全CNNベースラインを上回った。
関連論文リスト
- Enhancing Brain Tumor Classification Using Vision Transformers with Colormap-Based Feature Representation on BRISC2025 Dataset [0.8374077003751697]
色マップに基づく特徴表現によって強化された視覚変換器(ViT)に基づく深層学習フレームワークを提案し,脳腫瘍の分類性能を向上させる。
BRISC2025データセットは、グリオーマ、髄膜腫、下垂体腫瘍、非腫瘍の4つのクラスを含む。
提案手法は,ベースライン畳み込みニューラルネットワークモデルよりも優れた98.90%の分類精度を実現する。
論文 参考訳(メタデータ) (2026-03-22T13:46:05Z) - Brain-WM: Brain Glioblastoma World Model [56.45393372490125]
我々は、次世代治療予測と将来のMRI生成を統一する先駆的なGBMワールドモデルであるBrain-WMを提案する。
Brain-WMは、潜在ダイナミクスを共有潜在空間に符号化し、関節自己回帰治療予測とフローベース将来のMRI生成を行う。
最終的にBrain-WMは、患者医療を最適化するための堅牢な臨床サンドボックスを提供する。
論文 参考訳(メタデータ) (2026-03-08T09:54:08Z) - Interpretability and Individuality in Knee MRI: Patient-Specific Radiomic Fingerprint with Reconstructed Healthy Personas [40.168029561784216]
放射線指紋(Radiomic fingerprint)は、MRIから派生した患者固有の特徴である。
健康なペルソナは、各患者に対して病理のないベースラインを合成する。
病理像から抽出した特徴を人格と比較すると、正常な解剖学からの逸脱が強調される。
論文 参考訳(メタデータ) (2026-01-13T14:48:01Z) - Squeezed-Eff-Net: Edge-Computed Boost of Tomography Based Brain Tumor Classification leveraging Hybrid Neural Network Architecture [0.7829352305480285]
本研究では,軽量モデルであるSqueezeNet v1と高性能モデルであるEfficientNet-B0に基づくハイブリッドディープラーニングモデルを提案する。
このフレームワークは、Nickparvar Brain tumor MRIデータセットでのみトレーニングされ、テストされた。
論文 参考訳(メタデータ) (2025-12-08T07:37:30Z) - Accelerating Cerebral Diagnostics with BrainFusion: A Comprehensive MRI Tumor Framework [0.41998444721319217]
磁気共鳴画像(MRI)を用いた脳腫瘍解析の進歩であるBrainFusionについて検討した。
我々は,VGG16,ResNet50,Xceptionを含む腫瘍分類のための細調整畳み込みニューラルネットワーク(CNN)を,境界ボックスによる正確な腫瘍局在のためのYOLOv8と組み合わせた。
実験の結果, 微調整されたVGG16モデルでは99.86%の精度が達成され, 従来のベンチマークをはるかに上回っていることがわかった。
論文 参考訳(メタデータ) (2025-09-29T00:53:17Z) - Light Weight CNN for classification of Brain Tumors from MRI Images [0.0]
本研究では,脳腫瘍のマルチクラス分類のための畳み込みニューラルネットワーク(CNN)に基づくアプローチを提案する。
グリオーマ,髄膜腫,下垂体腫瘍,腫瘍の4つの分類に分類したMRI画像を含む公開データセットを用いて検討した。
実験により, 本モデルが98.78%の分類精度を達成し, 臨床現場での診断支援の可能性を示した。
論文 参考訳(メタデータ) (2025-04-29T21:45:11Z) - Analysis of the BraTS 2023 Intracranial Meningioma Segmentation Challenge [44.76736949127792]
我々はBraTS 2023の頭蓋内髄膜腫チャレンジの設計と結果について述べる。
BraTS髄膜腫チャレンジ(BraTS Meningioma Challenge)は、髄膜腫に焦点を当てた以前のBraTSグリオーマチャレンジとは異なる。
上層部は腫瘍,腫瘍コア,腫瘍全体の拡張のために0.976,0.976,0.964の病変中央値類似係数(DSC)を有していた。
論文 参考訳(メタデータ) (2024-05-16T03:23:57Z) - Learning-based Bone Quality Classification Method for Spinal Metastasis [36.59899006688448]
脊椎転移の早期発見は、正確なステージングと最適な治療に重要である。
本稿では,CT画像に基づく脊椎転移の骨質自動分類法について検討する。
論文 参考訳(メタデータ) (2024-02-14T02:53:51Z) - Automated SSIM Regression for Detection and Quantification of Motion
Artefacts in Brain MR Images [54.739076152240024]
磁気共鳴脳画像における運動アーチファクトは重要な問題である。
MR画像の画質評価は,臨床診断に先立って基本的である。
構造類似度指数(SSIM)回帰に基づく自動画像品質評価法が提案されている。
論文 参考訳(メタデータ) (2022-06-14T10:16:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。