論文の概要: CNN-ViT Fusion with Adaptive Attention Gate for Brain Tumor MRI Classification: A Hybrid Deep Learning Model
- arxiv url: http://arxiv.org/abs/2604.23137v1
- Date: Sat, 25 Apr 2026 04:36:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.177006
- Title: CNN-ViT Fusion with Adaptive Attention Gate for Brain Tumor MRI Classification: A Hybrid Deep Learning Model
- Title(参考訳): 脳腫瘍MRI分類のための適応的注意ゲートを用いたCNN-ViT融合 : ハイブリッドディープラーニングモデル
- Authors: Syed Ibad Hasnain, Muhammad Faris, Hafiza Syeda Yusra Tirmizi, Rabail Khowaja, Hafsa Israr,
- Abstract要約: 我々は、SqueezeNetスタイルのCNNブランチとMobileViTスタイルのグローバルトランスフォーマーブランチを組み合わせた新しいハイブリッドアーキテクチャを提案する。
ゲートは、各ブランチの重み付けを動的に学習し、局所的およびグローバルな表現の文脈に敏感なマージを可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Early detection and classifying brain tumors using Magnetic Resonance Imaging (MRI) images is highly important but difficult to extract in medical images. Convolutional Neural Networks (CNNs) are good at capturing both local texture and spatial information whereas Vision Transformers (ViTs) are good at capturing long-range global dependencies. We propose a new hybrid architecture that combines a SqueezeNet-style CNN branch with a MobileViT-style global transformer branch, through an Adaptive Attention Gate mechanism, in this paper. The gate learns dynamically per-sample, per-feature weights to weight the contribution of each branch, allowing context-sensitive merging of local and global representations. The proposed model has a test accuracy of 97.60, a precision of 97.30, a recall of 97.50, an F1-score of 97.40, and a macro-average area under the curve (AUC) of 0.9946 with a trained and evaluated on the Brain Tumor MRI Dataset (Kaggle). These scores are higher than single CNN and ViT baselines, and current competitive fusion methods, showing that dynamic feature weighting is an effective way to classify medical images.
- Abstract(参考訳): MRI画像を用いた脳腫瘍の早期発見と分類は極めて重要であるが,医用画像では抽出が困難である。
畳み込みニューラルネットワーク(CNN)は局所的なテクスチャと空間情報の両方を捉えるのが得意であるが、視覚変換器(ViT)は長距離グローバル依存を捉えるのが得意である。
本稿では,SqueezeNetスタイルのCNNブランチとMobileViTスタイルのグローバルトランスフォーマーブランチをアダプティブアテンションゲート機構で組み合わせたハイブリッドアーキテクチャを提案する。
ゲートは、各ブランチの重み付けを動的に学習し、局所的およびグローバルな表現の文脈に敏感なマージを可能にする。
提案モデルは、97.60の精度、97.30の精度、97.50のリコール、97.40のF1スコア、および0.9946の曲線(AUC)下のマクロ平均領域を持ち、脳腫瘍MRIデータセット(Kaggle)で訓練され評価されている。
これらのスコアは、単一のCNNやViTベースラインよりも高く、現在の競合融合法は、ダイナミックな特徴重み付けが医療画像の分類に有効な方法であることを示している。
関連論文リスト
- Brain Tumor Detection Through Diverse CNN Architectures in IoT Healthcare Industries: Fast R-CNN, U-Net, Transfer Learning-Based CNN, and Fully Connected CNN [0.42970700836450487]
R-CNN,UNet,転写学習モデルを用いて,MRI画像からグリオーマ,髄膜腫,下垂体腫瘍を分類した。
高速R-CNNは99%の精度、98.5%のFスコア、99.5%のエリア・アンダー・ザ・カーブ(AUC)、99.4%のリコール、98.5%の精度で最高の結果を得た。
これらの結果は、多様なデータセットを扱うAIモデルの堅牢性と信頼性を強調している。
論文 参考訳(メタデータ) (2025-09-06T20:03:51Z) - UNet with Self-Adaptive Mamba-Like Attention and Causal-Resonance Learning for Medical Image Segmentation [2.0544282587296974]
既存のディープラーニングモデルは、効率と精度のトレードオフに直面している。
2つの重要なイノベーションを取り入れた新しいU字型アーキテクチャであるSAMA-UNetを提案する。
MRI、CT、内視鏡のデータセットの実験では、SAMA-UNetはCNN、Transformer、Mambaベースの手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2025-05-21T08:12:31Z) - Brain Tumor Classification on MRI in Light of Molecular Markers [56.99710477905796]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - Classification of Endoscopy and Video Capsule Images using CNN-Transformer Model [1.0994755279455526]
本研究では、トランスフォーマーと畳み込みニューラルネットワーク(CNN)の利点を組み合わせて分類性能を向上させるハイブリッドモデルを提案する。
GastroVisionデータセットでは,精度,リコール,F1スコア,精度,マシューズ相関係数(MCC)が0.8320,0.8386,0.8324,0.8386,0.8191であった。
論文 参考訳(メタデータ) (2024-08-20T11:05:32Z) - Breast Ultrasound Tumor Classification Using a Hybrid Multitask
CNN-Transformer Network [63.845552349914186]
胸部超音波(BUS)画像分類において,グローバルな文脈情報の収集が重要な役割を担っている。
ビジョントランスフォーマーは、グローバルなコンテキスト情報をキャプチャする能力が改善されているが、トークン化操作によって局所的なイメージパターンを歪めてしまう可能性がある。
本研究では,BUS腫瘍分類とセグメンテーションを行うハイブリッドマルチタスクディープニューラルネットワークであるHybrid-MT-ESTANを提案する。
論文 参考訳(メタデータ) (2023-08-04T01:19:32Z) - Hybrid Window Attention Based Transformer Architecture for Brain Tumor
Segmentation [28.650980942429726]
細かな特徴を抽出するための2つのウィンドウ化戦略に従うボリューム視覚変換器を提案する。
FeTS Challenge 2022データセット上で,ネットワークアーキテクチャをトレーニングし,評価した。
オンライン検証データセットのパフォーマンスは以下の通りである。 Dice similarity Score of 81.71%, 91.38%, 85.40%。
論文 参考訳(メタデータ) (2022-09-16T03:55:48Z) - Medulloblastoma Tumor Classification using Deep Transfer Learning with
Multi-Scale EfficientNets [63.62764375279861]
本稿では,エンド・ツー・エンドのMB腫瘍分類を提案し,様々な入力サイズとネットワーク次元の一致した移動学習を提案する。
161ケースのデータセットを用いて、より大規模な入力解像度を持つ事前学習されたEfficientNetが、大幅な性能改善をもたらすことを実証した。
論文 参考訳(メタデータ) (2021-09-10T13:07:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。