論文の概要: Systematic Integration of Attention Modules into CNNs for Accurate and Generalizable Medical Image Diagnosis
- arxiv url: http://arxiv.org/abs/2509.05343v1
- Date: Tue, 02 Sep 2025 05:45:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.445239
- Title: Systematic Integration of Attention Modules into CNNs for Accurate and Generalizable Medical Image Diagnosis
- Title(参考訳): 正確な医用画像診断のためのCNNへの注意モジュールのシステム統合
- Authors: Zahid Ullah, Minki Hong, Tahir Mahmood, Jihie Kim,
- Abstract要約: 注意機構を広く採用されている5つのCNNアーキテクチャに統合する。
各ベースラインモデルは、SqueezeとExcitationブロックまたはハイブリッドのConvolutional Block Attention Moduleで拡張される。
注意を増すCNNは、すべての指標において、ベースラインアーキテクチャを一貫して上回っていることを示す。
- 参考スコア(独自算出の注目度): 7.082043294630761
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning has become a powerful tool for medical image analysis; however, conventional Convolutional Neural Networks (CNNs) often fail to capture the fine-grained and complex features critical for accurate diagnosis. To address this limitation, we systematically integrate attention mechanisms into five widely adopted CNN architectures, namely, VGG16, ResNet18, InceptionV3, DenseNet121, and EfficientNetB5, to enhance their ability to focus on salient regions and improve discriminative performance. Specifically, each baseline model is augmented with either a Squeeze and Excitation block or a hybrid Convolutional Block Attention Module, allowing adaptive recalibration of channel and spatial feature representations. The proposed models are evaluated on two distinct medical imaging datasets, a brain tumor MRI dataset comprising multiple tumor subtypes, and a Products of Conception histopathological dataset containing four tissue categories. Experimental results demonstrate that attention augmented CNNs consistently outperform baseline architectures across all metrics. In particular, EfficientNetB5 with hybrid attention achieves the highest overall performance, delivering substantial gains on both datasets. Beyond improved classification accuracy, attention mechanisms enhance feature localization, leading to better generalization across heterogeneous imaging modalities. This work contributes a systematic comparative framework for embedding attention modules in diverse CNN architectures and rigorously assesses their impact across multiple medical imaging tasks. The findings provide practical insights for the development of robust, interpretable, and clinically applicable deep learning based decision support systems.
- Abstract(参考訳): 深層学習は医用画像解析の強力なツールとなっているが、従来の畳み込みニューラルネットワーク(CNN)では、正確な診断に不可欠な微細で複雑な特徴を捉えることができないことが多い。
この制限に対処するため,我々は注意機構をVGG16,ResNet18,InceptionV3,DenseNet121,EfficientNetB5という,広く採用されている5つのCNNアーキテクチャに体系的に統合し,正常な領域にフォーカスする能力を高め,識別性能を向上させる。
具体的には、各ベースラインモデルは、SqueezeとExcitationブロックまたはハイブリッドのConvolutional Block Attention Moduleで拡張され、チャネルと空間的特徴表現の適応的な再分類を可能にする。
提案モデルは2つの異なる医用画像データセット,複数の腫瘍サブタイプからなる脳腫瘍MRIデータセット,および4つの組織カテゴリを含む概念的病理組織データセットを用いて評価した。
実験結果から,CNNの注目度は,すべての指標のベースラインアーキテクチャより一貫して優れていた。
特に、ハイブリッドアテンションを持つEfficientNetB5は、全体的なパフォーマンスが最も高く、両方のデータセットで大幅に向上している。
分類精度の向上に加えて、アテンション機構は特徴ローカライゼーションを強化し、不均一な画像モダリティをまたいだ一般化が向上した。
この研究は、様々なCNNアーキテクチャに注意モジュールを組み込むための体系的な比較フレームワークに貢献し、複数の医療画像タスクにおけるそれらの影響を厳格に評価する。
この知見は、堅牢で、解釈可能で、臨床応用可能なディープラーニングに基づく意思決定支援システムを開発するための実践的な洞察を提供する。
関連論文リスト
- ConnectomeDiffuser: Generative AI Enables Brain Network Construction from Diffusion Tensor Imaging [36.89452147894995]
脳ネットワーク解析はアルツハイマー病(AD)などの神経変性疾患の診断とモニタリングに重要な役割を果たしている
拡散テンソルイメージング(DTI)から構造脳ネットワークを構築するための既存のアプローチは、しばしば固有の制限に悩まされる特別なツールキットに依存している。
本研究は,DTIによるエンド・ツー・エンド脳ネットワーク構築のための新しい拡散型フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-23T15:03:58Z) - FundusGAN: A Hierarchical Feature-Aware Generative Framework for High-Fidelity Fundus Image Generation [35.46876389599076]
FundusGANは、高忠実度ファンドス画像合成用に特別に設計された新しい階層的特徴認識生成フレームワークである。
我々は、FundusGANが複数のメトリクスにわたって最先端のメソッドを一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2025-03-22T18:08:07Z) - Hybrid Interpretable Deep Learning Framework for Skin Cancer Diagnosis: Integrating Radial Basis Function Networks with Explainable AI [1.1049608786515839]
皮膚がんは世界中で最も流行し、致命的な疾患の1つである。
本稿では,畳み込みニューラルネットワーク(CNN)とラジアル基底関数(RBF)ネットワークを統合するハイブリッドディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-24T19:19:02Z) - HYATT-Net is Grand: A Hybrid Attention Network for Performant Anatomical Landmark Detection [17.290208035331734]
医学的画像からの解剖学的ランドマーク検出(ALD)は、幅広い臨床応用に不可欠である。
CNNとTransformerを統合した新しいハイブリッドアーキテクチャを提案する。
5つの多様なデータセットの実験は、最先端のパフォーマンスを示し、精度、堅牢性、効率の既存の手法を超越している。
論文 参考訳(メタデータ) (2024-12-09T13:58:00Z) - CAVE-Net: Classifying Abnormalities in Video Capsule Endoscopy [0.1937002985471497]
複雑な画像データセットを解析する際の診断精度を向上させるために,アンサンブルに基づくアプローチを提案する。
各モデルのユニークな特徴抽出機能を活用し、全体的な精度を向上させる。
これらの手法を用いることで、提案フレームワークであるCAVE-Netは、ロバストな特徴識別と、より優れた分類結果を提供する。
論文 参考訳(メタデータ) (2024-10-26T17:25:08Z) - L-SFAN: Lightweight Spatially-focused Attention Network for Pain Behavior Detection [44.016805074560295]
慢性的な腰痛 (CLBP) は世界中の何百万もの患者を悩ませており、個人の健康や医療システムに対する経済的負担に大きな影響を及ぼす。
人工知能(AI)とディープラーニングは、リハビリ戦略を改善するために痛みに関連する行動を分析するための有望な道を提供するが、畳み込みニューラルネットワーク(CNN)を含む現在のモデルには限界がある。
我々は、モーションキャプチャーと表面筋電図センサからデータの空間的時間的相互作用をキャプチャする2Dフィルタを組み込んだ軽量CNNアーキテクチャであるhbox EmoL-SFANを紹介する。
論文 参考訳(メタデータ) (2024-06-07T12:01:37Z) - Optimizing Universal Lesion Segmentation: State Space Model-Guided Hierarchical Networks with Feature Importance Adjustment [0.0]
我々は,MAMBAフレームワークにステートスペースモデル(SSM)とアドバンスト階層ネットワーク(AHNet)を統合したMamba-Ahnetを紹介する。
Mamba-Ahnetは、SSMの特徴抽出と理解をAHNetの注意機構と画像再構成と組み合わせ、セグメンテーションの精度と堅牢性を高めることを目的としている。
論文 参考訳(メタデータ) (2024-04-26T08:15:43Z) - TransAttUnet: Multi-level Attention-guided U-Net with Transformer for
Medical Image Segmentation [33.45471457058221]
本稿では,TransAttUnetと呼ばれるトランスフォーマーベースの医用画像セマンティックセマンティック・セマンティック・フレームワークを提案する。
特に,デコーダブロック間の複数スケールのスキップ接続を確立することで,セマンティック・スケールのアップサンプリング機能を集約する。
我々の手法は一貫して最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2021-07-12T09:17:06Z) - Ensemble manifold based regularized multi-modal graph convolutional
network for cognitive ability prediction [33.03449099154264]
マルチモーダル機能磁気共鳴イメージング(fMRI)を使用して、脳の接続ネットワークに基づいて個々の行動特性および認知特性を予測することができます。
本稿では,fMRI時系列と各脳領域間の機能接続(FC)を組み込んだ,解釈可能な多モードグラフ畳み込みネットワーク(MGCN)モデルを提案する。
我々は、フィラデルフィア神経開発コホート上のMGCNモデルを検証し、個々の広範囲達成テスト(WRAT)スコアを予測します。
論文 参考訳(メタデータ) (2021-01-20T20:53:07Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。