論文の概要: A Systematic Study of Deep Learning Models and xAI Methods for Region-of-Interest Detection in MRI Scans
- arxiv url: http://arxiv.org/abs/2508.14151v1
- Date: Tue, 19 Aug 2025 17:42:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.233246
- Title: A Systematic Study of Deep Learning Models and xAI Methods for Region-of-Interest Detection in MRI Scans
- Title(参考訳): MRIスキャンにおける奥行き検出のためのディープラーニングモデルとxAI手法の体系的研究
- Authors: Justin Yiu, Kushank Arora, Daniel Steinberg, Rohit Ghiya,
- Abstract要約: 本研究は, 膝関節MRIにおける興味領域の自動検出のためのAI(xAI)技術と組み合わせて, 各種ディープラーニングアーキテクチャの体系的評価を行う。
ResNet50, InceptionV3, Vision Transformers (ViT) および多層パーセプトロン (MLP) 分類器を付加した複数のU-Net変種について検討した。
以上の結果から,ResNet50は,MRNetデータセットの制約下でのトランスフォーマーベースモデルよりも優れた分類とROI識別が一貫して優れていることが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Magnetic Resonance Imaging (MRI) is an essential diagnostic tool for assessing knee injuries. However, manual interpretation of MRI slices remains time-consuming and prone to inter-observer variability. This study presents a systematic evaluation of various deep learning architectures combined with explainable AI (xAI) techniques for automated region of interest (ROI) detection in knee MRI scans. We investigate both supervised and self-supervised approaches, including ResNet50, InceptionV3, Vision Transformers (ViT), and multiple U-Net variants augmented with multi-layer perceptron (MLP) classifiers. To enhance interpretability and clinical relevance, we integrate xAI methods such as Grad-CAM and Saliency Maps. Model performance is assessed using AUC for classification and PSNR/SSIM for reconstruction quality, along with qualitative ROI visualizations. Our results demonstrate that ResNet50 consistently excels in classification and ROI identification, outperforming transformer-based models under the constraints of the MRNet dataset. While hybrid U-Net + MLP approaches show potential for leveraging spatial features in reconstruction and interpretability, their classification performance remains lower. Grad-CAM consistently provided the most clinically meaningful explanations across architectures. Overall, CNN-based transfer learning emerges as the most effective approach for this dataset, while future work with larger-scale pretraining may better unlock the potential of transformer models.
- Abstract(参考訳): 磁気共鳴イメージング(MRI)は膝関節損傷の診断に欠かせないツールである。
しかし、MRIスライスの手動による解釈は時間を要するままであり、サーバ間変動が生じる傾向にある。
そこで本研究では, 各種ディープラーニングアーキテクチャと説明可能なAI(xAI)技術を組み合わせることで, 膝関節MRIにおける関心領域自動検出(ROI)のシステム評価を行った。
ResNet50, InceptionV3, Vision Transformers (ViT) および多層パーセプトロン (MLP) 分類器を付加した複数のU-Net変種について検討した。
そこで我々はGrad-CAMやSaliency MapsといったxAI手法を統合した。
モデル性能は AUC で分類し,PSNR/SSIM で再現性を評価し,質的ROI の可視化を行った。
以上の結果から,ResNet50は,MRNetデータセットの制約下でのトランスフォーマーベースモデルよりも優れた分類とROI識別が一貫して優れていることが示された。
ハイブリッドU-Net + MLPアプローチは、再構成や解釈可能性において空間的特徴を活用する可能性を示しているが、その分類性能は依然として低い。
Grad-CAMは、アーキテクチャ全体で最も臨床的に意味のある説明を一貫して提供した。
全体として、CNNベースの転送学習は、このデータセットの最も効果的なアプローチとして現れ、より大規模な事前トレーニングによる今後の作業は、トランスフォーマーモデルの可能性を解き放つ可能性がある。
関連論文リスト
- Meta knowledge assisted Evolutionary Neural Architecture Search [38.55611683982936]
本稿では,革新的なメタラーニングフレームワークを用いて,効率的なECベースのNAS手法を提案する。
アダプティブサロゲートモデルは、潜在的なアーキテクチャを選択するためのアダプティブしきい値によって設計される。
CIFAR-10, CIFAR-100, ImageNet1Kデータセットを用いた実験により, 提案手法は最先端のピア手法に匹敵する高い性能が得られることを示した。
論文 参考訳(メタデータ) (2025-04-30T11:43:07Z) - Multi-Scale Transformer Architecture for Accurate Medical Image Classification [4.578375402082224]
本研究では,トランスフォーマーアーキテクチャを改良したAIによる皮膚病変分類アルゴリズムを提案する。
マルチスケールな特徴融合機構の統合と自己認識プロセスの洗練により、このモデルはグローバルな特徴とローカルな特徴の両方を効果的に抽出する。
ISIC 2017データセットのパフォーマンス評価は、改良されたTransformerが既存のAIモデルを上回ることを示している。
論文 参考訳(メタデータ) (2025-02-10T08:22:25Z) - Rethinking model prototyping through the MedMNIST+ dataset collection [0.11999555634662634]
この作業では、MedMNIST+データセットコレクションの包括的なベンチマークを導入する。
我々は、一般的なCNN(Convolutional Neural Networks)とViT(Vision Transformer)アーキテクチャを、異なる医療データセットにわたって再評価する。
この結果から,計算効率のよいトレーニングスキームと最新の基礎モデルが,エンドツーエンドのトレーニングに有効な代替手段を提供する可能性が示唆された。
論文 参考訳(メタデータ) (2024-04-24T10:19:25Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - You Only Train Once: A Unified Framework for Both Full-Reference and No-Reference Image Quality Assessment [45.62136459502005]
本稿では,完全な参照 (FR) と非参照 (NR) IQA を行うネットワークを提案する。
まず、入力画像から多レベル特徴を抽出するためにエンコーダを用いる。
FRおよびNR入力のユニバーサルアダプタとして階層的注意(HA)モジュールを提案する。
エンコーダの浅い層と深い層との間の特徴相関を調べるために, セマンティック・ディストーション・アウェア (SDA) モジュールを提案する。
論文 参考訳(メタデータ) (2023-10-14T11:03:04Z) - Convolutional neural network based on sparse graph attention mechanism
for MRI super-resolution [0.34410212782758043]
深層学習技術を用いた医用画像超解像(SR)再構成は、病変解析を強化し、診断効率と精度を向上させるために医師を支援する。
既存のディープラーニングベースのSR手法は、これらのモデルの表現能力を本質的に制限する畳み込みニューラルネットワーク(CNN)に依存している。
画像特徴抽出に複数の畳み込み演算子特徴抽出モジュール(MCO)を用いるAネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-29T06:14:22Z) - RetiFluidNet: A Self-Adaptive and Multi-Attention Deep Convolutional
Network for Retinal OCT Fluid Segmentation [3.57686754209902]
OCTガイド下治療には網膜液の定量化が必要である。
RetiFluidNetと呼ばれる新しい畳み込みニューラルアーキテクチャは、多クラス網膜流体セグメンテーションのために提案されている。
モデルは、テクスチャ、コンテキスト、エッジといった特徴の階層的な表現学習の恩恵を受ける。
論文 参考訳(メタデータ) (2022-09-26T07:18:00Z) - CNN-LSTM Based Multimodal MRI and Clinical Data Fusion for Predicting
Functional Outcome in Stroke Patients [1.5250925845050138]
脳卒中患者の管理において臨床結果予測は重要な役割を担っている。
機械学習の観点から見ると、大きな課題のひとつは異種データを扱うことだ。
本稿では,長い短期記憶(CNN-LSTM)に基づくアンサンブルモデルを提案する。
論文 参考訳(メタデータ) (2022-05-11T14:46:01Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Domain Shift in Computer Vision models for MRI data analysis: An
Overview [64.69150970967524]
機械学習とコンピュータビジョン手法は、医用画像解析において優れた性能を示している。
しかし、現在臨床応用はごくわずかである。
異なるソースや取得ドメインのデータへのモデルの不適切な転送性は、その理由の1つです。
論文 参考訳(メタデータ) (2020-10-14T16:34:21Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。