論文の概要: Towards Explainable Skin Cancer Classification: A Dual-Network Attention Model with Lesion Segmentation and Clinical Metadata Fusion
- arxiv url: http://arxiv.org/abs/2510.17773v1
- Date: Mon, 20 Oct 2025 17:33:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.543852
- Title: Towards Explainable Skin Cancer Classification: A Dual-Network Attention Model with Lesion Segmentation and Clinical Metadata Fusion
- Title(参考訳): 説明可能な皮膚癌分類に向けて:病変分割と臨床メタデータ融合を伴う二重ネットワーク注意モデル
- Authors: Md. Enamul Atiq, Shaikh Anowarul Fattah,
- Abstract要約: 本稿では,皮膚病変の分類を精度と解釈性の両方の観点から向上させる,二重エンコーダアテンションに基づくフレームワークを提案する。
Dual Attention Gates (DAG) と Atrous Space Pyramid Pooling (ASPP) を用いた新しいDeep-UNetアーキテクチャが最初に採用されている。
我々は,HAM10000データセットとISIC 2018と2019の課題に対するアプローチを評価した。
- 参考スコア(独自算出の注目度): 1.503974529275767
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Skin cancer is a life-threatening disease where early detection significantly improves patient outcomes. Automated diagnosis from dermoscopic images is challenging due to high intra-class variability and subtle inter-class differences. Many deep learning models operate as "black boxes," limiting clinical trust. In this work, we propose a dual-encoder attention-based framework that leverages both segmented lesions and clinical metadata to enhance skin lesion classification in terms of both accuracy and interpretability. A novel Deep-UNet architecture with Dual Attention Gates (DAG) and Atrous Spatial Pyramid Pooling (ASPP) is first employed to segment lesions. The classification stage uses two DenseNet201 encoders-one on the original image and another on the segmented lesion whose features are fused via multi-head cross-attention. This dual-input design guides the model to focus on salient pathological regions. In addition, a transformer-based module incorporates patient metadata (age, sex, lesion site) into the prediction. We evaluate our approach on the HAM10000 dataset and the ISIC 2018 and 2019 challenges. The proposed method achieves state-of-the-art segmentation performance and significantly improves classification accuracy and average AUC compared to baseline models. To validate our model's reliability, we use Gradient-weighted Class Activation Mapping (Grad-CAM) to generate heatmaps. These visualizations confirm that our model's predictions are based on the lesion area, unlike models that rely on spurious background features. These results demonstrate that integrating precise lesion segmentation and clinical data with attention-based fusion leads to a more accurate and interpretable skin cancer classification model.
- Abstract(参考訳): 皮膚がんは生命を脅かす疾患であり、早期発見は患者の予後を著しく改善する。
皮膚内視鏡画像からの自動診断は,高いクラス内変動と微妙なクラス間差により困難である。
多くの深層学習モデルは「ブラックボックス」として機能し、臨床信頼を制限する。
本研究では, 皮膚病変の分類を精度と解釈性の両方の観点から向上させるために, セグメント化病変と臨床メタデータの両方を活用するデュアルエンコーダ・アテンション・ベース・フレームワークを提案する。
Dual Attention Gates (DAG) と Atrous Space Pyramid Pooling (ASPP) を用いた新しいDeep-UNetアーキテクチャが最初に採用されている。
分類段階では、元の画像にDenseNet201エンコーダを2つ、マルチヘッドのクロスアテンションによって特徴が融合したセグメント化された病変に1つ使用する。
この二重インプット設計は、モデルが健全な病理領域に焦点を合わせるためのガイドとなる。
さらに、トランスフォーマーベースのモジュールは、患者のメタデータ(年齢、性別、病変部位)を予測に組み込む。
我々は,HAM10000データセットとISIC 2018と2019の課題に対するアプローチを評価した。
提案手法は,最先端セグメンテーション性能を実現し,ベースラインモデルと比較して分類精度と平均AUCを大幅に改善する。
モデルの信頼性を検証するために、Grad-CAM(Grad-weighted Class Activation Mapping)を用いてヒートマップを生成する。
これらの視覚化により、我々のモデルの予測は、急激な背景特徴に依存するモデルとは異なり、病変領域に基づいていることが確認される。
これらの結果から, 正確な病変分類と臨床データと注意ベース融合を併用することにより, より正確かつ解釈可能な皮膚癌分類モデルが得られた。
関連論文リスト
- GS-TransUNet: Integrated 2D Gaussian Splatting and Transformer UNet for Accurate Skin Lesion Analysis [44.99833362998488]
本稿では,2次元ガウススプラッティングとTransformer UNetアーキテクチャを組み合わせた皮膚癌自動診断手法を提案する。
セグメンテーションと分類の精度は著しく向上した。
この統合は、新しいベンチマークをこの分野に設定し、マルチタスク医療画像解析手法のさらなる研究の可能性を強調している。
論文 参考訳(メタデータ) (2025-02-23T23:28:47Z) - An analysis of data variation and bias in image-based dermatological datasets for machine learning classification [2.039829968340841]
臨床皮膚学では、分類モデルはRGB画像のみを入力として、患者の皮膚の悪性病変を検出することができる。
学習に基づくほとんどの手法では、トレーニングにおいて皮膚科のデータセットから取得したデータを用いており、これは金の基準によって大きく検証されている。
本研究の目的は,皮膚内視鏡検査と臨床検査のギャップを評価し,データセットの変動がトレーニングに与える影響を理解することである。
論文 参考訳(メタデータ) (2025-01-15T17:18:46Z) - Robust and Interpretable Medical Image Classifiers via Concept
Bottleneck Models [49.95603725998561]
本稿では,自然言語の概念を用いた堅牢で解釈可能な医用画像分類器を構築するための新しいパラダイムを提案する。
具体的には、まず臨床概念をGPT-4から検索し、次に視覚言語モデルを用いて潜在画像の特徴を明示的な概念に変換する。
論文 参考訳(メタデータ) (2023-10-04T21:57:09Z) - Improving Classification Model Performance on Chest X-Rays through Lung
Segmentation [63.45024974079371]
本稿では, セグメンテーションによる異常胸部X線(CXR)識別性能を向上させるための深層学習手法を提案する。
提案手法は,CXR画像中の肺領域を局所化するための深層ニューラルネットワーク(XLSor)と,大規模CXRデータセットで事前学習した自己教師あり運動量コントラスト(MoCo)モデルのバックボーンを用いたCXR分類モデルである。
論文 参考訳(メタデータ) (2022-02-22T15:24:06Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Lesion Net -- Skin Lesion Segmentation Using Coordinate Convolution and
Deep Residual Units [18.908448254745473]
メラノーマの皮膚病変のセグメント化の精度は、トレーニング、不規則な形状、不明瞭な境界、および異なる皮膚色のためのデータが少ないため、かなり困難な作業です。
提案手法は皮膚病変分節の精度を向上させるのに役立つ。
以上の結果から,提案モデルが既存の皮膚病変の分画法と同等以上の性能を示した。
論文 参考訳(メタデータ) (2020-12-28T14:43:04Z) - DONet: Dual Objective Networks for Skin Lesion Segmentation [77.9806410198298]
本稿では,皮膚病変のセグメンテーションを改善するために,Dual Objective Networks (DONet) という,シンプルで効果的なフレームワークを提案する。
我々のDONetは2つの対称デコーダを採用し、異なる目標に近づくための異なる予測を生成する。
皮膚内視鏡画像における多種多様な病変のスケールと形状の課題に対処するために,再帰的コンテキスト符号化モジュール(RCEM)を提案する。
論文 参考訳(メタデータ) (2020-08-19T06:02:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。