論文の概要: Enhancing Skin Disease Classification Leveraging Transformer-based Deep Learning Architectures and Explainable AI
- arxiv url: http://arxiv.org/abs/2407.14757v1
- Date: Sat, 20 Jul 2024 05:38:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-23 21:04:01.086566
- Title: Enhancing Skin Disease Classification Leveraging Transformer-based Deep Learning Architectures and Explainable AI
- Title(参考訳): トランスフォーマーに基づくディープラーニングアーキテクチャと説明可能なAIを活用する皮膚疾患分類の強化
- Authors: Jayanth Mohan, Arrun Sivasubramanian, V Sowmya, Ravi Vinayakumar,
- Abstract要約: 皮膚疾患は世界の人口の3分の1以上に影響を与えるが、その影響は過小評価されることが多い。
深層学習技術は皮膚疾患の特定を含む様々なタスクに多くの可能性を示してきた。
この研究では、31のクラスを持つ皮膚疾患データセットを使用し、Vision Transformers、Swin Transformers、DivoV2のすべてのバージョンと比較した。
- 参考スコア(独自算出の注目度): 2.3149142745203326
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Skin diseases affect over a third of the global population, yet their impact is often underestimated. Automating skin disease classification to assist doctors with their prognosis might be difficult. Nevertheless, due to efficient feature extraction pipelines, deep learning techniques have shown much promise for various tasks, including dermatological disease identification. This study uses a skin disease dataset with 31 classes and compares it with all versions of Vision Transformers, Swin Transformers and DivoV2. The analysis is also extended to compare with benchmark convolution-based architecture presented in the literature. Transfer learning with ImageNet1k weights on the skin disease dataset contributes to a high test accuracy of 96.48\% and an F1-Score of 0.9727 using DinoV2, which is almost a 10\% improvement over this data's current benchmark results. The performance of DinoV2 was also compared for the HAM10000 and Dermnet datasets to test the model's robustness, and the trained model overcomes the benchmark results by a slight margin in test accuracy and in F1-Score on the 23 and 7 class datasets. The results are substantiated using explainable AI frameworks like GradCAM and SHAP, which provide precise image locations to map the disease, assisting dermatologists in early detection, prompt prognosis, and treatment.
- Abstract(参考訳): 皮膚疾患は世界の人口の3分の1以上に影響を与えるが、その影響は過小評価されることが多い。
皮膚疾患の分類を自動化して医師の予後を補助することは困難である。
それにもかかわらず、効率的な特徴抽出パイプラインのため、深層学習技術は皮膚疾患の特定を含む様々なタスクに多くの可能性を示してきた。
この研究では、31のクラスを持つ皮膚疾患データセットを使用し、Vision Transformers、Swin Transformers、DivoV2のすべてのバージョンと比較した。
この分析は、文献で示されたベンチマーク畳み込みベースのアーキテクチャと比較するために拡張される。
ImageNet1kによる皮膚疾患データセットでのトランスファーラーニングは、96.48\%の高いテスト精度と、DinoV2を使用したF1スコアの0.9727に寄与する。
DinoV2の性能はHAM10000とDermnetのデータセットと比較してモデルの堅牢性をテストし、トレーニングされたモデルはベンチマーク結果を23と7のクラスデータセットのF1-Scoreでわずかに比較した。
結果はGradCAMやSHAPといった説明可能なAIフレームワークを使って裏付けられ、病気をマッピングするための正確な画像位置を提供し、早期発見の皮膚科医を支援し、予後を早め、治療を行う。
関連論文リスト
- Brain Tumor Classification on MRI in Light of Molecular Markers [61.77272414423481]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - Enhancing Skin Lesion Diagnosis with Ensemble Learning [15.569484546674776]
本研究では,HAM10000データセットを用いて皮膚病変の診断を支援する深層学習手法の実装について検討した。
分類精度をさらに高めるために,最大投票,平均投票,積み重ねを用いたアンサンブルモデルを開発し,0.803,0.82,0.83の精度を得た。
最適性能のアンサンブル学習モデルであるスタックリングに基づいて,カスタマイズアーキテクチャと微調整を取り入れたモデルであるSkinNetを開発し,0.867の精度と0.96のAUCを実現した。
論文 参考訳(メタデータ) (2024-09-06T16:19:01Z) - Evaluating Machine Learning-based Skin Cancer Diagnosis [0.0]
この研究は、MobileNetベースのモデルとカスタムCNNモデルの2つの畳み込みニューラルネットワークアーキテクチャを評価する。
どちらのモデルも、皮膚病変を7つのカテゴリに分類し、危険病変と良性病変を区別する能力について評価されている。
この研究は、モデルが説明可能性を示す一方で、異なる肌のトーンの公平性を確保するためにさらなる開発が必要であると結論付けている。
論文 参考訳(メタデータ) (2024-09-04T02:44:48Z) - Comparative Performance Analysis of Transformer-Based Pre-Trained Models for Detecting Keratoconus Disease [0.0]
本研究は、変性眼疾患である角膜症(keratoconus)の診断のために、訓練済みの8つのCNNを比較した。
MobileNetV2は角膜と正常な症例を誤分類の少ない場合に最も正確なモデルであった。
論文 参考訳(メタデータ) (2024-08-16T20:15:24Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - A Web-based Mpox Skin Lesion Detection System Using State-of-the-art
Deep Learning Models Considering Racial Diversity [1.846958522363092]
以前は「モンキーポックス」と呼ばれていた「ムポックス」は、公衆衛生上重要な問題となり、世界中で110か国以上に広まっている。
ポリメラーゼ連鎖反応(PCR)に基づく診断がすぐには利用できない場合に、コンピュータ支援スクリーニングツールが有用であることが証明されている。
深層学習法は複雑なデータ表現を学習する上で強力であるが、その有効性は主に適切なトレーニングデータに依存している。
論文 参考訳(メタデータ) (2023-06-25T08:23:44Z) - Vision Transformers for femur fracture classification [59.99241204074268]
Vision Transformer (ViT) はテスト画像の83%を正確に予測することができた。
史上最大かつ最もリッチなデータセットを持つサブフラクチャーで良い結果が得られた。
論文 参考訳(メタデータ) (2021-08-07T10:12:42Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - Predictive Analysis of Diabetic Retinopathy with Transfer Learning [0.0]
本稿では,糖尿病網膜症分類のためのCNNアーキテクチャの性能をトランスファーラーニングの助けを借りて検討する。
その結果,VGG 16モデルを用いた画像ネット重み付きトランスファー学習は,95%の精度で最高の分類性能を示した。
論文 参考訳(メタデータ) (2020-11-08T18:54:57Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。