論文の概要: Enhancing Diabetic Retinopathy Classification Accuracy through Dual Attention Mechanism in Deep Learning
- arxiv url: http://arxiv.org/abs/2507.19199v1
- Date: Fri, 25 Jul 2025 12:09:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-28 16:16:48.94507
- Title: Enhancing Diabetic Retinopathy Classification Accuracy through Dual Attention Mechanism in Deep Learning
- Title(参考訳): 深層学習におけるデュアルアテンション機構による糖尿病網膜症分類の精度向上
- Authors: Abdul Hannan, Zahid Mahmood, Rizwan Qureshi, Hazrat Ali,
- Abstract要約: 本研究では,グローバルアテンションブロック(GAB)とカテゴリーアテンションブロック(CAB)をディープラーニングモデルに組み込む。
提案手法は,3つの事前学習ネットワークを用いた注意機構に基づくディープラーニングモデルに基づく。
提案手法はDR分類に関する最近報告された研究と同等の競争性能を実現する。
- 参考スコア(独自算出の注目度): 2.856144231792095
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic classification of Diabetic Retinopathy (DR) can assist ophthalmologists in devising personalized treatment plans, making it a critical component of clinical practice. However, imbalanced data distribution in the dataset becomes a bottleneck in the generalization of deep learning models trained for DR classification. In this work, we combine global attention block (GAB) and category attention block (CAB) into the deep learning model, thus effectively overcoming the imbalanced data distribution problem in DR classification. Our proposed approach is based on an attention mechanism-based deep learning model that employs three pre-trained networks, namely, MobileNetV3-small, Efficientnet-b0, and DenseNet-169 as the backbone architecture. We evaluate the proposed method on two publicly available datasets of retinal fundoscopy images for DR. Experimental results show that on the APTOS dataset, the DenseNet-169 yielded 83.20% mean accuracy, followed by the MobileNetV3-small and EfficientNet-b0, which yielded 82% and 80% accuracies, respectively. On the EYEPACS dataset, the EfficientNet-b0 yielded a mean accuracy of 80%, while the DenseNet-169 and MobileNetV3-small yielded 75.43% and 76.68% accuracies, respectively. In addition, we also compute the F1-score of 82.0%, precision of 82.1%, sensitivity of 83.0%, specificity of 95.5%, and a kappa score of 88.2% for the experiments. Moreover, in our work, the MobileNetV3-small has 1.6 million parameters on the APTOS dataset and 0.90 million parameters on the EYEPACS dataset, which is comparatively less than other methods. The proposed approach achieves competitive performance that is at par with recently reported works on DR classification.
- Abstract(参考訳): 糖尿病網膜症(DR)の自動分類は、眼科医がパーソナライズされた治療計画を策定するのを助けることができる。
しかし、データセット内の不均衡なデータ分布は、DR分類のために訓練されたディープラーニングモデルの一般化においてボトルネックとなる。
本研究では,グローバルアテンションブロック(GAB)とカテゴリーアテンションブロック(CAB)を深層学習モデルに組み合わせ,DR分類における不均衡なデータ分散問題を効果的に克服する。
提案手法は,3つの事前学習ネットワーク,すなわちMobileNetV3-small,Efficientnet-b0,DenseNet-169をバックボーンアーキテクチャとして使用する,アテンション機構に基づくディープラーニングモデルに基づく。
APTOSデータセットでは,DenseNet-169の平均精度が83.20%,MobileNetV3-smallとEfficientNet-b0が82%,80%であった。
EYEPACSデータセットでは、EfficientNet-b0の平均精度は80%、DenseNet-169とMobileNetV3-smallはそれぞれ75.43%、76.68%だった。
さらに,F1スコアの82.0%,精度82.1%,感度83.0%,特異度95.5%,カッパスコア88.2%も計算した。
さらに、我々の研究では、MobileNetV3-smallはAPTOSデータセットに1.6万のパラメータ、EYEPACSデータセットに0.90万のパラメータを持ち、他のメソッドよりも比較的少ない。
提案手法はDR分類に関する最近報告された研究と同等の競争性能を実現する。
関連論文リスト
- Robust Five-Class and binary Diabetic Retinopathy Classification Using Transfer Learning and Data Augmentation [1.3492288506683114]
本稿では,2型および5型糖尿病網膜症(DR)分類のための堅牢なディープラーニングフレームワークを提案する。
2値分類では, 99.9%の精度, 98.6%の精度, 99.3%のリコール, 98.9%のF1スコア, 99.4%のAUCが得られた。
より困難な5クラス重度分類タスクでは、84.6%の競合精度と94.1%のAUCが、いくつかの既存手法より優れている。
論文 参考訳(メタデータ) (2025-07-23T01:52:27Z) - Attention-Enhanced U-Net for Accurate Segmentation of COVID-19 Infected Lung Regions in CT Scans [0.0]
我々は、畳み込みニューラルネットワークを用いた新型コロナウイルスCTスキャンにおいて、感染した肺領域の自動セグメンテーションのための堅牢な手法を提案する。
このアプローチは、アテンション機構、データ拡張、後処理技術を備えた改良されたU-Netアーキテクチャに基づいている。
論文 参考訳(メタデータ) (2025-05-18T08:27:12Z) - Deep Learning Approach for Enhancing Oral Squamous Cell Carcinoma with LIME Explainable AI Technique [0.0]
データセットは5192イメージ(2435ノーマルと2511 OSCC)で構成されている。
本研究では,ResNet101,DenseNet121,VGG16,EfficientnetB3の4つのディープラーニングアーキテクチャを選択した。
効率の良いNetB3は98.33%とF1スコア(0.9844)で最高であり、他のモデルと比べて計算能力は著しく低下した。
論文 参考訳(メタデータ) (2024-11-21T14:53:59Z) - Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - Patch-Level Contrasting without Patch Correspondence for Accurate and
Dense Contrastive Representation Learning [79.43940012723539]
ADCLRは、正確で高密度な視覚表現を学習するための自己教師型学習フレームワークである。
提案手法は, コントラッシブな手法のための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-23T07:38:09Z) - SSL-CPCD: Self-supervised learning with composite pretext-class
discrimination for improved generalisability in endoscopic image analysis [3.1542695050861544]
深層学習に基づく教師付き手法は医用画像解析において広く普及している。
大量のトレーニングデータと、目に見えないデータセットに対する一般的な問題に直面する必要がある。
本稿では,加法的角マージンを用いたパッチレベルのインスタンスグループ識別とクラス間変動のペナル化について検討する。
論文 参考訳(メタデータ) (2023-05-31T21:28:08Z) - Novel Epileptic Seizure Detection Techniques and their Empirical Analysis [2.3301643766310374]
3次元化アルゴリズム、主成分分析(PCA)、独立成分分析(ICA)、線形判別分析(LDA)を用いる。
提案されたフレームワークはBonnデータセットでテストされる。
シミュレーション結果は、LDAとNBの組み合わせに対して100%の精度を提供する。
論文 参考訳(メタデータ) (2023-02-17T20:58:17Z) - CIRCA: comprehensible online system in support of chest X-rays-based
COVID-19 diagnosis [37.41181188499616]
深層学習技術は、新型コロナウイルスの迅速検出と疾患の進行のモニタリングに役立つ。
5つの異なるデータセットを使用して、モデルトレーニングのための23の799 CXRの代表的なデータセットを構築した。
The U-Net-based model was developed to identified a clinically relevant region of the CXR。
論文 参考訳(メタデータ) (2022-10-11T13:30:34Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。