論文の概要: Enhancing Diabetic Retinopathy Classification Accuracy through Dual Attention Mechanism in Deep Learning
- arxiv url: http://arxiv.org/abs/2507.19199v1
- Date: Fri, 25 Jul 2025 12:09:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-28 16:16:48.94507
- Title: Enhancing Diabetic Retinopathy Classification Accuracy through Dual Attention Mechanism in Deep Learning
- Title(参考訳): 深層学習におけるデュアルアテンション機構による糖尿病網膜症分類の精度向上
- Authors: Abdul Hannan, Zahid Mahmood, Rizwan Qureshi, Hazrat Ali,
- Abstract要約: 本研究では,グローバルアテンションブロック(GAB)とカテゴリーアテンションブロック(CAB)をディープラーニングモデルに組み込む。
提案手法は,3つの事前学習ネットワークを用いた注意機構に基づくディープラーニングモデルに基づく。
提案手法はDR分類に関する最近報告された研究と同等の競争性能を実現する。
- 参考スコア(独自算出の注目度): 2.856144231792095
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic classification of Diabetic Retinopathy (DR) can assist ophthalmologists in devising personalized treatment plans, making it a critical component of clinical practice. However, imbalanced data distribution in the dataset becomes a bottleneck in the generalization of deep learning models trained for DR classification. In this work, we combine global attention block (GAB) and category attention block (CAB) into the deep learning model, thus effectively overcoming the imbalanced data distribution problem in DR classification. Our proposed approach is based on an attention mechanism-based deep learning model that employs three pre-trained networks, namely, MobileNetV3-small, Efficientnet-b0, and DenseNet-169 as the backbone architecture. We evaluate the proposed method on two publicly available datasets of retinal fundoscopy images for DR. Experimental results show that on the APTOS dataset, the DenseNet-169 yielded 83.20% mean accuracy, followed by the MobileNetV3-small and EfficientNet-b0, which yielded 82% and 80% accuracies, respectively. On the EYEPACS dataset, the EfficientNet-b0 yielded a mean accuracy of 80%, while the DenseNet-169 and MobileNetV3-small yielded 75.43% and 76.68% accuracies, respectively. In addition, we also compute the F1-score of 82.0%, precision of 82.1%, sensitivity of 83.0%, specificity of 95.5%, and a kappa score of 88.2% for the experiments. Moreover, in our work, the MobileNetV3-small has 1.6 million parameters on the APTOS dataset and 0.90 million parameters on the EYEPACS dataset, which is comparatively less than other methods. The proposed approach achieves competitive performance that is at par with recently reported works on DR classification.
- Abstract(参考訳): 糖尿病網膜症(DR)の自動分類は、眼科医がパーソナライズされた治療計画を策定するのを助けることができる。
しかし、データセット内の不均衡なデータ分布は、DR分類のために訓練されたディープラーニングモデルの一般化においてボトルネックとなる。
本研究では,グローバルアテンションブロック(GAB)とカテゴリーアテンションブロック(CAB)を深層学習モデルに組み合わせ,DR分類における不均衡なデータ分散問題を効果的に克服する。
提案手法は,3つの事前学習ネットワーク,すなわちMobileNetV3-small,Efficientnet-b0,DenseNet-169をバックボーンアーキテクチャとして使用する,アテンション機構に基づくディープラーニングモデルに基づく。
APTOSデータセットでは,DenseNet-169の平均精度が83.20%,MobileNetV3-smallとEfficientNet-b0が82%,80%であった。
EYEPACSデータセットでは、EfficientNet-b0の平均精度は80%、DenseNet-169とMobileNetV3-smallはそれぞれ75.43%、76.68%だった。
さらに,F1スコアの82.0%,精度82.1%,感度83.0%,特異度95.5%,カッパスコア88.2%も計算した。
さらに、我々の研究では、MobileNetV3-smallはAPTOSデータセットに1.6万のパラメータ、EYEPACSデータセットに0.90万のパラメータを持ち、他のメソッドよりも比較的少ない。
提案手法はDR分類に関する最近報告された研究と同等の競争性能を実現する。
関連論文リスト
- Beyond Anatomy: Explainable ASD Classification from rs-fMRI via Functional Parcellation and Graph Attention Networks [6.923757075165361]
解剖学的脳解析は rs-fMRI に基づく自閉症スペクトラム障害 (ASD) の分類を支配している。
ABIDE Iデータセット上の解剖学的(AAL)と機能的(MSDL)パーセレーション戦略を比較したグラフベースのディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-03T02:05:20Z) - FUGC: Benchmarking Semi-Supervised Learning Methods for Cervical Segmentation [63.7829089874007]
本稿では,頚椎椎間板断裂における半教師あり学習のための最初のベンチマークであるFetal Ultrasound Grand Challenge (FUGC)を紹介する。
FUGCは、500のトレーニング画像、90の検証画像、300のテスト画像を含む890のTVSイメージのデータセットを提供する。
Dice similarity Coefficient (DSC), Hausdorff Distance (HD), and Runtime (RT), with a weighted combination of 0.4/0.4/0.2。
論文 参考訳(メタデータ) (2026-01-22T01:34:39Z) - Balancing Accuracy and Efficiency: CNN Fusion Models for Diabetic Retinopathy Screening [0.1749935196721634]
糖尿病網膜症(DR)は、予防可能な失明の主要な原因であり続けているが、大規模なスクリーニングは、デバイスや個体群間での専門的可用性と画像品質の変動によって制限されている。
本研究では, 相補的畳み込みニューラルネットワーク(CNN)バックボーンの機能レベル融合が, グローバルソースの画像に対して, 正確かつ効率的なバイナリDRスクリーニングを実現することができるかどうかを検討する。
論文 参考訳(メタデータ) (2025-12-26T04:54:43Z) - A Novel Hybrid Deep Learning and Chaotic Dynamics Approach for Thyroid Cancer Classification [3.1331787430863485]
本稿では,適応畳み込みニューラルネットワーク(CNN)とCohen-Daubechies-Feauveau(CDF9/7)ウェーブレットを結合するインテリジェントな分類法を提案する。
DDTI甲状腺超音波画像(n = 1,638画像,819悪性/819良性)を5倍のクロスバリデーションを用いて評価した。
提案手法は98.17%の精度、98.76%の感度、97.58%の特異性、97.55%のF1スコア、AUCは0.9912である。
論文 参考訳(メタデータ) (2025-09-28T16:46:31Z) - Deep Active Learning for Lung Disease Severity Classification from Chest X-rays: Learning with Less Data in the Presence of Class Imbalance [0.0]
本研究は,2020年1月から11月にかけて,エモリー医療関連病院で963名の胸部X線検査を行った。
モンテカルロ・ドロップアウトを用いたディープニューラルネットワークは、能動的学習を用いて病気の重症度を分類して訓練された。
BNN近似と重み付き損失による深いアクティブラーニングは、ラベル付きデータ要求を効果的に削減する。
論文 参考訳(メタデータ) (2025-08-28T23:29:56Z) - A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文 参考訳(メタデータ) (2025-08-19T14:41:22Z) - Robust Five-Class and binary Diabetic Retinopathy Classification Using Transfer Learning and Data Augmentation [1.3492288506683114]
本稿では,2型および5型糖尿病網膜症(DR)分類のための堅牢なディープラーニングフレームワークを提案する。
2値分類では, 99.9%の精度, 98.6%の精度, 99.3%のリコール, 98.9%のF1スコア, 99.4%のAUCが得られた。
より困難な5クラス重度分類タスクでは、84.6%の競合精度と94.1%のAUCが、いくつかの既存手法より優れている。
論文 参考訳(メタデータ) (2025-07-23T01:52:27Z) - Attention-Enhanced U-Net for Accurate Segmentation of COVID-19 Infected Lung Regions in CT Scans [0.0]
我々は、畳み込みニューラルネットワークを用いた新型コロナウイルスCTスキャンにおいて、感染した肺領域の自動セグメンテーションのための堅牢な手法を提案する。
このアプローチは、アテンション機構、データ拡張、後処理技術を備えた改良されたU-Netアーキテクチャに基づいている。
論文 参考訳(メタデータ) (2025-05-18T08:27:12Z) - Deep Learning Approach for Enhancing Oral Squamous Cell Carcinoma with LIME Explainable AI Technique [0.0]
データセットは5192イメージ(2435ノーマルと2511 OSCC)で構成されている。
本研究では,ResNet101,DenseNet121,VGG16,EfficientnetB3の4つのディープラーニングアーキテクチャを選択した。
効率の良いNetB3は98.33%とF1スコア(0.9844)で最高であり、他のモデルと比べて計算能力は著しく低下した。
論文 参考訳(メタデータ) (2024-11-21T14:53:59Z) - Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - Patch-Level Contrasting without Patch Correspondence for Accurate and
Dense Contrastive Representation Learning [79.43940012723539]
ADCLRは、正確で高密度な視覚表現を学習するための自己教師型学習フレームワークである。
提案手法は, コントラッシブな手法のための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-23T07:38:09Z) - SSL-CPCD: Self-supervised learning with composite pretext-class
discrimination for improved generalisability in endoscopic image analysis [3.1542695050861544]
深層学習に基づく教師付き手法は医用画像解析において広く普及している。
大量のトレーニングデータと、目に見えないデータセットに対する一般的な問題に直面する必要がある。
本稿では,加法的角マージンを用いたパッチレベルのインスタンスグループ識別とクラス間変動のペナル化について検討する。
論文 参考訳(メタデータ) (2023-05-31T21:28:08Z) - Novel Epileptic Seizure Detection Techniques and their Empirical Analysis [2.3301643766310374]
3次元化アルゴリズム、主成分分析(PCA)、独立成分分析(ICA)、線形判別分析(LDA)を用いる。
提案されたフレームワークはBonnデータセットでテストされる。
シミュレーション結果は、LDAとNBの組み合わせに対して100%の精度を提供する。
論文 参考訳(メタデータ) (2023-02-17T20:58:17Z) - CIRCA: comprehensible online system in support of chest X-rays-based
COVID-19 diagnosis [37.41181188499616]
深層学習技術は、新型コロナウイルスの迅速検出と疾患の進行のモニタリングに役立つ。
5つの異なるデータセットを使用して、モデルトレーニングのための23の799 CXRの代表的なデータセットを構築した。
The U-Net-based model was developed to identified a clinically relevant region of the CXR。
論文 参考訳(メタデータ) (2022-10-11T13:30:34Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。