論文の概要: Addressing High Class Imbalance in Multi-Class Diabetic Retinopathy Severity Grading with Augmentation and Transfer Learning
- arxiv url: http://arxiv.org/abs/2507.17121v2
- Date: Mon, 28 Jul 2025 23:58:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 12:52:36.817783
- Title: Addressing High Class Imbalance in Multi-Class Diabetic Retinopathy Severity Grading with Augmentation and Transfer Learning
- Title(参考訳): マルチクラス糖尿病網膜症重症度グレーディングにおける高次不均衡への対処 : 拡張学習と移行学習
- Authors: Faisal Ahmed,
- Abstract要約: 本稿では,2型および5型糖尿病網膜症(DR)分類のための堅牢なディープラーニングフレームワークを提案する。
2値分類では, 99.9%の精度, 98.6%の精度, 99.3%のリコール, 98.9%のF1スコア, 99.4%のAUCが得られた。
より困難な5クラス重度分類タスクでは、84.6%の競合精度と94.1%のAUCが、いくつかの既存手法より優れている。
- 参考スコア(独自算出の注目度): 1.5939351525664014
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diabetic retinopathy (DR) is a leading cause of vision loss worldwide, and early diagnosis through automated retinal image analysis can significantly reduce the risk of blindness. This paper presents a robust deep learning framework for both binary and five-class DR classification, leveraging transfer learning and extensive data augmentation to address the challenges of class imbalance and limited training data. We evaluate a range of pretrained convolutional neural network architectures, including variants of ResNet and EfficientNet, on the APTOS 2019 dataset. For binary classification, our proposed model achieves a state-of-the-art accuracy of 98.9%, with a precision of 98.6%, recall of 99.3%, F1-score of 98.9%, and an AUC of 99.4%. In the more challenging five-class severity classification task, our model obtains a competitive accuracy of 84.6% and an AUC of 94.1%, outperforming several existing approaches. Our findings also demonstrate that EfficientNet-B0 and ResNet34 offer optimal trade-offs between accuracy and computational efficiency across both tasks. These results underscore the effectiveness of combining class-balanced augmentation with transfer learning for high-performance DR diagnosis. The proposed framework provides a scalable and accurate solution for DR screening, with potential for deployment in real-world clinical environments.
- Abstract(参考訳): 糖尿病網膜症 (DR) は視覚障害の主要な原因であり、網膜自動画像解析による早期診断は視覚障害のリスクを著しく低下させる。
本稿では,クラス不均衡と限定訓練データの課題に対処するために,転送学習と広範なデータ拡張を活用し,二進法と五進法両方のDR分類のための堅牢なディープラーニングフレームワークを提案する。
APTOS 2019データセット上で、ResNetとEfficientNetの変種を含む、事前訓練された畳み込みニューラルネットワークアーキテクチャについて評価する。
2値分類では, 99.9%の精度, 98.6%の精度, 99.3%のリコール, 98.9%のF1スコア, 99.4%のAUCが得られた。
より困難な5クラス重度分類タスクでは、84.6%の競合精度と94.1%のAUCが、いくつかの既存手法より優れている。
また,EfficientNet-B0 と ResNet34 が両タスク間の精度と計算効率の最適なトレードオフを提供することを示した。
これらの結果は,高次DR診断におけるクラスバランス強化とトランスファーラーニングの併用の有効性を裏付けるものである。
提案するフレームワークは、DRスクリーニングのためのスケーラブルで正確なソリューションを提供し、実際の臨床環境に展開する可能性がある。
関連論文リスト
- Ustnlp16 at SemEval-2025 Task 9: Improving Model Performance through Imbalance Handling and Focal Loss [38.70308073598037]
分類タスクは、しばしば厳しいクラス不均衡、短いテキストと非構造化テキスト、および重なり合うセマンティックカテゴリに悩まされる。
本稿では,SemEval-2025 Task 9: Food Hazard Detectionを提案する。
論文 参考訳(メタデータ) (2025-04-24T16:35:44Z) - Diabetic Retinopathy Detection Based on Convolutional Neural Networks with SMOTE and CLAHE Techniques Applied to Fundus Images [0.0]
糖尿病網膜症 (DR) は糖尿病患者の眼の合併症の一つである。
本研究の目的は,DRの診断における人工知能(AI)の精度を評価することである。
論文 参考訳(メタデータ) (2025-04-08T05:38:53Z) - Enhancing Transfer Learning for Medical Image Classification with SMOTE: A Comparative Study [0.0]
本稿では,医療画像における多ラベル画像分類へのトランスファーラーニング(TL)の適用について検討し,拡張する。
以上の結果から, TLモデルは脳腫瘍の分類に優れ, ほぼ最適測定値が得られた。
我々は,SMOTE(Synthetic Minority Oversampling Computing Technique)とTLと従来の機械学習(ML)手法を統合し,精度を1.97%向上し,リコール(感度)を5.43%向上し,特異度を0.72%向上させる。
論文 参考訳(メタデータ) (2024-12-28T18:15:07Z) - Breast Tumor Classification Using EfficientNet Deep Learning Model [5.062500255359342]
我々は、集中的なデータ拡張パイプラインとコスト感受性学習を導入し、表現を改善し、モデルが多数派クラスを過度に好まないことを保証する。
以上の結果より,バイナリ分類性能が著しく向上し,良性症例に対する例外的リコールが向上した。
論文 参考訳(メタデータ) (2024-11-26T20:38:33Z) - Classifier Enhanced Deep Learning Model for Erythroblast Differentiation with Limited Data [0.08388591755871733]
病態と遺伝疾患の1%を含む血液疾患は、重大な診断上の課題を呈している。
本手法では,機械学習モデルの有効性を考慮した各種機械学習設定の評価を行う。
データが利用可能になった場合、提案されたソリューションは、小さくてユニークなデータセットの精度を高めるためのソリューションである。
論文 参考訳(メタデータ) (2024-11-23T15:51:15Z) - Virchow: A Million-Slide Digital Pathology Foundation Model [34.38679208931425]
本稿では,コンピュータ病理学の基礎モデルであるVirchowを紹介する。
Virchowは、150万のヘマトキシリンとエオシン染色されたスライドイメージに基づいて、632万のパラメータをトレーニングしたビジョントランスフォーマーモデルである。
論文 参考訳(メタデータ) (2023-09-14T15:09:35Z) - Self-supervised contrastive learning of echocardiogram videos enables
label-efficient cardiac disease diagnosis [48.64462717254158]
心エコービデオを用いた自己教師型コントラスト学習手法であるエコーCLRを開発した。
左室肥大症 (LVH) と大動脈狭窄症 (AS) の分類成績は,EchoCLR の訓練により有意に改善した。
EchoCLRは、医療ビデオの表現を学習する能力に特有であり、SSLがラベル付きデータセットからラベル効率の高い疾患分類を可能にすることを実証している。
論文 参考訳(メタデータ) (2022-07-23T19:17:26Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Efficient and Visualizable Convolutional Neural Networks for COVID-19
Classification Using Chest CT [0.0]
新型コロナウイルスは2020年12月4日現在、世界中で6500万人以上が感染している。
ディープラーニングは有望な診断技術として登場した。
本稿では,40種類の畳み込みニューラルネットワークアーキテクチャを新型コロナウイルスの診断のために評価・比較する。
論文 参考訳(メタデータ) (2020-12-22T07:09:48Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。