論文の概要: AI-Driven Diabetic Retinopathy Diagnosis Enhancement through Image Processing and Salp Swarm Algorithm-Optimized Ensemble Network
- arxiv url: http://arxiv.org/abs/2503.14209v1
- Date: Tue, 18 Mar 2025 12:35:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-19 14:15:48.489067
- Title: AI-Driven Diabetic Retinopathy Diagnosis Enhancement through Image Processing and Salp Swarm Algorithm-Optimized Ensemble Network
- Title(参考訳): 画像処理とサルプスワムアルゴリズム最適化アンサンブルネットワークによるAIによる糖尿病網膜症診断の促進
- Authors: Saif Ur Rehman Khan, Muhammad Nabeel Asim, Sebastian Vollmer, Andreas Dengel,
- Abstract要約: 糖尿病網膜症は糖尿病患者の視覚障害の主要な原因であり、早期発見は視力喪失を防ぐ重要な役割を担っている。
本稿では, 画像前処理, バックボーン事前学習モデルの選択, 特徴強調, 最適化の4段階からなるDR診断のための効果的なアンサンブル法を提案する。
提案されたモデルは、マルチクラスKaggle APTOS 2019データセットで評価され、88.52%の精度が得られた。
- 参考スコア(独自算出の注目度): 5.001689778344014
- License:
- Abstract: Diabetic retinopathy is a leading cause of blindness in diabetic patients and early detection plays a crucial role in preventing vision loss. Traditional diagnostic methods are often time-consuming and prone to errors. The emergence of deep learning techniques has provided innovative solutions to improve diagnostic efficiency. However, single deep learning models frequently face issues related to extracting key features from complex retinal images. To handle this problem, we present an effective ensemble method for DR diagnosis comprising four main phases: image pre-processing, selection of backbone pre-trained models, feature enhancement, and optimization. Our methodology initiates with the pre-processing phase, where we apply CLAHE to enhance image contrast and Gamma correction is then used to adjust the brightness for better feature recognition. We then apply Discrete Wavelet Transform (DWT) for image fusion by combining multi-resolution details to create a richer dataset. Then, we selected three pre-trained models with the best performance named DenseNet169, MobileNetV1, and Xception for diverse feature extraction. To further improve feature extraction, an improved residual block is integrated into each model. Finally, the predictions from these base models are then aggregated using weighted ensemble approach, with the weights optimized by using Salp Swarm Algorithm (SSA).SSA intelligently explores the weight space and finds the optimal configuration of base architectures to maximize the performance of the ensemble model. The proposed model is evaluated on the multiclass Kaggle APTOS 2019 dataset and obtained 88.52% accuracy.
- Abstract(参考訳): 糖尿病網膜症は糖尿病患者の視覚障害の主要な原因であり、早期発見は視力喪失を防ぐ重要な役割を担っている。
従来の診断手法は時間を要することが多く、エラーを起こしやすい。
ディープラーニング技術の出現は、診断効率を向上させる革新的なソリューションを提供してきた。
しかし、単一ディープラーニングモデルは、複雑な網膜画像から重要な特徴を抽出する問題にしばしば直面する。
そこで本研究では,画像前処理,バックボーン事前学習モデルの選択,機能強化,最適化の4段階からなるDR診断のための効果的なアンサンブル手法を提案する。
提案手法は,画像コントラスト向上のためにCLAHEを適用した前処理フェーズから開始し,ガンマ補正を用いて特徴認識のための明るさ調整を行う。
次に、マルチ解像度の詳細を組み合わせてよりリッチなデータセットを作成することにより、画像融合に離散ウェーブレット変換(DWT)を適用する。
次に,DenseNet169,MobileNetV1,Xceptionの3つの事前学習モデルを選択し,特徴抽出を行った。
特徴抽出をさらに改善するため、改良された残留ブロックを各モデルに統合する。
最後に、これらのベースモデルからの予測は、Salp Swarm Algorithm (SSA) を用いて最適化された重み付きアンサンブルアプローチを用いて集約される。
SSAは重み空間をインテリジェントに探索し、アンサンブルモデルの性能を最大化するためにベースアーキテクチャの最適構成を求める。
提案されたモデルは、マルチクラスKaggle APTOS 2019データセットで評価され、88.52%の精度が得られた。
関連論文リスト
- Enhancing Eye Disease Diagnosis with Deep Learning and Synthetic Data Augmentation [0.0]
本稿では,糖尿病網膜症の早期発見と管理を目的としたアンサンブル学習手法を提案する。
提案したモデルはAPTOSデータセット上でテストされ、以前のモデルと比較して検証精度(99%)の優位性を示している。
論文 参考訳(メタデータ) (2024-07-25T04:09:17Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Improved Automatic Diabetic Retinopathy Severity Classification Using
Deep Multimodal Fusion of UWF-CFP and OCTA Images [1.6449510885987357]
糖尿病網膜症(英: Diabetic Retinopathy、DR)は、世界中の何百万人もの患者に影響を及ぼす糖尿病の合併症である。
近年のイメージング技術の進歩は、DRを早期に検出する機会を提供するが、同時に大きな課題も生んでいる。
本研究は,これらの画像モダリティを利用してDR分類を顕著に向上する,新しいマルチモーダル手法を提案する。
論文 参考訳(メタデータ) (2023-10-03T09:35:38Z) - Iterative-in-Iterative Super-Resolution Biomedical Imaging Using One
Real Image [8.412910029745762]
本稿では,1つの実画像のみを用いて深層学習に基づく超解像モデルを訓練する手法を提案する。
我々は,地中真実に類似した分布を持つ画像を自動的に選択するために,画像スクリーニングの混合指標を用いる。
5回のトレーニングの後、提案されたディープラーニングベースの超解像モデルでは、構造的類似性とピーク信号対雑音比が7.5%と5.49%改善した。
論文 参考訳(メタデータ) (2023-06-26T07:57:03Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Ultrasound Signal Processing: From Models to Deep Learning [64.56774869055826]
医用超音波画像は、信頼性と解釈可能な画像再構成を提供するために、高品質な信号処理に大きく依存している。
データ駆動方式で最適化されたディープラーニングベースの手法が人気を集めている。
比較的新しいパラダイムは、データ駆動型ディープラーニングの活用とドメイン知識の活用という2つのパワーを組み合わせたものだ。
論文 参考訳(メタデータ) (2022-04-09T13:04:36Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - A Multi-Stage Attentive Transfer Learning Framework for Improving
COVID-19 Diagnosis [49.3704402041314]
新型コロナの診断を改善するための多段階集中移動学習フレームワークを提案する。
提案するフレームワークは、複数のソースタスクと異なるドメインのデータから知識を学習し、正確な診断モデルを訓練する3つの段階からなる。
本稿では,肺CT画像のマルチスケール表現を学習するための自己教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-01-14T01:39:19Z) - Automatic Diagnosis of Malaria from Thin Blood Smear Images using Deep
Convolutional Neural Network with Multi-Resolution Feature Fusion [0.7310043452300736]
薄い血液スミア画像からマラリアを迅速に診断するためのエンドツーエンドのディープラーニングベースのアプローチが提案されている。
DilationNetと呼ばれる効率的でスケーラブルなディープニューラルネットワークは、畳み込みの拡散率を変化させ、異なる受容領域から特徴を抽出することによって、大きなスペクトルから特徴を組み込む。
提案されたDeepFusionNetアーキテクチャと機能融合スキームを導入し、個々の訓練を受けたネットワークの特徴空間を共同で最適化する。
公開データセットにおける実験は、他の最先端のアプローチよりも99.5%以上精度で優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-12-09T22:44:05Z) - Automated Prostate Cancer Diagnosis Based on Gleason Grading Using
Convolutional Neural Network [12.161266795282915]
そこで本研究では,前立腺癌(PCa)の完全分類のための畳み込みニューラルネットワーク(CNN)を用いた自動分類法を提案する。
Patch-Based Image Reconstruction (PBIR) と呼ばれるデータ拡張手法が提案され,WSIの高分解能化と多様性の向上が図られた。
対象データセットへの事前学習モデルの適応性を高めるために,分布補正モジュールを開発した。
論文 参考訳(メタデータ) (2020-11-29T06:42:08Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。