論文の概要: Research on Improving the High Precision and Lightweight Diabetic Retinopathy Detection of YOLOv8n
- arxiv url: http://arxiv.org/abs/2507.00780v1
- Date: Tue, 01 Jul 2025 14:19:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.656681
- Title: Research on Improving the High Precision and Lightweight Diabetic Retinopathy Detection of YOLOv8n
- Title(参考訳): YOLOv8nの高精度・軽量糖尿病網膜症検出に関する研究
- Authors: Fei Yuhuan, Sun Xufei, Zang Ran, Wang Gengchen, Su Meng, Liu Fenghao,
- Abstract要約: 糖尿病網膜症の早期発見と診断は、現在眼科に焦点を絞っている研究の1つである。
これらの課題に対処するため,YOLO-KFGと呼ばれる改良型YOLOv8nに基づく軽量かつ高精度な検出モデルを提案する。
YOLOv5nやYOLOv10nのような単一ステージの主流アルゴリズムと比較して、YOLO-KFGは検出精度と効率の両方において大きな利点を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Early detection and diagnosis of diabetic retinopathy is one of the current research focuses in ophthalmology. However, due to the subtle features of micro-lesions and their susceptibility to background interference, ex-isting detection methods still face many challenges in terms of accuracy and robustness. To address these issues, a lightweight and high-precision detection model based on the improved YOLOv8n, named YOLO-KFG, is proposed. Firstly, a new dynamic convolution KWConv and C2f-KW module are designed to improve the backbone network, enhancing the model's ability to perceive micro-lesions. Secondly, a fea-ture-focused diffusion pyramid network FDPN is designed to fully integrate multi-scale context information, further improving the model's ability to perceive micro-lesions. Finally, a lightweight shared detection head GSDHead is designed to reduce the model's parameter count, making it more deployable on re-source-constrained devices. Experimental results show that compared with the base model YOLOv8n, the improved model reduces the parameter count by 20.7%, increases mAP@0.5 by 4.1%, and improves the recall rate by 7.9%. Compared with single-stage mainstream algorithms such as YOLOv5n and YOLOv10n, YOLO-KFG demonstrates significant advantages in both detection accuracy and efficiency.
- Abstract(参考訳): 糖尿病網膜症の早期発見と診断は、現在眼科に焦点を絞っている研究の1つである。
しかし,マイクロレジオンの微妙な特徴と背景干渉に対する感受性のため,既存の検出法は精度と堅牢性の点で多くの課題に直面している。
これらの課題に対処するため,YOLO-KFGと呼ばれる改良型YOLOv8nに基づく軽量かつ高精度な検出モデルを提案する。
まず、バックボーンネットワークを改善するために、新しい動的畳み込みKWConvとC2f-KWモジュールが設計され、マイクロ要素を知覚するモデルの能力を向上する。
第二に、フェースチャー中心の拡散ピラミッドネットワークFDPNは、マルチスケールのコンテキスト情報を完全に統合し、マイクロレセクションを知覚するモデルの能力をさらに向上するように設計されている。
最後に、軽量な共有検出ヘッドであるGSDHeadは、モデルのパラメータ数を削減し、再ソース制約のあるデバイスにデプロイできるように設計されている。
実験の結果, 基本モデル YOLOv8n と比較してパラメータ数を20.7%削減し, mAP@0.5 を4.1%増加させ, リコール率を7.9%改善した。
YOLOv5nやYOLOv10nのような単一ステージの主流アルゴリズムと比較して、YOLO-KFGは検出精度と効率の両方において大きな利点を示す。
関連論文リスト
- YOLO-RS: Remote Sensing Enhanced Crop Detection Methods [0.32985979395737786]
既存のターゲット検出手法は、リモートセンシング画像において、小さなターゲットを扱う際の性能が劣っている。
YOLO-RSは、小さなターゲットの検出を大幅に強化した最新のYolov11に基づいている。
リモートセンシング画像における小目標検出作業におけるYOLO-RSの有効性と適用可能性を検証する実験を行った。
論文 参考訳(メタデータ) (2025-04-15T13:13:22Z) - YOLO-LLTS: Real-Time Low-Light Traffic Sign Detection via Prior-Guided Enhancement and Multi-Branch Feature Interaction [45.79993863157494]
YOLO-LLTSは、低照度環境向けに設計されたエンドツーエンドのリアルタイム信号検出アルゴリズムである。
YOLO-LLTSは、HRFM-SOD(High-Resolution Feature Map for Small Object Detection)、MFIA(Multi-branch Feature Interaction Attention)、PGFE(Presideed-Guided Feature Enhancement Module)の3つの主要なコントリビューションを紹介している。
実験の結果、YOLO-LLTSは最新技術の性能を達成し、TT100K-nightでは2.7% mAP50:95と1.6% mAP50:95よりも優れていた。
論文 参考訳(メタデータ) (2025-03-18T04:28:05Z) - LAM-YOLO: Drones-based Small Object Detection on Lighting-Occlusion Attention Mechanism YOLO [0.9062164411594178]
LAM-YOLOは、ドローンベースの画像に特化して設計されたオブジェクト検出モデルである。
我々は、異なる照明条件下での小さな目標の視認性を高めるために、光遮断注意機構を導入する。
次に、回帰損失関数として改良されたSIB-IoUを用いてモデル収束を加速し、局所化精度を向上させる。
論文 参考訳(メタデータ) (2024-11-01T10:00:48Z) - Enhancing Diabetic Retinopathy Diagnosis: A Lightweight CNN Architecture for Efficient Exudate Detection in Retinal Fundus Images [0.0]
本稿では,自動解凍器検出に適した,新しい軽量畳み込みニューラルネットワークアーキテクチャを提案する。
我々は、モデルの一般化性を高めるために、ドメイン固有のデータ拡張を取り入れた。
本モデルでは,F1スコアの90%を達成し,基礎画像による糖尿病網膜症の早期発見における有効性を示した。
論文 参考訳(メタデータ) (2024-08-13T10:13:33Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - YOLOv8-AM: YOLOv8 Based on Effective Attention Mechanisms for Pediatric Wrist Fracture Detection [0.0]
本研究は,本来のYOLOv8アーキテクチャにアテンション機構を組み込んだYOLOv8-AMを提案する。
ResBlock + CBAM (ResCBAM) に基づくYOLOv8-AMモデルのIoU 50(mAP 50)の平均精度は63.6%から65.8%に向上し,SOTAの性能が向上した。
論文 参考訳(メタデータ) (2024-02-14T17:18:15Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。