論文の概要: Balancing Accuracy and Efficiency: CNN Fusion Models for Diabetic Retinopathy Screening
- arxiv url: http://arxiv.org/abs/2512.21861v1
- Date: Fri, 26 Dec 2025 04:54:43 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-29 11:53:18.167462
- Title: Balancing Accuracy and Efficiency: CNN Fusion Models for Diabetic Retinopathy Screening
- Title(参考訳): 糖尿病網膜症スクリーニングのためのCNN核融合モデル
- Authors: Md Rafid Islam, Rafsan Jany, Akib Ahmed, Mohammad Ashrafuzzaman Khan,
- Abstract要約: 糖尿病網膜症(DR)は、予防可能な失明の主要な原因であり続けているが、大規模なスクリーニングは、デバイスや個体群間での専門的可用性と画像品質の変動によって制限されている。
本研究では, 相補的畳み込みニューラルネットワーク(CNN)バックボーンの機能レベル融合が, グローバルソースの画像に対して, 正確かつ効率的なバイナリDRスクリーニングを実現することができるかどうかを検討する。
- 参考スコア(独自算出の注目度): 0.1749935196721634
- License:
- Abstract: Diabetic retinopathy (DR) remains a leading cause of preventable blindness, yet large-scale screening is constrained by limited specialist availability and variable image quality across devices and populations. This work investigates whether feature-level fusion of complementary convolutional neural network (CNN) backbones can deliver accurate and efficient binary DR screening on globally sourced fundus images. Using 11,156 images pooled from five public datasets (APTOS, EyePACS, IDRiD, Messidor, and ODIR), we frame DR detection as a binary classification task and compare three pretrained models (ResNet50, EfficientNet-B0, and DenseNet121) against pairwise and tri-fusion variants. Across five independent runs, fusion consistently outperforms single backbones. The EfficientNet-B0 + DenseNet121 (Eff+Den) fusion model achieves the best overall mean performance (accuracy: 82.89\%) with balanced class-wise F1-scores for normal (83.60\%) and diabetic (82.60\%) cases. While the tri-fusion is competitive, it incurs a substantially higher computational cost. Inference profiling highlights a practical trade-off: EfficientNet-B0 is the fastest (approximately 1.16 ms/image at batch size 1000), whereas the Eff+Den fusion offers a favorable accuracy--latency balance. These findings indicate that lightweight feature fusion can enhance generalization across heterogeneous datasets, supporting scalable binary DR screening workflows where both accuracy and throughput are critical.
- Abstract(参考訳): 糖尿病網膜症(DR)は、予防可能な失明の主要な原因であり続けているが、大規模なスクリーニングは、デバイスや個体群間での専門的可用性と画像品質の変動によって制限されている。
本研究では, 相補的畳み込みニューラルネットワーク(CNN)バックボーンの機能レベル融合が, グローバルソースの画像に対して, 正確かつ効率的なバイナリDRスクリーニングを実現することができるかどうかを検討する。
5つの公開データセット(APTOS、EyePACS、IDRiD、Messidor、ODIR)からプールされた11,156イメージを使用して、DR検出をバイナリ分類タスクとしてフレーム化し、3つの事前訓練されたモデル(ResNet50、EfficientNet-B0、DenseNet121)とペアとトリフュージョンの変種を比較した。
5つの独立した実行において、融合は単一のバックボーンよりも一貫して優れる。
効率的なNet-B0 + DenseNet121 (Eff+Den) 融合モデルは、正常 (83.60\%) と糖尿病 (82.60\%) のバランスの取れたクラスワイドF1スコアを持つ、最高の全体的な平均性能(精度:82.89\%)を達成する。
三重融合は競争力があるが、計算コストはかなり高い。
効率的なNet-B0は最速(バッチサイズ1000で約1.16ms/image)であり、Eff+Den融合は良好な精度とレイテンシのバランスを提供する。
これらの結果は、軽量な機能融合が異種データセット間の一般化を促進し、精度とスループットの両方が重要となるスケーラブルなバイナリDRスクリーニングワークフローをサポートすることを示唆している。
関連論文リスト
- Automated Radiographic Total Sharp Score (ARTSS) in Rheumatoid Arthritis: A Solution to Reduce Inter-Intra Reader Variation and Enhancing Clinical Practice [3.8516555293145345]
本研究では、深層学習を利用して全手X線画像を解析する自動放射線シャープ符号化フレームワークを提案する。
I) ResNet50, II) UNet.3, III) YOLOv7, IV) VGG16, VGG19, ResNet50, DenseNet201, EfficientNetB0, Vision Transformer (ViT) などのモデルを用いた手指分割による手指識別
論文 参考訳(メタデータ) (2025-09-08T16:21:45Z) - A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文 参考訳(メタデータ) (2025-08-19T14:41:22Z) - Enhancing Diabetic Retinopathy Classification Accuracy through Dual Attention Mechanism in Deep Learning [2.856144231792095]
本研究では,グローバルアテンションブロック(GAB)とカテゴリーアテンションブロック(CAB)をディープラーニングモデルに組み込む。
提案手法は,3つの事前学習ネットワークを用いた注意機構に基づくディープラーニングモデルに基づく。
提案手法はDR分類に関する最近報告された研究と同等の競争性能を実現する。
論文 参考訳(メタデータ) (2025-07-25T12:09:27Z) - A Feature-Level Ensemble Model for COVID-19 Identification in CXR Images using Choquet Integral and Differential Evolution Optimization [0.7510165488300369]
新型コロナウイルスのパンデミックを緩和するための効果的な戦略は、感染した個人を特定するための検査を統合することである。
RT-PCRは、新型コロナウイルスの診断における金の基準と考えられているが、偽陰性のリスクなどいくつかの制限がある。
本稿では,事前学習したディープ・コーン・ニューラル・ニューラルネットワーク(DCNN)をアンサンブル学習フレームワークに統合した新しいディープラーニング診断システムを提案する。
論文 参考訳(メタデータ) (2025-01-14T16:28:02Z) - Brain Tumor Classification on MRI in Light of Molecular Markers [56.99710477905796]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - TBDLNet: a network for classifying multidrug-resistant and
drug-sensitive tuberculosis [20.278451340628624]
TBDLNetは多剤耐性結核および薬剤感受性結核の分類に適している。
多剤耐性肺結核をできるだけ早く検出でき、治療計画の調整と治療効果の改善に役立つ。
論文 参考訳(メタデータ) (2023-10-27T15:51:33Z) - CNN-based fully automatic wrist cartilage volume quantification in MR
Image [55.41644538483948]
追加の注意層を持つU-net畳み込みニューラルネットワークは、最高の手首軟骨分割性能を提供する。
非MRI法を用いて軟骨体積測定の誤差を独立に評価すべきである。
論文 参考訳(メタデータ) (2022-06-22T14:19:06Z) - Blended Multi-Modal Deep ConvNet Features for Diabetic Retinopathy
Severity Prediction [0.0]
糖尿病網膜症(DR)は、世界中の視覚障害と視覚障害の主要な原因の1つである。
複数の事前学習したConvNetモデルから抽出した特徴をブレンドした網膜画像の最適表現を導出する。
DR識別は97.41%、カッパ統計は94.82、カッパ統計は81.7%、カッパ統計は71.1%である。
論文 参考訳(メタデータ) (2020-05-30T06:46:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。