論文の概要: Enhancing DR Classification with Swin Transformer and Shifted Window Attention
- arxiv url: http://arxiv.org/abs/2504.15317v1
- Date: Sun, 20 Apr 2025 13:23:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-01 02:14:23.972882
- Title: Enhancing DR Classification with Swin Transformer and Shifted Window Attention
- Title(参考訳): Swin Transformer と Shifted Window Attention によるDR分類の強化
- Authors: Meher Boulaabi, Takwa Ben Aïcha Gader, Afef Kacem Echi, Zied Bouraoui,
- Abstract要約: 糖尿病網膜症 (DR) は, 早期発見の重要性を浮き彫りにしている。
画像トリミング、コントラスト制限適応ヒストグラム等化(CLAHE)、およびモデル一般化とレジリエンスを改善するためのターゲットデータ拡張を組み込んだ頑健な前処理パイプラインを提案する。
我々は,多クラスDR分類のためのAptosデータセットとIDRiDデータセットを用いて,精度89.65%,精度97.40%を実現した。
- 参考スコア(独自算出の注目度): 9.99302279736049
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diabetic retinopathy (DR) is a leading cause of blindness worldwide, underscoring the importance of early detection for effective treatment. However, automated DR classification remains challenging due to variations in image quality, class imbalance, and pixel-level similarities that hinder model training. To address these issues, we propose a robust preprocessing pipeline incorporating image cropping, Contrast-Limited Adaptive Histogram Equalization (CLAHE), and targeted data augmentation to improve model generalization and resilience. Our approach leverages the Swin Transformer, which utilizes hierarchical token processing and shifted window attention to efficiently capture fine-grained features while maintaining linear computational complexity. We validate our method on the Aptos and IDRiD datasets for multi-class DR classification, achieving accuracy rates of 89.65% and 97.40%, respectively. These results demonstrate the effectiveness of our model, particularly in detecting early-stage DR, highlighting its potential for improving automated retinal screening in clinical settings.
- Abstract(参考訳): 糖尿病網膜症 (DR) は, 早期発見の重要性を浮き彫りにしている。
しかし、画像品質、クラス不均衡、およびモデルの訓練を妨げるピクセルレベルの類似性のために、自動DR分類は依然として困難である。
これらの問題に対処するため,画像トリミング,コントラスト制限適応ヒストグラム等化(Contrast-Limited Adaptive Histogram Equalization, CLAHE),およびモデル一般化とレジリエンスの向上を目的としたターゲットデータ拡張を組み込んだ,堅牢な前処理パイプラインを提案する。
提案手法では,階層型トークン処理とウィンドウアテンションを併用したSwin Transformerを用いて,線形計算複雑性を維持しつつ,微細な特徴を効率よく把握する。
我々は,多クラスDR分類のためのAptosデータセットとIDRiDデータセットを用いて,精度89.65%,精度97.40%を実現した。
これらの結果から,本モデルの有効性,特に早期DRの検出において,臨床環境における網膜自動スクリーニングの改善の可能性が示唆された。
関連論文リスト
- VR-FuseNet: A Fusion of Heterogeneous Fundus Data and Explainable Deep Network for Diabetic Retinopathy Classification [0.0]
本稿では,VR-FuseNetと呼ばれる新しいハイブリッドディープラーニングモデルを提案することによって,糖尿病網膜症自動検出のための包括的アプローチを提案する。
提案したVR-FuseNetモデルは、最先端の畳み込みニューラルネットワークであるVGG19と、その深い階層的特徴抽出で知られるResNet50V2の強みを組み合わせたものだ。
このモデルは、糖尿病網膜症分類タスクにおけるハイブリッド特徴抽出の有効性を示すすべてのパフォーマンス指標において、個々のアーキテクチャよりも優れている。
論文 参考訳(メタデータ) (2025-04-30T09:38:47Z) - Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。
本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。
提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - Comprehensive Evaluation of OCT-based Automated Segmentation of Retinal Layer, Fluid and Hyper-Reflective Foci: Impact on Diabetic Retinopathy Severity Assessment [0.0]
糖尿病網膜症(DR)は視覚障害の主要な原因であり、不可逆的な損傷を防ぐために早期かつ正確な評価が必要である。
本研究では,網膜層の自動セグメンテーションのための能動的学習に基づくディープラーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2025-03-03T07:23:56Z) - DiffuPT: Class Imbalance Mitigation for Glaucoma Detection via Diffusion Based Generation and Model Pretraining [1.8218878957822688]
緑内障は、視神経頭の構造的損傷と視野の機能的変化を特徴とする進行性視神経症である。
本研究では, 緑内障の診断, 特に合成データ生成によるクラス不均衡に対処するために, 生成的枠組みを用いている。
論文 参考訳(メタデータ) (2024-12-04T17:39:44Z) - Cross Feature Fusion of Fundus Image and Generated Lesion Map for Referable Diabetic Retinopathy Classification [1.091626241764448]
糖尿病網膜症(DR)は視覚障害の主要な原因であり、早期発見と診断を必要とする。
本研究では,伝達学習と相互注意機構を利用した高度な相互学習DR分類法を開発した。
2つの公開データセットを利用して、我々の実験は94.6%の精度を示し、現在の最先端の手法を4.4%上回った。
論文 参考訳(メタデータ) (2024-11-06T02:23:38Z) - Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy [0.0]
本稿では,高忠実かつ多様なDRファウンダス画像を生成するためのフレームワークを提案する。
生成画像内のDR重大度と視覚的特徴を包括的に制御する。
我々は、条件付きで生成したDR画像をグレードで操作し、データセットの多様性をさらに向上する。
論文 参考訳(メタデータ) (2024-09-11T17:08:28Z) - Leveraging Semi-Supervised Graph Learning for Enhanced Diabetic
Retinopathy Detection [0.0]
糖尿病網膜症(DR: Diabetic Retinopathy)は、早期発見と治療の急激な必要性を浮き彫りにしている。
機械学習(ML)技術の最近の進歩は、DR検出における将来性を示しているが、ラベル付きデータの可用性は、しばしばパフォーマンスを制限している。
本研究では,DR検出に適したSemi-Supervised Graph Learning SSGLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-02T04:42:08Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。