論文の概要: Retinal Fundus Multi-Disease Image Classification using Hybrid CNN-Transformer-Ensemble Architectures
- arxiv url: http://arxiv.org/abs/2503.21465v1
- Date: Thu, 27 Mar 2025 12:55:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 12:54:56.279608
- Title: Retinal Fundus Multi-Disease Image Classification using Hybrid CNN-Transformer-Ensemble Architectures
- Title(参考訳): ハイブリッドCNN-Transformer-Ensembleアーキテクチャを用いた網膜ファウンダス多値画像分類
- Authors: Deependra Singh, Saksham Agarwal, Subhankar Mishra,
- Abstract要約: 我々の研究は、網膜疾患による人口の急激な世界的な問題に動機付けられています。
我々の主な目的は、網膜疾患を正確に予測できる包括的診断システムを開発することである。
- 参考スコア(独自算出の注目度): 0.3277163122167434
- License:
- Abstract: Our research is motivated by the urgent global issue of a large population affected by retinal diseases, which are evenly distributed but underserved by specialized medical expertise, particularly in non-urban areas. Our primary objective is to bridge this healthcare gap by developing a comprehensive diagnostic system capable of accurately predicting retinal diseases solely from fundus images. However, we faced significant challenges due to limited, diverse datasets and imbalanced class distributions. To overcome these issues, we have devised innovative strategies. Our research introduces novel approaches, utilizing hybrid models combining deeper Convolutional Neural Networks (CNNs), Transformer encoders, and ensemble architectures sequentially and in parallel to classify retinal fundus images into 20 disease labels. Our overarching goal is to assess these advanced models' potential in practical applications, with a strong focus on enhancing retinal disease diagnosis accuracy across a broader spectrum of conditions. Importantly, our efforts have surpassed baseline model results, with the C-Tran ensemble model emerging as the leader, achieving a remarkable model score of 0.9166, surpassing the baseline score of 0.9. Additionally, experiments with the IEViT model showcased equally promising outcomes with improved computational efficiency. We've also demonstrated the effectiveness of dynamic patch extraction and the integration of domain knowledge in computer vision tasks. In summary, our research strives to contribute significantly to retinal disease diagnosis, addressing the critical need for accessible healthcare solutions in underserved regions while aiming for comprehensive and accurate disease prediction.
- Abstract(参考訳): 我々の研究は、網膜疾患による人口の急激な世界的な問題によって動機付けられており、それは均等に分布するが、特に非都市地域では専門的な専門知識が不足している。
我々の主な目的は、眼底画像のみから網膜疾患を正確に予測できる包括的診断システムを開発することで、この医療ギャップを埋めることである。
しかし、限られた多様なデータセットと不均衡なクラス分布のため、大きな課題に直面しました。
これらの問題を克服するため、我々は革新的な戦略を考案した。
本研究は, より深い畳み込みニューラルネットワーク(CNN), トランスフォーマーエンコーダ, およびアンサンブルアーキテクチャを組み合わせたハイブリッドモデルを用いて, 網膜基底像を20の疾患ラベルに分類する手法を提案する。
我々の包括的なゴールは、より広い範囲の条件で網膜疾患の診断精度を高めることに重点を置いて、これらの高度なモデルの可能性を評価することである。
C-Tranアンサンブルモデルがリーダーとして登場し,0.9166の卓越したモデルスコアを達成し,ベースラインスコア0.9を突破した。
さらに、IEViTモデルによる実験は、計算効率を向上して同様に有望な結果を示した。
また、動的パッチ抽出とコンピュータビジョンタスクにおけるドメイン知識の統合の有効性を実証した。
結論として,本研究は網膜疾患の診断に大きく貢献することを目的としており,包括的かつ正確な疾患予測をめざして,未保存領域における医療ソリューションへの重要なニーズに対処する。
関連論文リスト
- Continually Evolved Multimodal Foundation Models for Cancer Prognosis [50.43145292874533]
がん予後は、患者の予後と生存率を予測する重要なタスクである。
これまでの研究では、臨床ノート、医療画像、ゲノムデータなどの多様なデータモダリティを統合し、補完的な情報を活用している。
既存のアプローチには2つの大きな制限がある。まず、各病院の患者記録など、各種のトレーニングに新しく到着したデータを組み込むことに苦慮する。
第二に、ほとんどのマルチモーダル統合手法は単純化された結合やタスク固有のパイプラインに依存しており、モダリティ間の複雑な相互依存を捉えることができない。
論文 参考訳(メタデータ) (2025-01-30T06:49:57Z) - Hybrid Interpretable Deep Learning Framework for Skin Cancer Diagnosis: Integrating Radial Basis Function Networks with Explainable AI [1.1049608786515839]
皮膚がんは世界中で最も流行し、致命的な疾患の1つである。
本稿では,畳み込みニューラルネットワーク(CNN)とラジアル基底関数(RBF)ネットワークを統合するハイブリッドディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-24T19:19:02Z) - EyeDiff: text-to-image diffusion model improves rare eye disease diagnosis [7.884451100342276]
EyeDiffは、自然言語のプロンプトからマルチモーダル眼科画像を生成するために設計されたテキスト・ツー・イメージモデルである。
EyeDiffは8つの大規模なデータセットでトレーニングされており、10のマルチリージョンの外部データセットに適応している。
論文 参考訳(メタデータ) (2024-11-15T07:30:53Z) - Distributed Federated Learning-Based Deep Learning Model for Privacy MRI Brain Tumor Detection [11.980634373191542]
分散トレーニングは、大規模な医用画像データセットの処理を容易にし、疾患診断の精度と効率を向上させる。
本稿では,データプライバシと効率的な疾患診断という2つの課題に対処するために,Federated Learning(FL)を活用した医用画像分類の革新的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-04-15T09:07:19Z) - Enhance Eye Disease Detection using Learnable Probabilistic Discrete Latents in Machine Learning Architectures [1.6000489723889526]
糖尿病網膜症や緑内障などの眼疾患は、公衆衛生上の重大な課題となる。
深層学習モデルは、網膜イメージングのような医療画像を分析する強力なツールとして登場した。
課題は、モデル適合性と不確実性の推定であり、これは臨床的な意思決定に不可欠である。
論文 参考訳(メタデータ) (2024-01-21T04:14:54Z) - Polar-Net: A Clinical-Friendly Model for Alzheimer's Disease Detection
in OCTA Images [53.235117594102675]
オプティカルコヒーレンス・トモグラフィーは、網膜微小血管の画像化によってアルツハイマー病(AD)を検出するための有望なツールである。
我々はPolar-Netと呼ばれる新しいディープラーニングフレームワークを提案し、解釈可能な結果を提供し、臨床上の事前知識を活用する。
Polar-Netは既存の最先端の手法よりも優れており,網膜血管変化とADとの関連性について,より貴重な病理学的証拠を提供する。
論文 参考訳(メタデータ) (2023-11-10T11:49:49Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - DRAC: Diabetic Retinopathy Analysis Challenge with Ultra-Wide Optical
Coherence Tomography Angiography Images [51.27125547308154]
第25回医用画像コンピューティング・コンピュータ支援介入国際会議(MICCAI 2022)にともなうDRAC糖尿病網膜症解析チャレンジの企画を行った。
この課題は、DR病変の分節化、画像品質評価、DRグレーディングの3つのタスクから構成される。
本稿では,課題の各課題について,トップパフォーマンスのソリューションと結果の要約と分析を行う。
論文 参考訳(メタデータ) (2023-04-05T12:04:55Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z) - Improving Robustness using Joint Attention Network For Detecting Retinal
Degeneration From Optical Coherence Tomography Images [0.0]
本稿では,2つのジョイントネットワークからなる新しいアーキテクチャとして,病原性特徴表現を用いることを提案する。
公開データセットに対する実験結果から,提案したジョイントネットワークは,未確認データセット上での最先端網膜疾患分類ネットワークの精度と堅牢性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-05-16T20:32:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。