論文の概要: Quadrant Segmentation VLM with Few-Shot Adaptation and OCT Learning-based Explainability Methods for Diabetic Retinopathy
- arxiv url: http://arxiv.org/abs/2512.22197v1
- Date: Sat, 20 Dec 2025 17:45:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:29.877261
- Title: Quadrant Segmentation VLM with Few-Shot Adaptation and OCT Learning-based Explainability Methods for Diabetic Retinopathy
- Title(参考訳): 糖尿病網膜症に対するFew-Shot Adaptation and OCT Learning-based Explainability Methodを用いたQuadrant Segmentation VLM
- Authors: Shivum Telang,
- Abstract要約: 糖尿病網膜症(DR: Diabetic Retinopathy)は、視覚障害の主要な原因であり、視力を維持するために早期発見が必要である。
現在のAIモデルは、病変のセグメンテーションを解釈可能性に利用しているが、手動による病変の注釈付けは、臨床医にとって実用的ではない。
本稿では,眼科医の推論を模倣したVLMを用いた新しいマルチモーダル説明可能性モデルを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diabetic Retinopathy (DR) is a leading cause of vision loss worldwide, requiring early detection to preserve sight. Limited access to physicians often leaves DR undiagnosed. To address this, AI models utilize lesion segmentation for interpretability; however, manually annotating lesions is impractical for clinicians. Physicians require a model that explains the reasoning for classifications rather than just highlighting lesion locations. Furthermore, current models are one-dimensional, relying on a single imaging modality for explainability and achieving limited effectiveness. In contrast, a quantitative-detection system that identifies individual DR lesions in natural language would overcome these limitations, enabling diverse applications in screening, treatment, and research settings. To address this issue, this paper presents a novel multimodal explainability model utilizing a VLM with few-shot learning, which mimics an ophthalmologist's reasoning by analyzing lesion distributions within retinal quadrants for fundus images. The model generates paired Grad-CAM heatmaps, showcasing individual neuron weights across both OCT and fundus images, which visually highlight the regions contributing to DR severity classification. Using a dataset of 3,000 fundus images and 1,000 OCT images, this innovative methodology addresses key limitations in current DR diagnostics, offering a practical and comprehensive tool for improving patient outcomes.
- Abstract(参考訳): 糖尿病網膜症(DR: Diabetic Retinopathy)は、視覚障害の主要な原因であり、視力を維持するために早期発見が必要である。
医師への限られたアクセスは、しばしば診断されていないDRを残します。
これを解決するために、AIモデルは病変のセグメンテーションを解釈可能性に活用するが、手動で病変を注釈付けすることは臨床医にとって現実的ではない。
医師は、単に病変の場所を強調するのではなく、分類の理由を説明するモデルを必要とします。
さらに、現在のモデルは1次元であり、説明可能性と限られた有効性を達成するために単一の画像モダリティに依存している。
対照的に、自然言語の個々のDR病変を同定する定量的検出システムは、これらの制限を克服し、スクリーニング、治療、研究設定における様々な応用を可能にする。
本稿では,眼科医の推論を模倣したVLMを用いた新しいマルチモーダル説明可能性モデルを提案する。
このモデルは、ペア化されたGrad-CAMヒートマップを生成し、OCT画像と眼底画像の両方に個々のニューロンの重みを示し、DR重度分類に寄与する領域を視覚的に強調する。
3000基の画像と1000基のCT画像のデータセットを用いて、この革新的な手法は、現在のDR診断における重要な限界に対処し、患者の結果を改善するための実用的で包括的なツールを提供する。
関連論文リスト
- A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Improving Classification of Retinal Fundus Image Using Flow Dynamics
Optimized Deep Learning Methods [0.0]
糖尿病網膜症(英: Diabetic Retinopathy, DR)は、糖尿病において網膜に存在する血管網を損傷する障害である。
経験豊富な臨床医は、疾患の特定に使用される画像中の腫瘍を識別する必要があるため、カラー・ファンドス画像を用いてDR診断を行うのにしばらく時間がかかる可能性がある。
論文 参考訳(メタデータ) (2023-04-29T16:11:34Z) - DRAC: Diabetic Retinopathy Analysis Challenge with Ultra-Wide Optical
Coherence Tomography Angiography Images [51.27125547308154]
第25回医用画像コンピューティング・コンピュータ支援介入国際会議(MICCAI 2022)にともなうDRAC糖尿病網膜症解析チャレンジの企画を行った。
この課題は、DR病変の分節化、画像品質評価、DRグレーディングの3つのタスクから構成される。
本稿では,課題の各課題について,トップパフォーマンスのソリューションと結果の要約と分析を行う。
論文 参考訳(メタデータ) (2023-04-05T12:04:55Z) - Bag of Tricks for Developing Diabetic Retinopathy Analysis Framework to
Overcome Data Scarcity [6.802798389355481]
糖尿病網膜症 (DR) 解析課題として, 病変分割, 画像品質評価, DRグレーディングについて検討した。
各タスクに対して,アンサンブル学習,データ強化,半教師付き学習を活用した堅牢な学習手法を導入する。
疑似ラベルの負の効果を低減するため,モデルの信頼度スコアに基づいて不確実な擬似ラベルを除外する信頼性の高い擬似ラベルを提案する。
論文 参考訳(メタデータ) (2022-10-18T03:25:00Z) - About Explicit Variance Minimization: Training Neural Networks for
Medical Imaging With Limited Data Annotations [2.3204178451683264]
VAT(Variance Aware Training)法は、モデル損失関数に分散誤差を導入することにより、この特性を利用する。
多様な領域から得られた3つの医用画像データセットと様々な学習目標に対するVATの有効性を検証した。
論文 参考訳(メタデータ) (2021-05-28T21:34:04Z) - An Interpretable Multiple-Instance Approach for the Detection of
referable Diabetic Retinopathy from Fundus Images [72.94446225783697]
基礎画像における参照糖尿病網膜症検出のための機械学習システムを提案する。
画像パッチから局所情報を抽出し,アテンション機構により効率的に組み合わせることで,高い分類精度を実現することができる。
我々は,現在入手可能な網膜画像データセットに対するアプローチを評価し,最先端の性能を示す。
論文 参考訳(メタデータ) (2021-03-02T13:14:15Z) - A Benchmark for Studying Diabetic Retinopathy: Segmentation, Grading,
and Transferability [76.64661091980531]
糖尿病患者は糖尿病網膜症(DR)を発症するリスクがある
コンピュータ支援型DR診断は、DRの早期検出と重度評価のための有望なツールである。
このデータセットは、ピクセルレベルのDR関連病変アノテーションを持つ1,842枚の画像と、6人の眼科医によって評価された画像レベルのラベルを持つ1,000枚の画像を有する。
論文 参考訳(メタデータ) (2020-08-22T07:48:04Z) - Synergic Adversarial Label Learning for Grading Retinal Diseases via
Knowledge Distillation and Multi-task Learning [29.46896757506273]
良質な医師のアノテート画像は非常に高価であり、様々な網膜疾患に対して限られた量のデータしか利用できない。
一部の研究では、AMDとDRは出血点や吐出などの一般的な特徴を共有しているが、ほとんどの分類アルゴリズムはこれらの疾患モデルを個別に訓練するだけである。
本稿では,関連網膜疾患ラベルを意味的および特徴空間の両方で付加的な信号として活用し,協調的にモデルを訓練するSALL法を提案する。
論文 参考訳(メタデータ) (2020-03-24T01:32:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。