論文の概要: Temporal-Enhanced Interpretable Multi-Modal Prognosis and Risk Stratification Framework for Diabetic Retinopathy (TIMM-ProRS)
- arxiv url: http://arxiv.org/abs/2601.08240v1
- Date: Tue, 13 Jan 2026 05:57:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.075273
- Title: Temporal-Enhanced Interpretable Multi-Modal Prognosis and Risk Stratification Framework for Diabetic Retinopathy (TIMM-ProRS)
- Title(参考訳): 糖尿病網膜症(TIMM-ProRS)における経時的多変量予後とリスク階層化の枠組み
- Authors: Susmita Kar, A S M Ahsanul Sarkar Akib, Abdul Hasib, Samin Yaser, Anas Bin Azim,
- Abstract要約: 本研究では、ビジョントランスフォーマー(ViT)、畳み込みニューラルネットワーク(CNN)、グラフニューラルネットワーク(GNN)を統合した新しいディープラーニングフレームワークTIMM-ProRSを紹介する。
TIMM-ProRSは、網膜画像と側頭葉バイオマーカー(HbA1c、網膜厚)の両方を独自に利用し、マルチモーダルおよび側頭葉のダイナミクスを捉える。
このモデルは精度97.8%、F1スコアは0.96で、最先端の性能を示し、RSG-NetやDeepDRといった既存の手法より優れている。
- 参考スコア(独自算出の注目度): 0.17398560678845076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diabetic retinopathy (DR), affecting millions globally with projections indicating a significant rise, poses a severe blindness risk and strains healthcare systems. Diagnostic complexity arises from visual symptom overlap with conditions like age-related macular degeneration and hypertensive retinopathy, exacerbated by high misdiagnosis rates in underserved regions. This study introduces TIMM-ProRS, a novel deep learning framework integrating Vision Transformer (ViT), Convolutional Neural Network (CNN), and Graph Neural Network (GNN) with multi-modal fusion. TIMM-ProRS uniquely leverages both retinal images and temporal biomarkers (HbA1c, retinal thickness) to capture multi-modal and temporal dynamics. Evaluated comprehensively across diverse datasets including APTOS 2019 (trained), Messidor-2, RFMiD, EyePACS, and Messidor-1 (validated), the model achieves 97.8\% accuracy and an F1-score of 0.96, demonstrating state-of-the-art performance and outperforming existing methods like RSG-Net and DeepDR. This approach enables early, precise, and interpretable diagnosis, supporting scalable telemedical management and enhancing global eye health sustainability.
- Abstract(参考訳): 糖尿病網膜症(DR:diabetic retinopathy)は、世界中で何百万人もの患者を発症し、大きな増加を示している。
診断の複雑さは、加齢に伴う黄斑変性や高血圧性網膜症などの症状と重なる視覚症状から生じる。
本研究では、ビジョントランスフォーマー(ViT)、畳み込みニューラルネットワーク(CNN)、グラフニューラルネットワーク(GNN)とマルチモーダル融合を組み合わせた新しいディープラーニングフレームワークであるTIMM-ProRSを紹介する。
TIMM-ProRSは、網膜画像と側頭葉バイオマーカー(HbA1c、網膜厚)の両方を独自に利用し、マルチモーダルおよび側頭葉のダイナミクスを捉える。
APTOS 2019(トレーニング)、Messidor-2、RFMiD、EyePACS、Messidor-1(バリデーション)を含むさまざまなデータセットを総合的に評価し、97.8\%の精度とF1スコア0.96を達成し、最先端のパフォーマンスを示し、RSG-NetやDeepDRといった既存の手法よりも優れている。
このアプローチは、早期、正確、解釈可能な診断を可能にし、スケーラブルな遠隔医療管理をサポートし、グローバルな眼の健康維持性を高める。
関連論文リスト
- Beyond CLIP: Knowledge-Enhanced Multimodal Transformers for Cross-Modal Alignment in Diabetic Retinopathy Diagnosis [7.945705180020063]
本稿では,網膜基底像,臨床テキスト,構造化された患者データを統合する知識強化型関節埋め込みフレームワークを提案する。
このフレームワークはRecall@1の99.94%でほぼ完璧なテキスト・ツー・イメージ検索性能を実現している。
論文 参考訳(メタデータ) (2025-12-22T18:41:45Z) - R-GenIMA: Integrating Neuroimaging and Genetics with Interpretable Multimodal AI for Alzheimer's Disease Progression [63.97617759805451]
アルツハイマー病の早期発見には、マクロスケールの神経解剖学的変化とマイクロスケールの遺伝的感受性を統合できるモデルが必要である。
本稿では,新しいROIワイド・ビジョン・トランスフォーマと遺伝的プロンプトを結合した多モード多言語モデルR-GenIMAを紹介する。
R-GenIMAは、通常の認知、主観記憶、軽度認知障害、ADの4方向分類において最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-12-22T02:54:10Z) - DRetNet: A Novel Deep Learning Framework for Diabetic Retinopathy Diagnosis [8.234135343778993]
現在のDR検出システムは、画質の悪い画像、解釈可能性の欠如、ドメイン固有の知識の不十分な統合に苦慮している。
3つの革新的なコントリビューションを統合する新しいフレームワークを紹介します。
フレームワークの精度は92.7%、精度は92.5%、リコールは92.6%、F1スコアは92.5%、AUCは97.8%、mAPは0.96、MCCは0.85である。
論文 参考訳(メタデータ) (2025-09-01T02:27:16Z) - Design and Validation of a Responsible Artificial Intelligence-based System for the Referral of Diabetic Retinopathy Patients [65.57160385098935]
糖尿病網膜症の早期発見は、視力喪失のリスクを最大95%減少させる可能性がある。
我々は、AIライフサイクル全体にわたる倫理的原則を取り入れた、DRスクリーニングのための責任あるAIシステムであるRAIS-DRを開発した。
当科におけるRAIS-DRをFDA認可のEyeArtシステムと比較した。
論文 参考訳(メタデータ) (2025-08-17T21:54:11Z) - MultiRetNet: A Multimodal Vision Model and Deferral System for Staging Diabetic Retinopathy [0.0]
糖尿病網膜症(DR)は予防可能な失明の主要な原因であり、世界中で1億人以上に影響している。
低所得層の個人は、診断前に進行するリスクが高く、主にスクリーニングへのアクセスが限られているためである。
DRステージング精度を向上させるために,網膜イメージング,社会経済的要因,および協調性プロファイルを組み合わせた新しいパイプラインであるMultiRetNetを提案する。
論文 参考訳(メタデータ) (2025-07-19T20:00:31Z) - The Role of AI in Early Detection of Life-Threatening Diseases: A Retinal Imaging Perspective [10.884863227198975]
我々は最新のOCT/AおよびAO開発、AI/MLアプローチ、mHealth/Tele-ophthalmologyイニシアチブを体系的に合成する。
本稿では,マルチセンタープロトコルの標準化,将来性検証,網膜スクリーニングのシームレス化のためのロードマップを提案する。
論文 参考訳(メタデータ) (2025-05-27T07:19:37Z) - Retinal Fundus Multi-Disease Image Classification using Hybrid CNN-Transformer-Ensemble Architectures [0.3277163122167434]
我々の研究は、網膜疾患による人口の急激な世界的な問題に動機付けられています。
我々の主な目的は、網膜疾患を正確に予測できる包括的診断システムを開発することである。
論文 参考訳(メタデータ) (2025-03-27T12:55:07Z) - MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models [49.765466293296186]
近年,Med-LVLM (Med-LVLMs) の進歩により,対話型診断ツールの新たな可能性が高まっている。
Med-LVLMは、しばしば事実の幻覚に悩まされ、誤った診断につながることがある。
我々は,Med-LVLMの現実性を高めるために,多目的マルチモーダルRAGシステムMMed-RAGを提案する。
論文 参考訳(メタデータ) (2024-10-16T23:03:27Z) - Beyond the Eye: A Relational Model for Early Dementia Detection Using Retinal OCTA Images [43.73298205923969]
早期発症アルツハイマー病 (AD) と軽度認知障害 (MCI) をコントロールから識別するために, 網膜光コヒーレンストモグラフィー (OCTA) を用いた新しいPolarNet+を提案する。
提案手法は,まずカルト座標から極座標へのOCTA画像のマッピングを行う。
次に,包括的かつ臨床的に有用な情報抽出のための3次元画像のシリアライズと解析を行う多視点モジュールを提案する。
論文 参考訳(メタデータ) (2024-08-09T15:10:34Z) - Multi-scale Spatio-temporal Transformer-based Imbalanced Longitudinal
Learning for Glaucoma Forecasting from Irregular Time Series Images [45.894671834869975]
緑内障は、進行性視神経線維損傷と不可逆性失明を引き起こす主要な眼疾患の1つである。
逐次画像入力に適した変換器アーキテクチャに基づくマルチスケール時空間変換器ネットワーク(MST-former)を提案する。
本手法は, 軽度認知障害とアルツハイマー病の予測に90.3%の精度で, アルツハイマー病神経画像イニシアチブ(ADNI)MRIデータセットに優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-02-21T02:16:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。