論文の概要: Functional Localization Enforced Deep Anomaly Detection Using Fundus Images
- arxiv url: http://arxiv.org/abs/2511.18627v1
- Date: Sun, 23 Nov 2025 21:56:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.937737
- Title: Functional Localization Enforced Deep Anomaly Detection Using Fundus Images
- Title(参考訳): 基底画像を用いた深部異常検出による機能的局在化
- Authors: Jan Benedikt Ruhland, Thorsten Papenbrock, Jan-Peter Sowa, Ali Canbay, Nicole Eter, Bernd Freisleben, Dominik Heider,
- Abstract要約: 糖尿病網膜症と加齢黄斑変性は確実に検出されたが,緑内障は最も頻度の低い疾患であった。
GANomaly-based anomaly detector を開発し,AUC0.76を達成し,本質的な再構成に基づく説明可能性と無意味なデータへの堅牢な一般化を実現した。
- 参考スコア(独自算出の注目度): 3.0606378255830253
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Reliable detection of retinal diseases from fundus images is challenged by the variability in imaging quality, subtle early-stage manifestations, and domain shift across datasets. In this study, we systematically evaluated a Vision Transformer (ViT) classifier under multiple augmentation and enhancement strategies across several heterogeneous public datasets, as well as the AEyeDB dataset, a high-quality fundus dataset created in-house and made available for the research community. The ViT demonstrated consistently strong performance, with accuracies ranging from 0.789 to 0.843 across datasets and diseases. Diabetic retinopathy and age-related macular degeneration were detected reliably, whereas glaucoma remained the most frequently misclassified disease. Geometric and color augmentations provided the most stable improvements, while histogram equalization benefited datasets dominated by structural subtlety. Laplacian enhancement reduced performance across different settings. On the Papila dataset, the ViT with geometric augmentation achieved an AUC of 0.91, outperforming previously reported convolutional ensemble baselines (AUC of 0.87), underscoring the advantages of transformer architectures and multi-dataset training. To complement the classifier, we developed a GANomaly-based anomaly detector, achieving an AUC of 0.76 while providing inherent reconstruction-based explainability and robust generalization to unseen data. Probabilistic calibration using GUESS enabled threshold-independent decision support for future clinical implementation.
- Abstract(参考訳): 眼底画像からの網膜疾患の信頼性検出は、画像品質の変動、微妙な早期発現、データセット間のドメインシフトによって困難である。
本研究では,複数の異種公共データセットを対象とし,複数の拡張・拡張戦略に基づいて視覚変換器(ViT)分類器を体系的に評価し,高品質なファンドデータセットであるAEyeDBデータセットを社内で作成し,研究コミュニティで利用可能とした。
ViTは一貫して強い性能を示し、データセットと疾患の合計で0.789から0.843まで上昇した。
糖尿病網膜症と加齢黄斑変性は確実に検出されたが,緑内障は最も頻度の低い疾患であった。
幾何学的および色の増大は最も安定した改善であり、ヒストグラムの等化は構造的な微妙さに支配されるデータセットに恩恵を与えた。
ラプラシアンの強化は異なる設定で性能を低下させた。
ピラのデータセットでは、幾何学的拡張によるViTはAUC0.91を達成し、以前報告された畳み込みアンサンブルベースライン(AUC0.87)を上回り、トランスフォーマーアーキテクチャとマルチデータセットトレーニングの利点を浮き彫りにした。
分類器を補完するため, GANomaly を用いた異常検出装置を開発し,AUC 0.76 を実現した。
GUESSを用いた確率的キャリブレーションにより、将来の臨床実装のためのしきい値非依存決定支援が可能となった。
関連論文リスト
- Automated Multi-label Classification of Eleven Retinal Diseases: A Benchmark of Modern Architectures and a Meta-Ensemble on a Large Synthetic Dataset [1.996975578218265]
我々は、11の網膜疾患を分類するエンドツーエンドのディープラーニングパイプラインを開発した。
合成データのみに訓練されたモデルは,複数の病態を正確に分類し,実際の臨床画像に効果的に一般化できることを示す。
論文 参考訳(メタデータ) (2025-08-21T22:09:53Z) - PySeizure: A single machine learning classifier framework to detect seizures in diverse datasets [0.0]
我々は、様々な臨床データセット間で堅牢な発作検出を可能にする、革新的なオープンソースの機械学習フレームワークを導入する。
堅牢性を高めるため、このフレームワークは自動前処理パイプラインを組み込んで、データの標準化と過半数の投票機構を備えている。
データセット内のモデルをトレーニングし、チューニングし、評価し、データセット間の転送可能性を評価します。
論文 参考訳(メタデータ) (2025-08-10T09:12:29Z) - Revisiting Automatic Data Curation for Vision Foundation Models in Digital Pathology [41.34847597178388]
視覚基盤モデル(FM)は、全スライディング画像から抽出された高度に異質なタイルの組織学的特徴を表現することを学ぶ。
タイルレベルでの教師なし自動データキュレーションの可能性について検討し,3億5000万個のタイルを考慮に入れた。
論文 参考訳(メタデータ) (2025-03-24T14:23:48Z) - ADformer: A Multi-Granularity Spatial-Temporal Transformer for EEG-Based Alzheimer Detection [42.72554952799386]
脳波は、アルツハイマー病(AD)の検出において神経科医を支援する費用効率が高く効率的なツールとして登場した
生の脳波信号から時間的特徴と空間的特徴の両方を捉えるために設計された新しい多粒度時空間変換器であるADformerを提案する。
実験の結果、ADformerは既存の手法を一貫して上回り、被験者レベルのF1スコアは92.82%、89.83%、67.99%、83.98%となっている。
論文 参考訳(メタデータ) (2024-08-17T14:10:41Z) - Comprehensive Multimodal Deep Learning Survival Prediction Enabled by a Transformer Architecture: A Multicenter Study in Glioblastoma [4.578027879885667]
本研究は,変圧器を用いた深層学習モデルにMR画像,臨床および分子病理学的データを統合することにより,グリオーマの生存率予測を改善することを目的とする。
このモデルは、自己教師付き学習技術を用いて、高次元MRI入力を効果的に符号化し、クロスアテンションを用いた非画像データと統合する。
論文 参考訳(メタデータ) (2024-05-21T17:44:48Z) - Multi-scale Spatio-temporal Transformer-based Imbalanced Longitudinal
Learning for Glaucoma Forecasting from Irregular Time Series Images [45.894671834869975]
緑内障は、進行性視神経線維損傷と不可逆性失明を引き起こす主要な眼疾患の1つである。
逐次画像入力に適した変換器アーキテクチャに基づくマルチスケール時空間変換器ネットワーク(MST-former)を提案する。
本手法は, 軽度認知障害とアルツハイマー病の予測に90.3%の精度で, アルツハイマー病神経画像イニシアチブ(ADNI)MRIデータセットに優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-02-21T02:16:59Z) - Affinity Feature Strengthening for Accurate, Complete and Robust Vessel
Segmentation [48.638327652506284]
血管セグメンテーションは、冠動脈狭窄、網膜血管疾患、脳動脈瘤などの多くの医学的応用において重要である。
コントラストに敏感なマルチスケールアフィニティアプローチを用いて,幾何学的手法と画素単位のセグメンテーション特徴を連成的にモデル化する新しいアプローチであるAFNを提案する。
論文 参考訳(メタデータ) (2022-11-12T05:39:17Z) - Multi-Label Retinal Disease Classification using Transformers [0.0]
新たな多ラベル網膜疾患データセットである MuReD が構築され、眼底疾患分類のために公開されているデータセットが多数使用されている。
広範な実験によって最適化されたトランスフォーマーベースのモデルは、画像解析と意思決定に使用される。
この手法は, 疾患検出と疾患分類のためのAUCスコアの7.9%と8.1%の精度で, 同じ課題における最先端の作業よりも優れていた。
論文 参考訳(メタデータ) (2022-07-05T22:06:52Z) - Vision Transformers for femur fracture classification [59.99241204074268]
Vision Transformer (ViT) はテスト画像の83%を正確に予測することができた。
史上最大かつ最もリッチなデータセットを持つサブフラクチャーで良い結果が得られた。
論文 参考訳(メタデータ) (2021-08-07T10:12:42Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。