論文の概要: WDT-MD: Wavelet Diffusion Transformers for Microaneurysm Detection in Fundus Images
- arxiv url: http://arxiv.org/abs/2511.08987v1
- Date: Thu, 13 Nov 2025 01:23:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.342914
- Title: WDT-MD: Wavelet Diffusion Transformers for Microaneurysm Detection in Fundus Images
- Title(参考訳): WDT-MD: 基底画像における微小動脈瘤検出のためのウェーブレット拡散変換器
- Authors: Yifei Sun, Yuzhi He, Junhao Jia, Jinhong Wang, Ruiquan Ge, Changmiao Wang, Hongxia Xu,
- Abstract要約: 眼底部における微小動脈瘤 (MAs) は60ドル以下の病変であり, 光度, 形態学的特徴は高い。
拡散型異常検出は自動MAスクリーニングの有望なアプローチとして登場した。
我々は、MA検出のためのウェーブレット拡散変換器フレームワーク(WDT-MD)を提案する。
WDT-MDは「同一性マッピング」を避けるためのノイズ符号化画像調和機構を備えている
- 参考スコア(独自算出の注目度): 9.271194324930098
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Microaneurysms (MAs), the earliest pathognomonic signs of Diabetic Retinopathy (DR), present as sub-60 $μm$ lesions in fundus images with highly variable photometric and morphological characteristics, rendering manual screening not only labor-intensive but inherently error-prone. While diffusion-based anomaly detection has emerged as a promising approach for automated MA screening, its clinical application is hindered by three fundamental limitations. First, these models often fall prey to "identity mapping", where they inadvertently replicate the input image. Second, they struggle to distinguish MAs from other anomalies, leading to high false positives. Third, their suboptimal reconstruction of normal features hampers overall performance. To address these challenges, we propose a Wavelet Diffusion Transformer framework for MA Detection (WDT-MD), which features three key innovations: a noise-encoded image conditioning mechanism to avoid "identity mapping" by perturbing image conditions during training; pseudo-normal pattern synthesis via inpainting to introduce pixel-level supervision, enabling discrimination between MAs and other anomalies; and a wavelet diffusion Transformer architecture that combines the global modeling capability of diffusion Transformers with multi-scale wavelet analysis to enhance reconstruction of normal retinal features. Comprehensive experiments on the IDRiD and e-ophtha MA datasets demonstrate that WDT-MD outperforms state-of-the-art methods in both pixel-level and image-level MA detection. This advancement holds significant promise for improving early DR screening.
- Abstract(参考訳): 糖尿病網膜症 (DR) の早期病態である微小動脈瘤 (MAs) は, 高度に変動する光度, 形態学的特徴を有する底部画像に60$μm以下の病変がみられ, 労働集約性だけでなく, 本質的にはエラーが生じる。
拡散型異常検出は自動MA検診の有望なアプローチとして現れているが,臨床応用には3つの基本的な限界がある。
まず、これらのモデルはしばしば「同一性マッピング」に陥り、入力画像が意図せず複製される。
第二に、彼らはMAと他の異常を区別するのに苦労し、高い偽陽性につながった。
第3に、正常な特徴の最適再建が全体のパフォーマンスを損なうこと。
これらの課題に対処するために、トレーニング中の画像条件を摂動させることで「同一性マッピング」を回避するためのノイズ符号化画像条件付け機構、画素レベルの監視を導入し、MAと他の異常を識別する擬似正規パターン合成、拡散変換器のグローバルなモデリング機能とマルチスケールのウェーブレット解析を組み合わせたウェーブレット拡散変換器アーキテクチャを提案する。
IDRiDとe-ophtha MAデータセットの総合的な実験により、WDT-MDは画素レベルと画像レベルのMA検出の両方において最先端の手法より優れていることが示された。
この進歩は、初期のDRスクリーニングを改善するための重要な約束である。
関連論文リスト
- Accelerating 3D Photoacoustic Computed Tomography with End-to-End Physics-Aware Neural Operators [74.65171736966131]
光音響計算トモグラフィ(PACT)は、光コントラストと超音波分解能を組み合わせることで、光拡散限界を超える深部像を実現する。
現在の実装では、高密度トランスデューサアレイと長い取得時間を必要とし、臨床翻訳を制限している。
本研究では,センサ計測からボリューム再構成まで,逆音響マッピングを直接学習する物理認識モデルであるPanoを紹介する。
論文 参考訳(メタデータ) (2025-09-11T23:12:55Z) - 3D Wavelet Latent Diffusion Model for Whole-Body MR-to-CT Modality Translation [13.252652406393205]
既存の全身画像のためのMR-to-CT法では、生成したCT画像と入力したMR画像との空間的アライメントが低くなることが多い。
本稿では,これらの制約に対処する新しい3次元ウェーブレット遅延拡散モデル(3D-WLDM)を提案する。
エンコーダ・デコーダアーキテクチャにWavelet Residual Moduleを組み込むことで,画像空間と潜伏空間をまたいだ微細な特徴の捕捉と再構築が促進される。
論文 参考訳(メタデータ) (2025-07-14T06:17:05Z) - Harnessing EHRs for Diffusion-based Anomaly Detection on Chest X-rays [10.062242117926177]
画像診断におけるunsupervised anomaly detection (UAD) は, 広範囲なラベル付きデータを必要とせず, 病変の同定に重要である。
Diff3Mは胸部X線と構造化電子健康記録を融合した多モード拡散型フレームワークである。
論文 参考訳(メタデータ) (2025-05-22T22:02:47Z) - Deformation-aware GAN for Medical Image Synthesis with Substantially Misaligned Pairs [0.0]
本稿では,逆整合性に基づく画像合成における誤りを動的に補正する新しい変形認識型GAN(DA-GAN)を提案する。
実験の結果, DA-GANは, 呼吸運動異常を伴う実世界の肺MRI-CTデータセットと模擬誤診を伴う公共データセットにおいて, 優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-18T10:29:35Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - QSMDiff: Unsupervised 3D Diffusion Models for Quantitative Susceptibility Mapping [12.629091097618792]
定量的感受性マッピング(QSM)はMRI組織相からの磁気感受性分布の逆問題である。
拡散モデルの最近の進歩は、2次元医用画像逆問題の解決の可能性を示している。
我々は3次元画像パッチに基づく拡散モデル、すなわちQSMDiffを開発し、様々なスキャンパラメータにわたって堅牢なQSM再構成を行った。
論文 参考訳(メタデータ) (2024-03-21T01:37:50Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Latent Diffusion Model for Medical Image Standardization and Enhancement [11.295078152769559]
DiffusionCTは、異なる非標準分布を標準化形式に変換するスコアベースのDDPMモデルである。
このアーキテクチャは、ボトルネック位置に統合されたDDPMモデルにより強化されたU-Netベースのエンコーダデコーダを含む。
DiffusionCTによる画像の標準化の顕著な改善が示唆された。
論文 参考訳(メタデータ) (2023-10-08T17:11:14Z) - Diffusion Models for Counterfactual Generation and Anomaly Detection in Brain Images [39.94162291765236]
病気の画像の健全なバージョンを生成し,それを用いて画素単位の異常マップを得るための弱教師付き手法を提案する。
健常者を対象にした拡散モデルを用いて, サンプリングプロセスの各ステップで拡散拡散確率モデル (DDPM) と拡散拡散確率モデル (DDIM) を組み合わせる。
論文 参考訳(メタデータ) (2023-08-03T21:56:50Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Negligible effect of brain MRI data preprocessing for tumor segmentation [36.89606202543839]
我々は3つの公開データセットの実験を行い、ディープニューラルネットワークにおける異なる前処理ステップの効果を評価する。
その結果、最も一般的な標準化手順は、ネットワーク性能に何の価値も与えないことが示されている。
画像の規格化に伴う信号分散の低減のため,画像強度正規化手法はモデル精度に寄与しない。
論文 参考訳(メタデータ) (2022-04-11T17:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。