論文の概要: Diffusion Autoencoder for Unsupervised Artifact Restoration in Handheld Fundus Images
- arxiv url: http://arxiv.org/abs/2604.15723v1
- Date: Fri, 17 Apr 2026 05:54:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.75578
- Title: Diffusion Autoencoder for Unsupervised Artifact Restoration in Handheld Fundus Images
- Title(参考訳): ハンドヘルドファンダス画像における非教師なしアーティファクト復元のための拡散オートエンコーダ
- Authors: Mathumetha Palani, Kavya Puthumana, Ayantika Das, Ganapathy Krishnamurthi,
- Abstract要約: 本稿では,文脈エンコーダと復調処理を統合した非教師付き拡散オートエンコーダを提案し,アーティファクト復元のための意味論的意味のある表現を学習する。
定量的および定性的な評価によって修復を検証し、診断精度が81.17%に向上し、複数のアーティファクト条件が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advent of handheld fundus imaging devices has made ophthalmologic diagnosis and disease screening more accessible, efficient, and cost-effective. However, images captured from these setups often suffer from artifacts such as flash reflections, exposure variations, and motion-induced blur, which degrade image quality and hinder downstream analysis. While generative models have been effective in image restoration, most depend on paired supervision or predefined artifact structures, making them less adaptable to unstructured degradations commonly observed in handheld fundus images. To address this, we propose an unsupervised diffusion autoencoder that integrates a context encoder with the denoising process to learn semantically meaningful representations for artifact restoration. The model is trained only on high-quality table-top fundus images and infers to restore artifact-affected handheld acquisitions. We validate the restorations through quantitative and qualitative evaluations, and have shown that diagnostic accuracy increases to 81.17% on an unseen dataset and multiple artifact conditions
- Abstract(参考訳): ハンドヘルド・ベース・イメージング装置の出現により、眼科診断と疾患スクリーニングがよりアクセスしやすく、効率的で、費用対効果の高いものになった。
しかし、これらの設定から撮影された画像は、しばしばフラッシュリフレクション、露光のばらつき、動きによって引き起こされるぼやけなどのアーティファクトに悩まされ、画質を低下させ、下流の分析を妨げる。
生成モデルは画像復元に有効であるが、ほとんどの場合、ペア化された監督や事前定義されたアーティファクト構造に依存しており、ハンドヘルド・ファンドス・イメージでよく見られる非構造的劣化への適応性が低い。
そこで本稿では,文脈エンコーダと復調処理を統合した非教師付き拡散オートエンコーダを提案する。
このモデルは、高品質なテーブルトップ・ファンドイメージのみに基づいてトレーニングされ、アーティファクトに影響を受けたハンドヘルドの取得を復元する。
定量的および定性的な評価により修復の検証を行い、診断精度が81.17%に向上し、複数のアーティファクト条件が得られた。
関連論文リスト
- Detecting AI-Generated Images via Diffusion Snap-Back Reconstruction: A Forensic Approach [0.0]
従来のディープフェイク検出方法は、Stable DiffusionやDALL-Eのようなテキストと画像のシステムでは失敗する。
本稿では,多強度画像再構成を応用した拡散型法科学フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-01T01:35:54Z) - DiffDoctor: Diagnosing Image Diffusion Models Before Treating [57.82359018425674]
DiffDoctorは2段階のパイプラインで、画像拡散モデルがより少ないアーティファクトを生成するのを支援する。
我々は100万以上の欠陥のある合成画像のデータセットを収集し、効率的なHuman-in-the-loopアノテーションプロセスを構築した。
次に、学習したアーティファクト検出器が第2段階に関与し、ピクセルレベルのフィードバックを提供することで拡散モデルを最適化する。
論文 参考訳(メタデータ) (2025-01-21T18:56:41Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - Diff-Restorer: Unleashing Visual Prompts for Diffusion-based Universal Image Restoration [19.87693298262894]
拡散モデルに基づく普遍的な画像復元手法であるDiff-Restorerを提案する。
我々は、事前学習された視覚言語モデルを用いて、劣化した画像から視覚的プロンプトを抽出する。
また、デグレーション対応デコーダを設計し、構造的補正を行い、潜在コードをピクセル領域に変換する。
論文 参考訳(メタデータ) (2024-07-04T05:01:10Z) - MAEDiff: Masked Autoencoder-enhanced Diffusion Models for Unsupervised
Anomaly Detection in Brain Images [40.89943932086941]
脳画像における教師なし異常検出のためのMasked Autoencoder-enhanced Diffusion Model (MAEDiff)を提案する。
MAEDiffは、階層的なパッチ分割を含む。上層パッチを重畳して健全なイメージを生成し、サブレベルパッチで動作するマスク付きオートエンコーダに基づくメカニズムを実装し、未通知領域の状態を高める。
論文 参考訳(メタデータ) (2024-01-19T08:54:54Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - NuI-Go: Recursive Non-Local Encoder-Decoder Network for Retinal Image
Non-Uniform Illumination Removal [96.12120000492962]
網膜画像の画質は、眼の病変や不完全な画像処理のために臨床的に不満足であることが多い。
網膜画像における最も難しい品質劣化問題の1つは、一様でない照明である。
我々はNuI-Goと呼ばれる網膜画像に対する均一でない照明除去ネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-07T04:31:33Z) - Modeling and Enhancing Low-quality Retinal Fundus Images [167.02325845822276]
低画質の眼底画像は臨床観察における不確実性を高め、誤診のリスクを引き起こす。
本稿では,グローバルな劣化要因を抑えるために,臨床指向の基盤拡張ネットワーク(cofe-Net)を提案する。
合成画像と実画像の両方の実験により、我々のアルゴリズムは網膜の細部を失うことなく、低品質の眼底画像を効果的に補正することを示した。
論文 参考訳(メタデータ) (2020-05-12T08:01:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。