論文の概要: WaveNet-SF: A Hybrid Network for Retinal Disease Detection Based on Wavelet Transform in the Spatial-Frequency Domain
- arxiv url: http://arxiv.org/abs/2501.11854v1
- Date: Tue, 21 Jan 2025 03:10:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:20:51.321804
- Title: WaveNet-SF: A Hybrid Network for Retinal Disease Detection Based on Wavelet Transform in the Spatial-Frequency Domain
- Title(参考訳): WaveNet-SF:空間周波数領域におけるウェーブレット変換に基づく網膜疾患検出用ハイブリッドネットワーク
- Authors: Jilan Cheng, Guoli Long, Zeyu Zhang, Zhenjia Qi, Hanyu Wang, Libin Lu, Shuihua Wang, Yudong Zhang, Jin Hong,
- Abstract要約: 本稿では,空間領域と周波数領域の学習を統合することで網膜疾患の検出を向上する新しいフレームワークWaveNet-SFを提案する。
このフレームワークはウェーブレット変換を利用して、OCT画像を低周波成分と高周波成分に分解する。
提案手法は,OCT-C8データセットとOCT 2017データセットでそれぞれ97.82%,99.58%の最先端(SOTA)分類精度を実現する。
- 参考スコア(独自算出の注目度): 15.21932120859184
- License:
- Abstract: Retinal diseases are a leading cause of vision impairment and blindness, with timely diagnosis being critical for effective treatment. Optical Coherence Tomography (OCT) has become a standard imaging modality for retinal disease diagnosis, but OCT images often suffer from issues such as speckle noise, complex lesion shapes, and varying lesion sizes, making interpretation challenging. In this paper, we propose a novel framework, WaveNet-SF, to enhance retinal disease detection by integrating spatial-domain and frequency-domain learning. The framework utilizes wavelet transforms to decompose OCT images into low- and high-frequency components, enabling the model to extract both global structural features and fine-grained details. To improve lesion detection, we introduce a multi-scale wavelet spatial attention (MSW-SA) module, which enhances the model's focus on regions of interest at multiple scales. Additionally, a high-frequency feature compensation block (HFFC) is incorporated to recover edge information lost during wavelet decomposition, suppress noise, and preserve fine details crucial for lesion detection. Our approach achieves state-of-the-art (SOTA) classification accuracies of 97.82% and 99. 58% on the OCT-C8 and OCT2017 datasets, respectively, surpassing existing methods. These results demonstrate the efficacy of WaveNet-SF in addressing the challenges of OCT image analysis and its potential as a powerful tool for retinal disease diagnosis.
- Abstract(参考訳): 網膜疾患は視覚障害と視覚障害の主要な原因であり、タイムリーな診断は効果的な治療に重要である。
オプティカルコヒーレンス・トモグラフィー(OCT)は網膜疾患の診断において標準的な画像モダリティとなっているが、OCT画像はスペックルノイズ、複雑な病変の形状、様々な病変の大きさといった問題に悩まされ、解釈が困難である。
本稿では,空間領域と周波数領域の学習を統合することで網膜疾患の検出を向上する新しいフレームワークWaveNet-SFを提案する。
このフレームワークはウェーブレット変換を利用して、OCT画像を低周波成分と高周波成分に分解する。
病変検出を改善するため,マルチスケールウェーブレット空間アテンション (MSW-SA) モジュールを導入する。
さらに、ウェーブレット分解時に失われたエッジ情報を復元し、ノイズを抑制し、病変検出に不可欠な詳細を保存するために、高周波特徴補償ブロック(HFFC)が組み込まれている。
本手法は, 最先端(SOTA)分類精度97.82%, 99。
OCT-C8データセットとOCT2017データセットでそれぞれ58%が既存の方法を上回っている。
これらの結果は, OCT画像解析の課題に対するWaveNet-SFの有効性と網膜疾患診断の強力なツールとしての可能性を示すものである。
関連論文リスト
- Feature-oriented Deep Learning Framework for Pulmonary Cone-beam CT
(CBCT) Enhancement with Multi-task Customized Perceptual Loss [9.59233136691378]
コーンビームCT(CBCT)は画像誘導放射線治療中に定期的に収集される。
近年, 深層学習に基づくCBCT強調法は, 人工物抑制に有望な成果を上げている。
本稿では,高画質CBCT画像から高画質CTライク画像へ変換する特徴指向ディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-01T10:09:01Z) - Unlocking Fine-Grained Details with Wavelet-based High-Frequency
Enhancement in Transformers [4.208461204572879]
医用画像のセグメンテーションは、診断、治療計画、疾患モニタリングにおいて重要な役割を担っている。
本稿では,自己注意マップを慎重に再設計することで,トランスフォーマーモデルの局所的特徴不足に対処する。
そこで本研究では,マルチスケールのコンテキスト拡張ブロックをスキップ接続内で提案し,スケール間の依存関係を適応的にモデル化する。
論文 参考訳(メタデータ) (2023-08-25T15:42:19Z) - Frequency-aware optical coherence tomography image super-resolution via
conditional generative adversarial neural network [0.3040864511503504]
周波数ベースモジュールと周波数ベース損失関数を条件付き生成対向ネットワーク(cGAN)に統合する周波数対応超解像フレームワークを提案する。
我々は,既存の深層学習フレームワークよりも提案したフレームワークが優れていることを示すため,既存の冠動脈OCTデータセットから大規模な定量的研究を行った。
論文 参考訳(メタデータ) (2023-07-20T16:07:02Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Deep learning network to correct axial and coronal eye motion in 3D OCT
retinal imaging [65.47834983591957]
深層学習に基づくニューラルネットワークを用いて,OCTの軸運動とコロナ運動のアーチファクトを1つのスキャンで補正する。
実験結果から, 提案手法は動作アーチファクトを効果的に補正し, 誤差が他の方法よりも小さいことを示す。
論文 参考訳(メタデータ) (2023-05-27T03:55:19Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z) - CDNet: Contrastive Disentangled Network for Fine-Grained Image
Categorization of Ocular B-Scan Ultrasound [6.108783901856703]
本研究では, コントラッシブ・ディコンタングルド・ネットワーク(CDNet)を開発した。
超音波画像における視線異常の微細な分類課題に取り組むことを目的としている。
CDNetの3つの重要な構成要素は、弱制御型病変局在モジュール(WSL)、コントラスト型マルチゾーン(CMZ)戦略、超球面型コントラスト型アンタングルドロス(HCD-Loss)である。
論文 参考訳(メタデータ) (2022-06-17T03:12:52Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - MRI to PET Cross-Modality Translation using Globally and Locally Aware GAN (GLA-GAN) for Multi-Modal Diagnosis of Alzheimer's Disease [0.6597195879147557]
現実像を合成できるGAN(Generative Adversarial Network)は、標準的なデータ拡張手法の代替として大きな可能性を秘めている。
本稿では,グローバルな構造的整合性と局所的細部への忠実さを両立させるマルチパスアーキテクチャにより,グローバルかつ局所的に認識された画像間変換GAN(GLA-GAN)を提案する。
論文 参考訳(メタデータ) (2021-08-04T16:38:33Z) - Spatial-Phase Shallow Learning: Rethinking Face Forgery Detection in
Frequency Domain [88.7339322596758]
本論文では,空間画像と位相スペクトルを組み合わせ,顔の偽造のアップサンプリング成果をキャプチャするSPSL(Spatial-Phase Shallow Learning)法を提案する。
SPSLは、クロスデータセット評価における最先端性能とマルチクラス分類を実現し、単一データセット評価において同等の結果を得ることができる。
論文 参考訳(メタデータ) (2021-03-02T16:45:08Z) - Inf-Net: Automatic COVID-19 Lung Infection Segmentation from CT Images [152.34988415258988]
CT画像からの肺感染症の自動検出は、新型コロナウイルスに対処するための従来の医療戦略を強化する大きな可能性を秘めている。
CTスライスから感染領域を分割することは、高い感染特性の変化、感染と正常な組織の間の低強度のコントラストなど、いくつかの課題に直面している。
これらの課題に対処するため, 胸部CTスライスから感染部位を自動的に同定する, 新型のCOVID-19 Deep Lung infection Network (Inf-Net) が提案されている。
論文 参考訳(メタデータ) (2020-04-22T07:30:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。