論文の概要: DualStreamFoveaNet: A Dual Stream Fusion Architecture with Anatomical Awareness for Robust Fovea Localization
- arxiv url: http://arxiv.org/abs/2302.06961v5
- Date: Thu, 10 Oct 2024 16:07:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-11 14:29:22.672378
- Title: DualStreamFoveaNet: A Dual Stream Fusion Architecture with Anatomical Awareness for Robust Fovea Localization
- Title(参考訳): DualStreamFoveaNet:ロバストなFoveaローカライゼーションのための解剖学的認識を備えたデュアルストリームフュージョンアーキテクチャ
- Authors: Sifan Song, Jinfeng Wang, Zilong Wang, Hongxing Wang, Jionglong Su, Xiaowei Ding, Kang Dang,
- Abstract要約: マルチキュー核融合のためのDualStreamFoveaNet (DSFN) と呼ばれる新しいトランスフォーマーアーキテクチャを提案する。
このアーキテクチャは、網膜と血管の分布を用いた長距離接続とグローバルな特徴をはっきりと組み込んで、堅牢な葉の局在を図っている。
DSFNは、正常な網膜像と疾患のある網膜像の両方においてより堅牢であり、クロスデータセット実験においてキャパシティの一般化がより優れていることを実証する。
- 参考スコア(独自算出の注目度): 6.278444803136043
- License:
- Abstract: Accurate fovea localization is essential for analyzing retinal diseases to prevent irreversible vision loss. While current deep learning-based methods outperform traditional ones, they still face challenges such as the lack of local anatomical landmarks around the fovea, the inability to robustly handle diseased retinal images, and the variations in image conditions. In this paper, we propose a novel transformer-based architecture called DualStreamFoveaNet (DSFN) for multi-cue fusion. This architecture explicitly incorporates long-range connections and global features using retina and vessel distributions for robust fovea localization. We introduce a spatial attention mechanism in the dual-stream encoder to extract and fuse self-learned anatomical information, focusing more on features distributed along blood vessels and significantly reducing computational costs by decreasing token numbers. Our extensive experiments show that the proposed architecture achieves state-of-the-art performance on two public datasets and one large-scale private dataset. Furthermore, we demonstrate that the DSFN is more robust on both normal and diseased retina images and has better generalization capacity in cross-dataset experiments.
- Abstract(参考訳): 正確な葉の局在は、網膜疾患を解析し、不可逆的な視力喪失を防ぐのに不可欠である。
現在のディープラーニングベースの手法は従来の手法よりも優れていますが、胎児の周囲の局所的な解剖学的ランドマークの欠如、病気の網膜画像の堅牢な処理能力の欠如、画像条件の変化といった課題に直面しています。
本稿では,マルチキュー核融合のためのDualStreamFoveaNet (DSFN) と呼ばれるトランスフォーマーアーキテクチャを提案する。
このアーキテクチャは、網膜と血管の分布を用いた長距離接続とグローバルな特徴をはっきりと組み込んで、堅牢な葉の局在を図っている。
両ストリームエンコーダに空間的注意機構を導入し, 自己学習型解剖情報を抽出・融合し, 血管に沿って分布する特徴に着目し, トークン数を減らして計算コストを大幅に削減する。
提案アーキテクチャは,2つの公開データセットと1つの大規模プライベートデータセットに対して,最先端のパフォーマンスを実現する。
さらに、DSFNは、正常および疾患網膜像の両方においてより堅牢であり、クロスデータセット実験においてより高度な一般化能力を有することを示した。
関連論文リスト
- TransUNext: towards a more advanced U-shaped framework for automatic vessel segmentation in the fundus image [19.16680702780529]
本稿では,ハイブリッドトランスフォーマーとCNN: TransUNextのための,より高度なU字型アーキテクチャを提案する。
Global Multi-Scale Fusion (GMSF)モジュールはさらに、スキップ接続のアップグレード、高レベルセマンティクスと低レベル詳細情報の融合、高レベルセマンティクスと低レベルセマンティクスの相違を取り除くために導入された。
論文 参考訳(メタデータ) (2024-11-05T01:44:22Z) - Enhancing Retinal Vascular Structure Segmentation in Images With a Novel
Design Two-Path Interactive Fusion Module Model [6.392575673488379]
網膜血管セグメンテーションの精度を高めるために設計されたSwin-Res-Netについて紹介する。
Swin-Res-Netは、パーティショニングに変位のあるシフトウィンドウを使用するSwin Transformerを使用している。
提案したアーキテクチャは,他の公開されたモデルに適合するか,あるいは超越するかという,優れた結果をもたらす。
論文 参考訳(メタデータ) (2024-03-03T01:36:11Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - MAF-Net: Multiple attention-guided fusion network for fundus vascular
image segmentation [1.3295074739915493]
網膜基底画像の血管を正確に検出するマルチアテンション誘導核融合ネットワーク(MAF-Net)を提案する。
従来のUNetベースのモデルは、長距離依存を明示的にモデル化するため、部分的な情報を失う可能性がある。
提案手法は,いくつかの最先端手法と比較して良好な結果が得られることを示す。
論文 参考訳(メタデータ) (2023-05-05T15:22:20Z) - Affinity Feature Strengthening for Accurate, Complete and Robust Vessel
Segmentation [48.638327652506284]
血管セグメンテーションは、冠動脈狭窄、網膜血管疾患、脳動脈瘤などの多くの医学的応用において重要である。
コントラストに敏感なマルチスケールアフィニティアプローチを用いて,幾何学的手法と画素単位のセグメンテーション特徴を連成的にモデル化する新しいアプローチであるAFNを提案する。
論文 参考訳(メタデータ) (2022-11-12T05:39:17Z) - InDuDoNet+: A Model-Driven Interpretable Dual Domain Network for Metal
Artifact Reduction in CT Images [53.4351366246531]
InDuDoNet+と呼ばれる新しい解釈可能な二重ドメインネットワークを構築し、CT画像の微細な埋め込みを行う。
異なる組織間のCT値を分析し,InDuDoNet+の事前観測ネットワークにマージすることで,その一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-12-23T15:52:37Z) - RV-GAN : Retinal Vessel Segmentation from Fundus Images using
Multi-scale Generative Adversarial Networks [0.0]
RVGANは、正確な網膜血管分割のための新しいマルチスケール再生アーキテクチャです。
2つのジェネレータと2つのマルチスケールオートエンコーダベースの判別器を用いて,マイクロセルの局在とセグメンテーションを改善する。
論文 参考訳(メタデータ) (2021-01-03T01:04:49Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z) - Improving Robustness using Joint Attention Network For Detecting Retinal
Degeneration From Optical Coherence Tomography Images [0.0]
本稿では,2つのジョイントネットワークからなる新しいアーキテクチャとして,病原性特徴表現を用いることを提案する。
公開データセットに対する実験結果から,提案したジョイントネットワークは,未確認データセット上での最先端網膜疾患分類ネットワークの精度と堅牢性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-05-16T20:32:49Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。