論文の概要: Enhancing Retinal Vascular Structure Segmentation in Images With a Novel
Design Two-Path Interactive Fusion Module Model
- arxiv url: http://arxiv.org/abs/2403.01362v1
- Date: Sun, 3 Mar 2024 01:36:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 14:13:08.247293
- Title: Enhancing Retinal Vascular Structure Segmentation in Images With a Novel
Design Two-Path Interactive Fusion Module Model
- Title(参考訳): ニューデザイン2パスインタラクティブ融合モジュールモデルによる網膜血管構造の分節化の促進
- Authors: Rui Yang and Shunpu Zhang
- Abstract要約: 網膜血管セグメンテーションの精度を高めるために設計されたSwin-Res-Netについて紹介する。
Swin-Res-Netは、パーティショニングに変位のあるシフトウィンドウを使用するSwin Transformerを使用している。
提案したアーキテクチャは,他の公開されたモデルに適合するか,あるいは超越するかという,優れた結果をもたらす。
- 参考スコア(独自算出の注目度): 6.392575673488379
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precision in identifying and differentiating micro and macro blood vessels in
the retina is crucial for the diagnosis of retinal diseases, although it poses
a significant challenge. Current autoencoding-based segmentation approaches
encounter limitations as they are constrained by the encoder and undergo a
reduction in resolution during the encoding stage. The inability to recover
lost information in the decoding phase further impedes these approaches.
Consequently, their capacity to extract the retinal microvascular structure is
restricted. To address this issue, we introduce Swin-Res-Net, a specialized
module designed to enhance the precision of retinal vessel segmentation.
Swin-Res-Net utilizes the Swin transformer which uses shifted windows with
displacement for partitioning, to reduce network complexity and accelerate
model convergence. Additionally, the model incorporates interactive fusion with
a functional module in the Res2Net architecture. The Res2Net leverages
multi-scale techniques to enlarge the receptive field of the convolutional
kernel, enabling the extraction of additional semantic information from the
image. This combination creates a new module that enhances the localization and
separation of micro vessels in the retina. To improve the efficiency of
processing vascular information, we've added a module to eliminate redundant
information between the encoding and decoding steps.
Our proposed architecture produces outstanding results, either meeting or
surpassing those of other published models. The AUC reflects significant
enhancements, achieving values of 0.9956, 0.9931, and 0.9946 in pixel-wise
segmentation of retinal vessels across three widely utilized datasets:
CHASE-DB1, DRIVE, and STARE, respectively. Moreover, Swin-Res-Net outperforms
alternative architectures, demonstrating superior performance in both IOU and
F1 measure metrics.
- Abstract(参考訳): 網膜における微小血管とマクロ血管の同定と識別の精度は網膜疾患の診断に不可欠であるが、これは重要な課題である。
現在のオートエンコーディングベースのセグメンテーションアプローチは、エンコーダによって制約されるため制限に遭遇し、エンコーダの段階で解像度が低下する。
復号フェーズで失われた情報を復元できないことは、これらのアプローチをさらに阻害する。
これにより、網膜微小血管構造を抽出する能力が制限される。
この問題に対処するため,我々は,網膜血管分割の精度を高めるために設計された専用モジュール swin-res-net を紹介する。
Swin-Res-Netはパーティショニングにシフトウィンドウを用いるSwin変換器を用いて、ネットワークの複雑さを低減し、モデル収束を加速する。
さらに、このモデルはres2netアーキテクチャにインタラクティブな融合と機能モジュールを組み込んでいる。
Res2Netはマルチスケール技術を利用して畳み込みカーネルの受容領域を拡大し、画像から追加の意味情報を抽出する。
この組み合わせは、網膜内の微小血管の局在と分離を強化する新しいモジュールを生成する。
血管情報処理の効率を向上させるため,エンコードとデコードの間の冗長な情報を排除するモジュールを追加した。
提案するアーキテクチャは,他の公開モデルのミーティングや超越など,優れた結果をもたらします。
AUCは、広く利用されている3つのデータセット(CHASE-DB1、DRIVE、STARE)にわたる網膜血管のピクセルワイドセグメンテーションにおいて、0.9956、0.9931、0.9946の値を達成している。
さらに、Swin-Res-Netは代替アーキテクチャよりも優れており、IOUとF1の測定の両方で優れたパフォーマンスを示している。
関連論文リスト
- TransUNext: towards a more advanced U-shaped framework for automatic vessel segmentation in the fundus image [19.16680702780529]
本稿では,ハイブリッドトランスフォーマーとCNN: TransUNextのための,より高度なU字型アーキテクチャを提案する。
Global Multi-Scale Fusion (GMSF)モジュールはさらに、スキップ接続のアップグレード、高レベルセマンティクスと低レベル詳細情報の融合、高レベルセマンティクスと低レベルセマンティクスの相違を取り除くために導入された。
論文 参考訳(メタデータ) (2024-11-05T01:44:22Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - Scale-aware Super-resolution Network with Dual Affinity Learning for
Lesion Segmentation from Medical Images [50.76668288066681]
低解像度医用画像から様々な大きさの病変を適応的に分割する,スケールアウェアな超解像ネットワークを提案する。
提案するネットワークは,他の最先端手法と比較して一貫した改善を実現した。
論文 参考訳(メタデータ) (2023-05-30T14:25:55Z) - DualStreamFoveaNet: A Dual Stream Fusion Architecture with Anatomical Awareness for Robust Fovea Localization [6.278444803136043]
マルチキュー核融合のためのDualStreamFoveaNet (DSFN) と呼ばれる新しいトランスフォーマーアーキテクチャを提案する。
このアーキテクチャは、網膜と血管の分布を用いた長距離接続とグローバルな特徴をはっきりと組み込んで、堅牢な葉の局在を図っている。
DSFNは、正常な網膜像と疾患のある網膜像の両方においてより堅牢であり、クロスデータセット実験においてキャパシティの一般化がより優れていることを実証する。
論文 参考訳(メタデータ) (2023-02-14T10:40:20Z) - DoubleU-NetPlus: A Novel Attention and Context Guided Dual U-Net with
Multi-Scale Residual Feature Fusion Network for Semantic Segmentation of
Medical Images [2.20200533591633]
本稿ではDoubleU-NetPlusという2つのU-Netアーキテクチャを提案する。
我々は,識別的特徴表現をモデル化するネットワークの能力を高めるために,マルチコンテキスト特徴といくつかの注意戦略を利用する。
勾配消滅問題を緩和し、より深い空間的詳細を持つ高分解能特徴を取り入れるため、標準畳み込み操作を注意誘導残差畳み込み操作に置き換える。
論文 参考訳(メタデータ) (2022-11-25T16:56:26Z) - RetiFluidNet: A Self-Adaptive and Multi-Attention Deep Convolutional
Network for Retinal OCT Fluid Segmentation [3.57686754209902]
OCTガイド下治療には網膜液の定量化が必要である。
RetiFluidNetと呼ばれる新しい畳み込みニューラルアーキテクチャは、多クラス網膜流体セグメンテーションのために提案されている。
モデルは、テクスチャ、コンテキスト、エッジといった特徴の階層的な表現学習の恩恵を受ける。
論文 参考訳(メタデータ) (2022-09-26T07:18:00Z) - RV-GAN : Retinal Vessel Segmentation from Fundus Images using
Multi-scale Generative Adversarial Networks [0.0]
RVGANは、正確な網膜血管分割のための新しいマルチスケール再生アーキテクチャです。
2つのジェネレータと2つのマルチスケールオートエンコーダベースの判別器を用いて,マイクロセルの局在とセグメンテーションを改善する。
論文 参考訳(メタデータ) (2021-01-03T01:04:49Z) - Rethinking the Extraction and Interaction of Multi-Scale Features for
Vessel Segmentation [53.187152856583396]
網膜血管と主要動脈を2次元基底画像と3次元CTアンギオグラフィー(CTA)スキャンで分割する,PC-Netと呼ばれる新しいディープラーニングモデルを提案する。
PC-Netでは、ピラミッド圧縮励起(PSE)モジュールが各畳み込みブロックに空間情報を導入し、より効果的なマルチスケール特徴を抽出する能力を高めている。
論文 参考訳(メタデータ) (2020-10-09T08:22:54Z) - DONet: Dual Objective Networks for Skin Lesion Segmentation [77.9806410198298]
本稿では,皮膚病変のセグメンテーションを改善するために,Dual Objective Networks (DONet) という,シンプルで効果的なフレームワークを提案する。
我々のDONetは2つの対称デコーダを採用し、異なる目標に近づくための異なる予測を生成する。
皮膚内視鏡画像における多種多様な病変のスケールと形状の課題に対処するために,再帰的コンテキスト符号化モジュール(RCEM)を提案する。
論文 参考訳(メタデータ) (2020-08-19T06:02:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。