論文の概要: Spatial-Frequency Dual Progressive Attention Network For Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2406.07952v2
- Date: Mon, 19 Aug 2024 14:56:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-21 02:28:42.165468
- Title: Spatial-Frequency Dual Progressive Attention Network For Medical Image Segmentation
- Title(参考訳): 医用画像分割のための空間周波数デュアルプログレッシブアテンションネットワーク
- Authors: Zhenhuan Zhou, Along He, Yanlin Wu, Rui Yao, Xueshuo Xie, Tao Li,
- Abstract要約: 医用画像では、様々な種類の病変が、形状やテクスチャに顕著な違いを呈することが多い。
正確な医用画像セグメンテーションは、マルチスケールおよびバウンダリの特徴学習において堅牢な機能を持つディープラーニングモデルを必要とする。
本稿では,空間周波数デュアルドメインアテンションネットワークであるSF-UNetを紹介する。
マルチスケールプログレッシブ・チャンネル・アテンション(MPCA)ブロックは隣接するエンコーダ層にまたがるマルチスケールの特徴を徐々に抽出し、軽量な周波数空間アテンション(FSA)ブロックはわずか0.05Mのパラメータしか持たない。
- 参考スコア(独自算出の注目度): 11.60636221012585
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In medical images, various types of lesions often manifest significant differences in their shape and texture. Accurate medical image segmentation demands deep learning models with robust capabilities in multi-scale and boundary feature learning. However, previous networks still have limitations in addressing the above issues. Firstly, previous networks simultaneously fuse multi-level features or employ deep supervision to enhance multi-scale learning. However, this may lead to feature redundancy and excessive computational overhead, which is not conducive to network training and clinical deployment. Secondly, the majority of medical image segmentation networks exclusively learn features in the spatial domain, disregarding the abundant global information in the frequency domain. This results in a bias towards low-frequency components, neglecting crucial high-frequency information. To address these problems, we introduce SF-UNet, a spatial-frequency dual-domain attention network. It comprises two main components: the Multi-scale Progressive Channel Attention (MPCA) block, which progressively extract multi-scale features across adjacent encoder layers, and the lightweight Frequency-Spatial Attention (FSA) block, with only 0.05M parameters, enabling concurrent learning of texture and boundary features from both spatial and frequency domains. We validate the effectiveness of the proposed SF-UNet on three public datasets. Experimental results show that compared to previous state-of-the-art (SOTA) medical image segmentation networks, SF-UNet achieves the best performance, and achieves up to 9.4\% and 10.78\% improvement in DSC and IOU. Codes will be released at https://github.com/nkicsl/SF-UNet.
- Abstract(参考訳): 医用画像では、様々な種類の病変が、形状やテクスチャに顕著な違いを呈することが多い。
正確な医用画像セグメンテーションは、マルチスケールおよびバウンダリの特徴学習において堅牢な機能を持つディープラーニングモデルを必要とする。
しかし、以前のネットワークは上記の問題に対処する際の制限がある。
まず、従来のネットワークが同時にマルチレベル機能を融合させたり、より深い監視を施してマルチスケール学習を強化する。
しかし、これは特徴的冗長性と過剰な計算オーバーヘッドをもたらす可能性があり、これはネットワークトレーニングや臨床展開には影響しない。
第2に、医用画像分割ネットワークの大多数は、周波数領域における豊富なグローバル情報を無視して、空間領域の特徴のみを学習する。
この結果、低周波成分への偏りが生じ、重要な高周波情報を無視する。
これらの問題に対処するために、空間周波数デュアルドメインアテンションネットワークであるSF-UNetを導入する。
マルチスケールプログレッシブ・チャンネル・アテンション(MPCA)ブロックは、隣接するエンコーダ層にまたがるマルチスケールの特徴を徐々に抽出し、軽量な周波数空間アテンション(FSA)ブロックはわずか0.05Mパラメータで、空間領域と周波数領域の両方からテクスチャとバウンダリの同時学習を可能にする。
提案するSF-UNetの3つの公開データセットに対する有効性を検証する。
実験の結果,従来のSOTA (State-of-the-art Medical Image segmentation Network) と比較して,SF-UNetは最高の性能を示し,DSCとIOUでは最大9.4\%,10.78\%の改善が達成された。
コードはhttps://github.com/nkicsl/SF-UNet.comでリリースされる。
関連論文リスト
- LMBF-Net: A Lightweight Multipath Bidirectional Focal Attention Network for Multifeatures Segmentation [15.091476025563528]
網膜疾患は、早期に診断や治療を受けなければ、両眼で不可逆的な視力喪失を引き起こす可能性がある。
多くのラベルや属性で網膜画像をセグメント化するための現在のディープラーニング技術は、検出精度と一般性に乏しい。
本稿では,多機能セグメンテーションのためのマルチパス畳み込みニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-03T07:37:09Z) - ASPS: Augmented Segment Anything Model for Polyp Segmentation [77.25557224490075]
SAM(Segment Anything Model)は、ポリープセグメンテーションに先例のないポテンシャルを導入している。
SAMのTransformerベースの構造は、グローバルおよび低周波情報を優先する。
CFAはトレーニング可能なCNNエンコーダブランチと凍結したViTエンコーダを統合し、ドメイン固有の知識の統合を可能にする。
論文 参考訳(メタデータ) (2024-06-30T14:55:32Z) - Unlocking Fine-Grained Details with Wavelet-based High-Frequency
Enhancement in Transformers [4.208461204572879]
医用画像のセグメンテーションは、診断、治療計画、疾患モニタリングにおいて重要な役割を担っている。
本稿では,自己注意マップを慎重に再設計することで,トランスフォーマーモデルの局所的特徴不足に対処する。
そこで本研究では,マルチスケールのコンテキスト拡張ブロックをスキップ接続内で提案し,スケール間の依存関係を適応的にモデル化する。
論文 参考訳(メタデータ) (2023-08-25T15:42:19Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical
Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2023-03-20T06:26:49Z) - SF2Former: Amyotrophic Lateral Sclerosis Identification From
Multi-center MRI Data Using Spatial and Frequency Fusion Transformer [3.408266725482757]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、運動ニューロン変性を伴う複雑な神経変性疾患である。
ディープラーニングは、コンピュータビジョンにおける機械学習プログラムの傑出したクラスになった。
本研究では、視覚変換器アーキテクチャのパワーを活用してALS対象と制御群を区別するフレームワークであるSF2Formerを紹介する。
論文 参考訳(メタデータ) (2023-02-21T18:16:20Z) - HistoSeg : Quick attention with multi-loss function for multi-structure
segmentation in digital histology images [0.696194614504832]
医療画像のセグメンテーションは、コンピュータ支援による診断、手術、治療を支援する。
一般化デコーダネットワーク,クイックアテンションモジュール,マルチロス関数を提案する。
医用画像セグメンテーション用データセットであるMoNuSegとGlaSにおいて,提案するネットワークの有効性を評価する。
論文 参考訳(メタデータ) (2022-09-01T21:10:00Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Deep Frequency Filtering for Domain Generalization [55.66498461438285]
Deep Neural Networks(DNN)は、学習プロセスにおいて、いくつかの周波数成分を優先する。
本稿では、ドメイン一般化可能な特徴を学習するためのDeep Frequency Filtering (DFF)を提案する。
提案したDFFをベースラインに適用すると,ドメインの一般化タスクにおける最先端の手法よりも優れることを示す。
論文 参考訳(メタデータ) (2022-03-23T05:19:06Z) - Frequency-aware Discriminative Feature Learning Supervised by
Single-Center Loss for Face Forgery Detection [89.43987367139724]
顔の偽造検出は、コンピュータビジョンへの関心をますます高めている。
近年の業績は良好なものとなっているが、いまだに無視できない問題がある。
本稿では,新しい周波数認識型特徴学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-16T14:17:17Z) - Boundary-aware Context Neural Network for Medical Image Segmentation [15.585851505721433]
医用画像のセグメンテーションは、さらなる臨床分析と疾患診断のための信頼性の高い基盤を提供することができる。
既存のCNNベースのほとんどの手法は、正確なオブジェクト境界のない不満足なセグメンテーションマスクを生成する。
本稿では,2次元医用画像分割のための境界認識コンテキストニューラルネットワーク(BA-Net)を定式化する。
論文 参考訳(メタデータ) (2020-05-03T02:35:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。