論文の概要: M3FPolypSegNet: Segmentation Network with Multi-frequency Feature Fusion
for Polyp Localization in Colonoscopy Images
- arxiv url: http://arxiv.org/abs/2310.05538v1
- Date: Tue, 10 Oct 2023 03:41:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 06:40:06.423317
- Title: M3FPolypSegNet: Segmentation Network with Multi-frequency Feature Fusion
for Polyp Localization in Colonoscopy Images
- Title(参考訳): m3f polypsegnet:マルチ周波数特徴融合による大腸内視鏡画像におけるポリープ局在のセグメンテーションネットワーク
- Authors: Ju-Hyeon Nam, Seo-Hyeong Park, Nur Suriza Syazwany, Yerim Jung, Yu-Han
Im and Sang-Chul Lee
- Abstract要約: M3FPolypSegNet (M3FPolypSegNet) は、入力画像を低周波数成分/高周波数成分に分解する。
我々は3つの独立したマルチ周波数エンコーダを用いて、複数の入力画像を高次元の特徴空間にマッピングした。
我々は,4つのデコーダブロックで3つのマルチタスク学習(領域,エッジ,距離)を設計し,その領域の構造的特徴を学習した。
- 参考スコア(独自算出の注目度): 1.389360509566256
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Polyp segmentation is crucial for preventing colorectal cancer a common type
of cancer. Deep learning has been used to segment polyps automatically, which
reduces the risk of misdiagnosis. Localizing small polyps in colonoscopy images
is challenging because of its complex characteristics, such as color,
occlusion, and various shapes of polyps. To address this challenge, a novel
frequency-based fully convolutional neural network, Multi-Frequency Feature
Fusion Polyp Segmentation Network (M3FPolypSegNet) was proposed to decompose
the input image into low/high/full-frequency components to use the
characteristics of each component. We used three independent multi-frequency
encoders to map multiple input images into a high-dimensional feature space. In
the Frequency-ASPP Scalable Attention Module (F-ASPP SAM), ASPP was applied
between each frequency component to preserve scale information. Subsequently,
scalable attention was applied to emphasize polyp regions in a high-dimensional
feature space. Finally, we designed three multi-task learning (i.e., region,
edge, and distance) in four decoder blocks to learn the structural
characteristics of the region. The proposed model outperformed various
segmentation models with performance gains of 6.92% and 7.52% on average for
all metrics on CVC-ClinicDB and BKAI-IGH-NeoPolyp, respectively.
- Abstract(参考訳): ポリープセグメンテーションは大腸癌の一般的なタイプの癌の予防に不可欠である。
深層学習はポリープの自動分割に使われており、誤診のリスクを低減している。
大腸内視鏡画像における小ポリープの局在は,色,咬合,多彩なポリープの形状などの複雑な特徴から困難である。
この課題に対処するために、新しい周波数ベースの完全畳み込みニューラルネットワークであるM3FPolypSegNet(M3FPolypSegNet)が提案され、入力画像を低周波数/高周波数のコンポーネントに分解して各コンポーネントの特性を利用する。
複数の入力画像を高次元特徴空間にマッピングするために, 3つの独立なマルチ周波数エンコーダを用いた。
周波数-ASPPスケーラブルアテンションモジュール(F-ASPP SAM)では、各周波数成分間でASPPを適用してスケール情報を保存する。
その後、高次元特徴空間におけるポリプ領域の強調にスケーラブルな注意を向けた。
最後に、4つのデコーダブロックに3つのマルチタスク学習(すなわち、領域、エッジ、距離)を設計、その領域の構造特性を学習した。
提案モデルでは,CVC-ClinicDBとBKAI-IGH-NeoPolypでそれぞれ平均6.92%,7.52%の性能向上を示した。
関連論文リスト
- PSTNet: Enhanced Polyp Segmentation with Multi-scale Alignment and Frequency Domain Integration [17.1088588766663]
Polyp Network with Shunted Transformer (PSTNet) は、画像に存在するRGBと周波数領域の両方を統合する新しいアプローチである。
PSTNetは3つの主要なモジュールから構成される: 周波数特性アテンションモジュール(FCAM)は周波数キューを抽出し、ポリプの特徴を捉え、特徴補助アライメントモジュール(FSAM)は意味情報を調整し、ノイズを低減し、CPMは周波数キューを高レベルなセマンティクスと相乗化して効率的なポリプセグメンテーションを実現する。
論文 参考訳(メタデータ) (2024-09-13T02:52:25Z) - Polyp segmentation in colonoscopy images using DeepLabV3++ [3.0182171147100076]
DeepLabv3+アーキテクチャの拡張版であるDeepLabv3++モデルを紹介します。
提案モデルでは,MSPPブロック内に多様な分離可能な畳み込み層とアテンション機構を組み込み,マルチスケールおよび指向性の特徴を捉える能力を向上させる。
実験により、DeepLabV3++はポリプセグメンテーションタスクにおいて、最先端のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-07-27T19:24:55Z) - Efficient Polyp Segmentation Via Integrity Learning [14.34505893948565]
本稿では, マクロおよびマイクロレベルでのポリプセグメンテーションにおける完全性の概念を導入し, 完全性欠如を軽減することを目的とした。
我々のIC-PolypSegネットワークは、軽量なバックボーンと3つのキーコンポーネントを使って整合性を改善する。
論文 参考訳(メタデータ) (2023-09-15T08:11:05Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Adaptive Context Selection for Polyp Segmentation [99.9959901908053]
本稿では,ローカルコンテキストアテンション(LCA)モジュール,グローバルコンテキストモジュール(GCM)モジュール,適応選択モジュール(ASM)モジュールで構成される適応コンテキスト選択に基づくエンコーダデコーダフレームワークを提案する。
LCAモジュールは、エンコーダ層からデコーダ層へローカルなコンテキスト機能を提供する。
GCMは、グローバルなコンテキストの特徴をさらに探求し、デコーダ層に送信することを目的としている。ASMは、チャンネルワイドアテンションを通じて、コンテキスト特徴の適応的選択と集約に使用される。
論文 参考訳(メタデータ) (2023-01-12T04:06:44Z) - Polyp-PVT: Polyp Segmentation with Pyramid Vision Transformers [124.01928050651466]
本稿では,Polyp-PVTと呼ばれる新しいタイプのPolypセグメンテーション手法を提案する。
提案モデルであるPolyp-PVTは,特徴の雑音を効果的に抑制し,その表現能力を大幅に向上させる。
論文 参考訳(メタデータ) (2021-08-16T07:09:06Z) - Automatic Polyp Segmentation via Multi-scale Subtraction Network [100.94922587360871]
臨床的には、正確なポリープセグメンテーションは大腸癌の早期発見に重要な情報を提供する。
既存のほとんどの手法はU字型構造に基づいており、デコーダで段階的に異なるレベルの特徴を融合させるために要素ワイド付加または結合を用いる。
大腸内視鏡画像からポリプを抽出するマルチスケールサブトラクションネットワーク(MSNet)を提案する。
論文 参考訳(メタデータ) (2021-08-11T07:54:07Z) - PSConv: Squeezing Feature Pyramid into One Compact Poly-Scale
Convolutional Layer [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、しばしばスケールに敏感である。
我々は、この後悔を、より細かい粒度でマルチスケールの機能を利用して埋める。
提案した畳み込み演算は、PSConv(Poly-Scale Convolution)と呼ばれ、拡張率のスペクトルを混合する。
論文 参考訳(メタデータ) (2020-07-13T05:14:11Z) - PraNet: Parallel Reverse Attention Network for Polyp Segmentation [155.93344756264824]
大腸内視鏡画像の高精度なポリープ分割のための並列リバースアテンションネットワーク(PraNet)を提案する。
並列部分復号器(PPD)を用いて,まず高層層に特徴を集約する。
さらに,エリアとバウンダリの関連性を確立するために,リバースアテンション(RA)モジュールを用いて境界キューをマイニングする。
論文 参考訳(メタデータ) (2020-06-13T08:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。