論文の概要: PSTNet: Enhanced Polyp Segmentation with Multi-scale Alignment and Frequency Domain Integration
- arxiv url: http://arxiv.org/abs/2409.08501v1
- Date: Fri, 13 Sep 2024 02:52:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-16 17:58:09.217892
- Title: PSTNet: Enhanced Polyp Segmentation with Multi-scale Alignment and Frequency Domain Integration
- Title(参考訳): PSTNet: マルチスケールアライメントと周波数領域の統合によるポリプセグメンテーションの強化
- Authors: Wenhao Xu, Rongtao Xu, Changwei Wang, Xiuli Li, Shibiao Xu, Li Guo,
- Abstract要約: Polyp Network with Shunted Transformer (PSTNet) は、画像に存在するRGBと周波数領域の両方を統合する新しいアプローチである。
PSTNetは3つの主要なモジュールから構成される: 周波数特性アテンションモジュール(FCAM)は周波数キューを抽出し、ポリプの特徴を捉え、特徴補助アライメントモジュール(FSAM)は意味情報を調整し、ノイズを低減し、CPMは周波数キューを高レベルなセマンティクスと相乗化して効率的なポリプセグメンテーションを実現する。
- 参考スコア(独自算出の注目度): 17.1088588766663
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate segmentation of colorectal polyps in colonoscopy images is crucial for effective diagnosis and management of colorectal cancer (CRC). However, current deep learning-based methods primarily rely on fusing RGB information across multiple scales, leading to limitations in accurately identifying polyps due to restricted RGB domain information and challenges in feature misalignment during multi-scale aggregation. To address these limitations, we propose the Polyp Segmentation Network with Shunted Transformer (PSTNet), a novel approach that integrates both RGB and frequency domain cues present in the images. PSTNet comprises three key modules: the Frequency Characterization Attention Module (FCAM) for extracting frequency cues and capturing polyp characteristics, the Feature Supplementary Alignment Module (FSAM) for aligning semantic information and reducing misalignment noise, and the Cross Perception localization Module (CPM) for synergizing frequency cues with high-level semantics to achieve efficient polyp segmentation. Extensive experiments on challenging datasets demonstrate PSTNet's significant improvement in polyp segmentation accuracy across various metrics, consistently outperforming state-of-the-art methods. The integration of frequency domain cues and the novel architectural design of PSTNet contribute to advancing computer-assisted polyp segmentation, facilitating more accurate diagnosis and management of CRC.
- Abstract(参考訳): 大腸内視鏡像における大腸ポリープの正確な分画は,大腸癌(CRC)の診断と管理に重要である。
しかし、現在のディープラーニングベースの手法は、主に複数のスケールにわたるRGB情報の融合に依存しており、制限されたRGBドメイン情報とマルチスケールアグリゲーション時の機能的不整合によるポリプの正確な識別の制限につながっている。
これらの制約に対処するため、画像中のRGBと周波数領域の両方を統合した新しいアプローチであるSongted Transformer (PSTNet) を用いたPolyp Segmentation Networkを提案する。
PSTNetは3つの主要なモジュールから構成されている: 周波数特性アテンションモジュール (FCAM) は周波数キューを抽出し、ポリプの特徴を捉え、特徴補助アライメントモジュール (FSAM) は意味情報を整列し、アライメントノイズを低減し、CPM (Cross Perception Localization Module) は周波数キューと高レベルのセグメンテーションを相乗して効率的なポリプセグメンテーションを実現する。
挑戦的なデータセットに関する大規模な実験は、さまざまなメトリクスにわたるポリプセグメンテーション精度において、PSTNetの大幅な改善を示し、一貫して最先端の手法を上回っている。
周波数領域のキューの統合とPSTNetのアーキテクチャ設計は、コンピュータ支援型ポリープセグメンテーションの進展に寄与し、CRCのより正確な診断と管理を容易にする。
関連論文リスト
- ECC-PolypDet: Enhanced CenterNet with Contrastive Learning for Automatic
Polyp Detection [88.4359020192429]
既存の手法では、計算コストのかかるコンテキストアグリゲーションが伴うか、ポリープの事前モデリングが欠如しているため、難解なケースでは性能が低下する。
本稿では,2段階のトレーニングとエンドツーエンド推論フレームワークである Enhanced CenterNet with Contrastive Learning (ECC-PolypDet) を提案する。
Box-assisted Contrastive Learning (BCL) は, クラス内差を最小限に抑え, 前庭ポリープと背景のクラス間差を最大化するため, 隠れポリープを捕捉する。
微調整段階におけるIoU誘導サンプル再重み付けの導入
論文 参考訳(メタデータ) (2024-01-10T07:03:41Z) - M3FPolypSegNet: Segmentation Network with Multi-frequency Feature Fusion
for Polyp Localization in Colonoscopy Images [1.389360509566256]
M3FPolypSegNet (M3FPolypSegNet) は、入力画像を低周波数成分/高周波数成分に分解する。
我々は3つの独立したマルチ周波数エンコーダを用いて、複数の入力画像を高次元の特徴空間にマッピングした。
我々は,4つのデコーダブロックで3つのマルチタスク学習(領域,エッジ,距離)を設計し,その領域の構造的特徴を学習した。
論文 参考訳(メタデータ) (2023-10-09T09:01:53Z) - Efficient Polyp Segmentation Via Integrity Learning [14.34505893948565]
本稿では, マクロおよびマイクロレベルでのポリプセグメンテーションにおける完全性の概念を導入し, 完全性欠如を軽減することを目的とした。
我々のIC-PolypSegネットワークは、軽量なバックボーンと3つのキーコンポーネントを使って整合性を改善する。
論文 参考訳(メタデータ) (2023-09-15T08:11:05Z) - FLDNet: A Foreground-Aware Network for Polyp Segmentation Leveraging
Long-Distance Dependencies [1.7623838912231695]
本研究では,トランスフォーマーに基づくニューラルネットワークであるFLDNetを提案する。
提案手法であるFLDNetは, 一般的なデータセットの7つの指標を用いて評価し, 広く利用されている評価尺度の最先端手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2023-09-12T06:32:42Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Adaptive Context Selection for Polyp Segmentation [99.9959901908053]
本稿では,ローカルコンテキストアテンション(LCA)モジュール,グローバルコンテキストモジュール(GCM)モジュール,適応選択モジュール(ASM)モジュールで構成される適応コンテキスト選択に基づくエンコーダデコーダフレームワークを提案する。
LCAモジュールは、エンコーダ層からデコーダ層へローカルなコンテキスト機能を提供する。
GCMは、グローバルなコンテキストの特徴をさらに探求し、デコーダ層に送信することを目的としている。ASMは、チャンネルワイドアテンションを通じて、コンテキスト特徴の適応的選択と集約に使用される。
論文 参考訳(メタデータ) (2023-01-12T04:06:44Z) - Polyp-PVT: Polyp Segmentation with Pyramid Vision Transformers [124.01928050651466]
本稿では,Polyp-PVTと呼ばれる新しいタイプのPolypセグメンテーション手法を提案する。
提案モデルであるPolyp-PVTは,特徴の雑音を効果的に抑制し,その表現能力を大幅に向上させる。
論文 参考訳(メタデータ) (2021-08-16T07:09:06Z) - Automatic Polyp Segmentation via Multi-scale Subtraction Network [100.94922587360871]
臨床的には、正確なポリープセグメンテーションは大腸癌の早期発見に重要な情報を提供する。
既存のほとんどの手法はU字型構造に基づいており、デコーダで段階的に異なるレベルの特徴を融合させるために要素ワイド付加または結合を用いる。
大腸内視鏡画像からポリプを抽出するマルチスケールサブトラクションネットワーク(MSNet)を提案する。
論文 参考訳(メタデータ) (2021-08-11T07:54:07Z) - PraNet: Parallel Reverse Attention Network for Polyp Segmentation [155.93344756264824]
大腸内視鏡画像の高精度なポリープ分割のための並列リバースアテンションネットワーク(PraNet)を提案する。
並列部分復号器(PPD)を用いて,まず高層層に特徴を集約する。
さらに,エリアとバウンダリの関連性を確立するために,リバースアテンション(RA)モジュールを用いて境界キューをマイニングする。
論文 参考訳(メタデータ) (2020-06-13T08:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。