論文の概要: FocusNet: Transformer-enhanced Polyp Segmentation with Local and Pooling Attention
- arxiv url: http://arxiv.org/abs/2504.13597v1
- Date: Fri, 18 Apr 2025 09:59:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-28 16:18:39.19094
- Title: FocusNet: Transformer-enhanced Polyp Segmentation with Local and Pooling Attention
- Title(参考訳): FocusNet: Transformer-enhanced Polyp Segmentation with Local and Pooling Attention
- Authors: Jun Zeng, KC Santosh, Deepak Rajan Nayak, Thomas de Lange, Jonas Varkey, Tyler Berzin, Debesh Jha,
- Abstract要約: 大腸内視鏡は大腸ポリープの早期診断に不可欠である。
定期スクリーニングは良性ポリープがCRCに進行するのを効果的に防ぐことができる。
本研究では,ポリプのセグメンテーションを改善するために,トランスフォーマー強化型フォーカスアテンションネットワークであるFocusNetを提案する。
- 参考スコア(独自算出の注目度): 11.964732823289333
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Colonoscopy is vital in the early diagnosis of colorectal polyps. Regular screenings can effectively prevent benign polyps from progressing to CRC. While deep learning has made impressive strides in polyp segmentation, most existing models are trained on single-modality and single-center data, making them less effective in real-world clinical environments. To overcome these limitations, we propose FocusNet, a Transformer-enhanced focus attention network designed to improve polyp segmentation. FocusNet incorporates three essential modules: the Cross-semantic Interaction Decoder Module (CIDM) for generating coarse segmentation maps, the Detail Enhancement Module (DEM) for refining shallow features, and the Focus Attention Module (FAM), to balance local detail and global context through local and pooling attention mechanisms. We evaluate our model on PolypDB, a newly introduced dataset with multi-modality and multi-center data for building more reliable segmentation methods. Extensive experiments showed that FocusNet consistently outperforms existing state-of-the-art approaches with a high dice coefficients of 82.47% on the BLI modality, 88.46% on FICE, 92.04% on LCI, 82.09% on the NBI and 93.42% on WLI modality, demonstrating its accuracy and robustness across five different modalities. The source code for FocusNet is available at https://github.com/JunZengz/FocusNet.
- Abstract(参考訳): 大腸内視鏡は大腸ポリープの早期診断に不可欠である。
定期スクリーニングは良性ポリープがCRCに進行するのを効果的に防ぐことができる。
ディープラーニングは、Polypセグメンテーションにおいて目覚ましい進歩を遂げてきたが、既存のモデルの多くは、単一のモダリティと単一中心データに基づいて訓練されているため、実際の臨床環境では効果が低い。
これらの制約を克服するために,ポリプセグメンテーションを改善するために,トランスフォーマーに強化されたフォーカスアテンションネットワークであるFocusNetを提案する。
FocusNetは、粗いセグメンテーションマップを生成するクロス・セグメンテーション・デコーダ・モジュール(CIDM)、浅い特徴を洗練するためのディテール・エンハンス・モジュール(DEM)、局所的およびプール的アテンション機構を通じて局所的な詳細とグローバルなコンテキストをバランスさせるフォーカス・アテンション・モジュール(FAM)という3つの重要なモジュールを組み込んでいる。
我々は,より信頼性の高いセグメンテーション手法を構築するために,マルチモーダリティとマルチセンタデータを備えた新しいデータセットであるPolypDBのモデルを評価する。
大規模な実験により、FocusNetは既存の最先端のアプローチを一貫して上回り、BLIのモダリティは82.47%、FICEは88.46%、LCIは92.04%、NBIは82.09%、WLIのモダリティは93.42%の精度とロバスト性を示した。
FocusNetのソースコードはhttps://github.com/JunZengz/FocusNetで入手できる。
関連論文リスト
- MNet-SAt: A Multiscale Network with Spatial-enhanced Attention for Segmentation of Polyps in Colonoscopy [0.10995326465245926]
大腸内視鏡画像におけるポリプセグメンテーションのためのMNetSAt(Multiscale Network with spatial-enhanced Attention)を提案する。
このフレームワークには、エッジガイド機能強化(EGFE)、マルチスケール機能集約(MSFA)、空間拡張注意(SEAt)の4つの重要なモジュールが含まれている。
我々は,Kvasir-SEGデータセットとCVC-ClinicDBデータセット上でMNet-SAtを評価し,96.61%,98.60%のDice類似度係数をそれぞれ達成した。
論文 参考訳(メタデータ) (2024-12-27T05:17:29Z) - Multi-scale and Multi-path Cascaded Convolutional Network for Semantic Segmentation of Colorectal Polyps [0.0]
本研究は,Multi-Scale and Multi-Path Cascaded Convolution Network (MMCC-Net) という,大腸ポリープセグメンテーションのための新しいフレームワークを提案する。
MMCC-Netは、マルチスケールおよびマルチパスのカスケード畳み込み技術を統合し、デュアルアテンションモジュール、スキップ接続、フィーチャエンハンサーを通じてフィーチャアグリゲーションを強化する。
提案したMMCC-Netは6つの公開データセットでテストされ、ポリプセグメンテーションの効率を示すために8つのSOTAモデルと比較された。
論文 参考訳(メタデータ) (2024-12-03T13:27:51Z) - Multi-scale Cascaded Large-Model for Whole-body ROI Segmentation [5.430156054316826]
我々は,Multi-scale Cascaded Fusing Network (MCFNet)と呼ばれる,革新的なカスケードネットワークアーキテクチャを提案する。
MCFNetは、複雑なマルチスケールとマルチ解像度の機能を効果的にキャプチャする。
我々は,36,131対の画像マスクを含む671症例の多様なデータセットに対して,A6000 GPUを用いて実験を行った。
論文 参考訳(メタデータ) (2024-11-23T11:39:06Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - ASPS: Augmented Segment Anything Model for Polyp Segmentation [77.25557224490075]
SAM(Segment Anything Model)は、ポリープセグメンテーションに先例のないポテンシャルを導入している。
SAMのTransformerベースの構造は、グローバルおよび低周波情報を優先する。
CFAはトレーニング可能なCNNエンコーダブランチと凍結したViTエンコーダを統合し、ドメイン固有の知識の統合を可能にする。
論文 参考訳(メタデータ) (2024-06-30T14:55:32Z) - Center Focusing Network for Real-Time LiDAR Panoptic Segmentation [58.1194137706868]
高精度かつリアルタイムなLiDARパノプティブセグメンテーションを実現するために、CFNet(Central Focus Network)を導入した。
CFFEは、元のLiDARポイントと仮想インスタンスセンターの関係を明確に理解するために提案されている。
我々のCFNetは、すべての既存のメソッドを大きなマージンで上回り、最も効率的なメソッドよりも1.6倍高速です。
論文 参考訳(メタデータ) (2023-11-16T01:52:11Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Multi-scale Network with Attentional Multi-resolution Fusion for Point
Cloud Semantic Segmentation [2.964101313270572]
ローカルおよびグローバルなマルチスケール情報を集約する総合的なポイントクラウドセマンティックセマンティックセマンティクスネットワークを提案する。
点の局所的な形状を効果的に学習するアングル相関点畳み込みモジュールを提案する。
第3に、2Dイメージビジョンタスクのパフォーマンスに優れたHRNetにインスパイアされた私たちは、ポイントクラウド用にカスタマイズされたHRNetを構築し、グローバルなマルチスケールコンテキストを学習します。
論文 参考訳(メタデータ) (2022-06-27T21:03:33Z) - PraNet: Parallel Reverse Attention Network for Polyp Segmentation [155.93344756264824]
大腸内視鏡画像の高精度なポリープ分割のための並列リバースアテンションネットワーク(PraNet)を提案する。
並列部分復号器(PPD)を用いて,まず高層層に特徴を集約する。
さらに,エリアとバウンダリの関連性を確立するために,リバースアテンション(RA)モジュールを用いて境界キューをマイニングする。
論文 参考訳(メタデータ) (2020-06-13T08:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。