論文の概要: Enhancing Polyp Segmentation via Encoder Attention and Dynamic Kernel Update
- arxiv url: http://arxiv.org/abs/2509.23502v1
- Date: Sat, 27 Sep 2025 21:16:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.265776
- Title: Enhancing Polyp Segmentation via Encoder Attention and Dynamic Kernel Update
- Title(参考訳): エンコーダ注意と動的カーネル更新によるポリプセグメンテーションの強化
- Authors: Fatemeh Salahi Chashmi, Roya Sotoudeh,
- Abstract要約: ポリープセグメンテーションは大腸癌検出における重要なステップであるが、多彩な形状、サイズ、低コントラスト境界のために依然として困難である。
本稿では,動的カーネル(DK)機構をグローバルアテンションモジュールに統合することにより,セグメンテーションの精度と効率を向上させる新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Polyp segmentation is a critical step in colorectal cancer detection, yet it remains challenging due to the diverse shapes, sizes, and low contrast boundaries of polyps in medical imaging. In this work, we propose a novel framework that improves segmentation accuracy and efficiency by integrating a Dynamic Kernel (DK) mechanism with a global Encoder Attention module. The DK mechanism, initialized by a global context vector from the EA module, iteratively refines segmentation predictions across decoding stages, enabling the model to focus on and accurately delineate complex polyp boundaries. The EA module enhances the network's ability to capture critical lesion features by aggregating multi scale information from all encoder layers. In addition, we employ Unified Channel Adaptation (UCA) in the decoder to standardize feature dimensions across stages, ensuring consistent and computationally efficient information fusion. Our approach extends the lesion-aware kernel framework by introducing a more flexible, attention driven kernel initialization and a unified decoder design. Extensive experiments on the KvasirSEG and CVC ClinicDB benchmark datasets demonstrate that our model outperforms several state of the art segmentation methods, achieving superior Dice and Intersection over Union scores. Moreover, UCA simplifies the decoder structure, reducing computational cost without compromising accuracy. Overall, the proposed method provides a robust and adaptable solution for polyp segmentation, with promising applications in clinical and automated diagnostic systems.
- Abstract(参考訳): ポリープセグメンテーションは大腸癌検出における重要なステップであるが、医療画像におけるポリープの多様な形状、サイズ、および低コントラスト境界のために依然として困難である。
本研究では,動的カーネル(DK)機構をグローバルエンコーダアテンションモジュールに統合することにより,セグメント化の精度と効率を向上させる新しいフレームワークを提案する。
DKメカニズムは、EAモジュールからグローバルコンテキストベクトルによって初期化され、復号段階のセグメンテーション予測を反復的に洗練し、複雑なポリプ境界に集中し、正確にデライン化することができる。
EAモジュールは、すべてのエンコーダ層から複数のスケール情報を集約することで、ネットワークの重要病変の特徴をキャプチャする能力を強化する。
さらに,デコーダにUnified Channel Adaptation (UCA) を導入し,各段間の特徴次元を標準化し,一貫した計算効率の高い情報融合を実現する。
提案手法は,よりフレキシブルで注目度の高いカーネル初期化とデコーダの統一設計を導入することで,病変対応カーネルフレームワークを拡張した。
KvasirSEGとCVC ClinicalDBベンチマークデータセットの大規模な実験により、我々のモデルはいくつかの最先端セグメンテーション手法より優れており、ユニオンスコアよりも優れたDiceとIntersectionを実現していることが示された。
さらに、UCAはデコーダ構造を単純化し、精度を損なうことなく計算コストを削減する。
提案手法は, ポリープセグメンテーションに対する堅牢で適応可能なソリューションであり, 臨床および自動診断システムに有望な応用が期待できる。
関連論文リスト
- Large Language Model Evaluated Stand-alone Attention-Assisted Graph Neural Network with Spatial and Structural Information Interaction for Precise Endoscopic Image Segmentation [16.773882069530426]
本研究では,空間グラフと構造グラフを融合したFOCUS-Medを提案する。
FOCUS-Medは、Dual Graph Convolutional Network (Dual-GCN)モジュールを統合し、コンテキスト空間および位相構造上の依存関係をキャプチャする。
公開ベンチマークの実験では、FOCUS-Medが5つの主要な指標で最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2025-08-09T15:53:19Z) - Unleashing Vision Foundation Models for Coronary Artery Segmentation: Parallel ViT-CNN Encoding and Variational Fusion [12.839049648094893]
冠動脈セグメンテーションは冠動脈疾患(CAD)のコンピュータ診断に重要である
並列符号化アーキテクチャを用いて,視覚基盤モデル(VFM)のパワーを利用する新しいフレームワークを提案する。
提案手法は, 精度の高い冠動脈セグメンテーションにおいて, 最先端の手法よりも優れ, 優れた性能を発揮する。
論文 参考訳(メタデータ) (2025-07-17T09:25:00Z) - ASPS: Augmented Segment Anything Model for Polyp Segmentation [77.25557224490075]
SAM(Segment Anything Model)は、ポリープセグメンテーションに先例のないポテンシャルを導入している。
SAMのTransformerベースの構造は、グローバルおよび低周波情報を優先する。
CFAはトレーニング可能なCNNエンコーダブランチと凍結したViTエンコーダを統合し、ドメイン固有の知識の統合を可能にする。
論文 参考訳(メタデータ) (2024-06-30T14:55:32Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Multi Kernel Positional Embedding ConvNeXt for Polyp Segmentation [7.31341312596412]
本稿では,ConvNeXtバックボーンとMulti Kernel Positional Embeddingブロックで構成される新しいフレームワークを提案する。
我々のモデルは,Kvasir-SEGデータセット上でのDice係数0.8818とIOUスコア0.8163を達成する。
論文 参考訳(メタデータ) (2023-01-17T03:12:57Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Adaptive Context Selection for Polyp Segmentation [99.9959901908053]
本稿では,ローカルコンテキストアテンション(LCA)モジュール,グローバルコンテキストモジュール(GCM)モジュール,適応選択モジュール(ASM)モジュールで構成される適応コンテキスト選択に基づくエンコーダデコーダフレームワークを提案する。
LCAモジュールは、エンコーダ層からデコーダ層へローカルなコンテキスト機能を提供する。
GCMは、グローバルなコンテキストの特徴をさらに探求し、デコーダ層に送信することを目的としている。ASMは、チャンネルワイドアテンションを通じて、コンテキスト特徴の適応的選択と集約に使用される。
論文 参考訳(メタデータ) (2023-01-12T04:06:44Z) - BCS-Net: Boundary, Context and Semantic for Automatic COVID-19 Lung
Infection Segmentation from CT Images [83.82141604007899]
BCS-Netは、CT画像から自動的に新型コロナウイルスの肺感染症を分離するための新しいネットワークである。
BCS-Netはエンコーダ-デコーダアーキテクチャに従っており、多くの設計はデコーダのステージに焦点を当てている。
BCSRブロックでは、アテンション誘導グローバルコンテキスト(AGGC)モジュールがデコーダの最も価値のあるエンコーダ機能を学ぶように設計されている。
論文 参考訳(メタデータ) (2022-07-17T08:54:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。