論文の概要: Topo-VM-UNetV2: Encoding Topology into Vision Mamba UNet for Polyp Segmentation
- arxiv url: http://arxiv.org/abs/2505.06210v1
- Date: Fri, 09 May 2025 17:41:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-12 20:40:10.35404
- Title: Topo-VM-UNetV2: Encoding Topology into Vision Mamba UNet for Polyp Segmentation
- Title(参考訳): Topo-VM-UNetV2:ポリプセグメンテーションのためのトポロジをVision Mamba UNetにエンコードする
- Authors: Diego Adame, Jose A. Nunez, Fabian Vazquez, Nayeli Gurrola, Huimin Li, Haoteng Tang, Bin Fu, Pengfei Gu,
- Abstract要約: Topo-VMUNetV2を提案する。これはMambaベースのポリプセグメンテーションモデルVMUNetV2にトポロジ的特徴をエンコードする。
提案手法は2つの段階から構成される: VMUNetV2はトレーニングおよびテスト画像の確率マップ(PM)を生成するために使用され、トポロジ注意マップの計算に使用される。
- 参考スコア(独自算出の注目度): 4.856498016044607
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Convolutional neural network (CNN) and Transformer-based architectures are two dominant deep learning models for polyp segmentation. However, CNNs have limited capability for modeling long-range dependencies, while Transformers incur quadratic computational complexity. Recently, State Space Models such as Mamba have been recognized as a promising approach for polyp segmentation because they not only model long-range interactions effectively but also maintain linear computational complexity. However, Mamba-based architectures still struggle to capture topological features (e.g., connected components, loops, voids), leading to inaccurate boundary delineation and polyp segmentation. To address these limitations, we propose a new approach called Topo-VM-UNetV2, which encodes topological features into the Mamba-based state-of-the-art polyp segmentation model, VM-UNetV2. Our method consists of two stages: Stage 1: VM-UNetV2 is used to generate probability maps (PMs) for the training and test images, which are then used to compute topology attention maps. Specifically, we first compute persistence diagrams of the PMs, then we generate persistence score maps by assigning persistence values (i.e., the difference between death and birth times) of each topological feature to its birth location, finally we transform persistence scores into attention weights using the sigmoid function. Stage 2: These topology attention maps are integrated into the semantics and detail infusion (SDI) module of VM-UNetV2 to form a topology-guided semantics and detail infusion (Topo-SDI) module for enhancing the segmentation results. Extensive experiments on five public polyp segmentation datasets demonstrate the effectiveness of our proposed method. The code will be made publicly available.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースのアーキテクチャは、ポリプセグメンテーションのための2つの主要なディープラーニングモデルである。
しかし、CNNは長距離依存をモデル化する能力に制限がある。
近年、Mambaのような状態空間モデルは、長距離相互作用を効果的にモデル化するだけでなく、線形計算複雑性も維持するため、ポリプセグメンテーションの有望なアプローチとして認識されている。
しかし、Mambaベースのアーキテクチャは、トポロジカルな特徴(例えば、接続されたコンポーネント、ループ、ヴォイド)を捉えるのに苦慮している。
これらの制約に対処するため、我々は、トポロジ的特徴をMambaベースの最先端ポリプセグメンテーションモデルVM-UNetV2にエンコードするTopo-VM-UNetV2という新しいアプローチを提案する。
ステージ1: VM-UNetV2は、トレーニングおよびテスト画像の確率マップ(PM)を生成するために使用され、トポロジーアテンションマップの計算に使用される。
具体的には,まずPMのパーシステンス図を計算し,それぞれのトポロジカル特徴の持続値(死亡時刻と生年月日差)をその誕生位置に割り当てることで,パーシステンススコアマップを生成し,最後にシグモイド関数を用いてパーシステンススコアを注意重みに変換する。
ステージ2: これらのトポロジ注意マップは、VM-UNetV2のセマンティクスとディテール注入(SDI)モジュールに統合され、セグメンテーション結果を強化するトポロジ誘導セマンティクスとディテール注入(Topo-SDI)モジュールを形成する。
5つのパブリックなポリプセグメンテーションデータセットの大規模な実験により,提案手法の有効性が示された。
コードは公開されます。
関連論文リスト
- PPMamba: A Pyramid Pooling Local Auxiliary SSM-Based Model for Remote Sensing Image Semantic Segmentation [1.5136939451642137]
本稿では,CNN と Mamba を統合し,セマンティックセグメンテーションタスクを実現する新しいネットワークである Pyramid Pooling Mamba (PPMamba) を提案する。
PPMambaは最先端のモデルに比べて競争力がある。
論文 参考訳(メタデータ) (2024-09-10T08:08:50Z) - VM-UNET-V2 Rethinking Vision Mamba UNet for Medical Image Segmentation [8.278068663433261]
本稿では,MambaアーキテクチャにインスパイアされたVison Mamba-UNetV2を提案する。
VM-UNetV2は、医用画像セグメンテーションタスクにおいて競合する性能を示す。
我々はISIC17、ISIC18、CVC-300、CVC-ClinicDB、Kvasir CVC-ColonDB、ETIS-LaribPolypDBのパブリックデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2024-03-14T08:12:39Z) - VM-UNet: Vision Mamba UNet for Medical Image Segmentation [2.3876474175791302]
医用画像セグメンテーションのためのU字型アーキテクチャモデルVision Mamba UNet(VM-UNet)を提案する。
我々はISIC17,ISIC18,Synapseデータセットの総合的な実験を行い,VM-UNetが医用画像分割タスクにおいて競争力を発揮することを示す。
論文 参考訳(メタデータ) (2024-02-04T13:37:21Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - RaBiT: An Efficient Transformer using Bidirectional Feature Pyramid
Network with Reverse Attention for Colon Polyp Segmentation [0.0]
本稿では,軽量トランスフォーマーアーキテクチャをエンコーダに組み込んだエンコーダデコーダモデルであるRaBiTを紹介する。
本手法は, トレーニングセットとテストセットが異なる特性を持つ場合であっても, クロスデータセット実験において高い一般化能力を示す。
論文 参考訳(メタデータ) (2023-07-12T19:25:10Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Polyp-PVT: Polyp Segmentation with Pyramid Vision Transformers [124.01928050651466]
本稿では,Polyp-PVTと呼ばれる新しいタイプのPolypセグメンテーション手法を提案する。
提案モデルであるPolyp-PVTは,特徴の雑音を効果的に抑制し,その表現能力を大幅に向上させる。
論文 参考訳(メタデータ) (2021-08-16T07:09:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。