論文の概要: VM-UNet: Vision Mamba UNet for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2402.02491v1
- Date: Sun, 4 Feb 2024 13:37:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 19:40:25.505051
- Title: VM-UNet: Vision Mamba UNet for Medical Image Segmentation
- Title(参考訳): vm-unet:医療画像分割のためのvision mamba unet
- Authors: Jiacheng Ruan, Suncheng Xiang
- Abstract要約: 医用画像セグメンテーションのためのU字型アーキテクチャモデルVision Mamba UNet(VM-UNet)を提案する。
我々はISIC17,ISIC18,Synapseデータセットの総合的な実験を行い,VM-UNetが医用画像分割タスクにおいて競争力を発揮することを示す。
- 参考スコア(独自算出の注目度): 3.170171905334503
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the realm of medical image segmentation, both CNN-based and
Transformer-based models have been extensively explored. However, CNNs exhibit
limitations in long-range modeling capabilities, whereas Transformers are
hampered by their quadratic computational complexity. Recently, State Space
Models (SSMs), exemplified by Mamba, have emerged as a promising approach. They
not only excel in modeling long-range interactions but also maintain a linear
computational complexity. In this paper, leveraging state space models, we
propose a U-shape architecture model for medical image segmentation, named
Vision Mamba UNet (VM-UNet). Specifically, the Visual State Space (VSS) block
is introduced as the foundation block to capture extensive contextual
information, and an asymmetrical encoder-decoder structure is constructed. We
conduct comprehensive experiments on the ISIC17, ISIC18, and Synapse datasets,
and the results indicate that VM-UNet performs competitively in medical image
segmentation tasks. To our best knowledge, this is the first medical image
segmentation model constructed based on the pure SSM-based model. We aim to
establish a baseline and provide valuable insights for the future development
of more efficient and effective SSM-based segmentation systems. Our code is
available at https://github.com/JCruan519/VM-UNet.
- Abstract(参考訳): 医用画像セグメンテーションの分野では、cnnベースとトランスフォーマーベースの両方のモデルが広く研究されている。
しかし、cnnは長距離モデリング能力の限界を示し、トランスフォーマーは二次計算の複雑さによって妨げられている。
近年,mambaに代表される状態空間モデル(ssm)が有望なアプローチとして登場している。
長距離相互作用をモデル化するだけでなく、線形計算の複雑さも維持する。
本稿では,状態空間モデルを活用した医療画像分割のためのu字型アーキテクチャモデルであるvision mamba unet (vm-unet)を提案する。
具体的には、Visual State Space(VSS)ブロックを基盤ブロックとして導入し、広いコンテキスト情報をキャプチャし、非対称エンコーダデコーダ構造を構築する。
我々はISIC17,ISIC18,Synapseデータセットの総合的な実験を行い,VM-UNetが医用画像分割タスクにおいて競争力を発揮することを示す。
我々の知る限り、これは純粋なSSMモデルに基づいて構築された最初の医用画像分割モデルである。
我々は,より効率的かつ効果的なSSMセグメンテーションシステムの構築に向けて,ベースラインを確立することを目的としている。
私たちのコードはhttps://github.com/JCruan519/VM-UNetで利用可能です。
関連論文リスト
- VM-UNET-V2 Rethinking Vision Mamba UNet for Medical Image Segmentation [8.278068663433261]
本稿では,MambaアーキテクチャにインスパイアされたVison Mamba-UNetV2を提案する。
VM-UNetV2は、医用画像セグメンテーションタスクにおいて競合する性能を示す。
我々はISIC17、ISIC18、CVC-300、CVC-ClinicDB、Kvasir CVC-ColonDB、ETIS-LaribPolypDBのパブリックデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2024-03-14T08:12:39Z) - Large Window-based Mamba UNet for Medical Image Segmentation: Beyond
Convolution and Self-attention [10.773829425283177]
2次元および3次元の医用画像セグメンテーションのためのLMa-UNet(Large Window-based Mamba U-shape Network)を提案する。
LMa-UNetの際立った特徴は、小さなカーネルベースのCNNや小さなウィンドウベースのトランスフォーマーに比べて、局所的な空間モデリングに優れた大きなウィンドウの利用である。
論文 参考訳(メタデータ) (2024-03-12T05:34:51Z) - Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation [22.72152196750845]
Mamba-UNetは,医療画像のセグメンテーションにおいてU-Netとマンバの能力を相乗化する新しいアーキテクチャである。
Mamba-UNetは純粋なVisual Mamba(VMamba)ベースのエンコーダデコーダ構造を採用しており、空間情報を保存するためにスキップ接続を注入している。
我々は,MRI心組織分節データセットの公開実験を行った。
論文 参考訳(メタデータ) (2024-02-07T18:33:04Z) - nnMamba: 3D Biomedical Image Segmentation, Classification and Landmark
Detection with State Space Model [24.955052600683423]
本稿では、CNNの強みとステートスペースシーケンスモデル(SSM)の高度な長距離モデリング機能を統合する新しいアーキテクチャであるnnMambaを紹介する。
6つのデータセットの実験では、3D画像のセグメンテーション、分類、ランドマーク検出など、一連の困難なタスクにおいて、nnMambaが最先端のメソッドよりも優れていることが示されている。
論文 参考訳(メタデータ) (2024-02-05T21:28:47Z) - VMamba: Visual State Space Model [96.83847407325486]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、視覚表現学習の最も一般的な2つの基礎モデルである。
計算効率を向上しつつ,これらのコンポーネントを継承する新しいアーキテクチャを提案する。
空間領域を横断するクロススキャンモジュール(CSM)を導入し,任意の非因果的視覚画像を順序付きパッチシーケンスに変換する。
論文 参考訳(メタデータ) (2024-01-18T17:55:39Z) - Vision Mamba: Efficient Visual Representation Learning with
Bidirectional State Space Model [51.10876815815515]
We propose a new generic vision backbone with bidirectional Mamba block (Vim)。
Vimは画像列を位置埋め込みでマークし、視覚表現を双方向の状態空間モデルで圧縮する。
その結果,高解像度画像に対するTransformerスタイルの理解において,Vimは計算とメモリの制約を克服できることがわかった。
論文 参考訳(メタデータ) (2024-01-17T18:56:18Z) - U-Mamba: Enhancing Long-range Dependency for Biomedical Image
Segmentation [10.083902382768406]
バイオメディカルイメージセグメンテーションのための汎用ネットワークであるU-Mambaを紹介する。
ディープシークエンスモデルの新たなファミリーであるState Space Sequence Models (SSM) にインスパイアされ、我々はハイブリッドCNN-SSMブロックを設計する。
我々は,CTおよびMR画像における腹部臓器の3次元分節化,内視鏡画像における計器の分節化,顕微鏡画像における細胞分節化の4つの課題について実験を行った。
論文 参考訳(メタデータ) (2024-01-09T18:53:20Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z) - Fed-Sim: Federated Simulation for Medical Imaging [131.56325440976207]
本稿では、2つの学習可能なニューラルモジュールからなる物理駆動型生成手法を提案する。
データ合成フレームワークは、複数のデータセットの下流セグメンテーション性能を改善する。
論文 参考訳(メタデータ) (2020-09-01T19:17:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。