論文の概要: Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2402.05079v1
- Date: Wed, 7 Feb 2024 18:33:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-08 14:01:33.145632
- Title: Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation
- Title(参考訳): Mamba-UNet: 医用画像セグメンテーションのためのUNetライクなビジュアルマンバ
- Authors: Ziyang Wang, Jian-Qing Zheng, Yichi Zhang, Ge Cui, Lei Li
- Abstract要約: Mamba-UNetは,医療画像のセグメンテーションにおいてU-Netとマンバの能力を相乗化する新しいアーキテクチャである。
Mamba-UNetは純粋なVisual Mamba(VMamba)ベースのエンコーダデコーダ構造を採用しており、空間情報を保存するためにスキップ接続を注入している。
我々は,MRI心組織分節データセットの公開実験を行った。
- 参考スコア(独自算出の注目度): 22.72152196750845
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent advancements in medical image analysis, Convolutional Neural
Networks (CNN) and Vision Transformers (ViT) have set significant benchmarks.
While the former excels in capturing local features through its convolution
operations, the latter achieves remarkable global context understanding by
leveraging self-attention mechanisms. However, both architectures exhibit
limitations in efficiently modeling long-range dependencies within medical
images, which is a critical aspect for precise segmentation. Inspired by the
Mamba architecture, known for its proficiency in handling long sequences and
global contextual information with enhanced computational efficiency as a State
Space Model (SSM), we propose Mamba-UNet, a novel architecture that synergizes
the U-Net in medical image segmentation with Mamba's capability. Mamba-UNet
adopts a pure Visual Mamba (VMamba)-based encoder-decoder structure, infused
with skip connections to preserve spatial information across different scales
of the network. This design facilitates a comprehensive feature learning
process, capturing intricate details and broader semantic contexts within
medical images. We introduce a novel integration mechanism within the VMamba
blocks to ensure seamless connectivity and information flow between the encoder
and decoder paths, enhancing the segmentation performance. We conducted
experiments on publicly available MRI cardiac multi-structures segmentation
dataset. The results show that Mamba-UNet outperforms UNet, Swin-UNet in
medical image segmentation under the same hyper-parameter setting. The source
code and baseline implementations are available.
- Abstract(参考訳): 医療画像解析の最近の進歩の中で、畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は重要なベンチマークを設定している。
前者は畳み込み操作による局所的特徴の捕捉に長けているが、後者は自己認識機構を活用することで、目覚ましいグローバルな文脈理解を実現する。
しかし、どちらのアーキテクチャも、正確なセグメンテーションにおいて重要な側面である医用画像内の長距離依存関係を効率的にモデル化する際の限界を示す。
mambaアーキテクチャに触発されたmambaアーキテクチャは、長いシーケンスを扱う能力と、ssm (computation efficiency as a state space model) が強化されたグローバルコンテキスト情報を扱う能力で知られており、mambaの能力で医療画像分割においてu-netを相乗する新しいアーキテクチャであるmamba-unetを提案する。
Mamba-UNetは純粋にVisual Mamba(VMamba)ベースのエンコーダデコーダ構造を採用しており、ネットワークのさまざまなスケールで空間情報を保存するためにスキップ接続を注入している。
このデザインは包括的特徴学習プロセスを促進し、複雑な詳細と医療画像内のより広い意味的コンテキストをキャプチャする。
エンコーダとデコーダパス間のシームレスな接続と情報フローを確保し,セグメンテーション性能を向上させるために,vmambaブロック内の新たな統合機構を導入する。
mri心筋マルチ構造セグメンテーションデータセットの公開実験を行った。
その結果,Mamba-UNetは,同じハイパーパラメータ設定下で,医用画像セグメンテーションにおいてUNet,Swin-UNetより優れていた。
ソースコードとベースライン実装が利用可能である。
関連論文リスト
- Large Window-based Mamba UNet for Medical Image Segmentation: Beyond
Convolution and Self-attention [10.773829425283177]
2次元および3次元の医用画像セグメンテーションのためのLMa-UNet(Large Window-based Mamba U-shape Network)を提案する。
LMa-UNetの際立った特徴は、小さなカーネルベースのCNNや小さなウィンドウベースのトランスフォーマーに比べて、局所的な空間モデリングに優れた大きなウィンドウの利用である。
論文 参考訳(メタデータ) (2024-03-12T05:34:51Z) - MiM-ISTD: Mamba-in-Mamba for Efficient Infrared Small Target Detection [76.21293341906674]
基本モデルの開発により、赤外線小目標検出(ISTD)は大きな進歩を遂げた。
効率的なISTDのためのMamba-in-Mamba (MiM-ISTD) 構造を調整する。
NUAA-SIRSTとIRSTD-1kを用いた実験により,本手法の精度と効率が向上した。
論文 参考訳(メタデータ) (2024-03-04T15:57:29Z) - Weak-Mamba-UNet: Visual Mamba Makes CNN and ViT Work Better for
Scribble-based Medical Image Segmentation [13.748446415530937]
本稿では医用画像セグメンテーションのための革新的な弱教師付き学習(WSL)フレームワークであるWeak-Mamba-UNetを紹介する。
WSL戦略には3つの異なるアーキテクチャがあるが、同じ対称エンコーダ・デコーダネットワークが組み込まれている。CNNベースのローカル特徴抽出用UNet、包括的なグローバルコンテキスト理解のためのSwin TransformerベースのSwinUNet、より効率的な長距離依存性モデリングのためのVMambaベースのMamba-UNetである。
Weak-Mamba-UNetの有効性は、類似したWSLの性能を超越した、処理アノテーション付きMRI心筋セグメンテーションデータセット上で検証される。
論文 参考訳(メタデータ) (2024-02-16T18:43:39Z) - Semi-Mamba-UNet: Pixel-Level Contrastive Cross-Supervised Visual
Mamba-based UNet for Semi-Supervised Medical Image Segmentation [13.748446415530937]
本稿では,視覚的マンバベースUNetアーキテクチャを従来のUNetと統合したセミマンバUNetを,半教師付き学習(SSL)フレームワークに導入する。
一般に公開されているMRI心筋セグメンテーションデータセットの総合的評価は,Semi-Mamba-UNetの優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-11T17:09:21Z) - Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining [85.08169822181685]
本稿では,医療画像のセグメンテーションに特化して設計された新しいマンバモデルSwin-UMambaを紹介する。
Swin-UMamba は CNN や ViT,最新の Mamba ベースのモデルと比較して,優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-05T18:58:11Z) - VM-UNet: Vision Mamba UNet for Medical Image Segmentation [3.170171905334503]
医用画像セグメンテーションのためのU字型アーキテクチャモデルVision Mamba UNet(VM-UNet)を提案する。
我々はISIC17,ISIC18,Synapseデータセットの総合的な実験を行い,VM-UNetが医用画像分割タスクにおいて競争力を発揮することを示す。
論文 参考訳(メタデータ) (2024-02-04T13:37:21Z) - Vision Mamba: Efficient Visual Representation Learning with
Bidirectional State Space Model [51.10876815815515]
We propose a new generic vision backbone with bidirectional Mamba block (Vim)。
Vimは画像列を位置埋め込みでマークし、視覚表現を双方向の状態空間モデルで圧縮する。
その結果,高解像度画像に対するTransformerスタイルの理解において,Vimは計算とメモリの制約を克服できることがわかった。
論文 参考訳(メタデータ) (2024-01-17T18:56:18Z) - U-Mamba: Enhancing Long-range Dependency for Biomedical Image
Segmentation [10.083902382768406]
バイオメディカルイメージセグメンテーションのための汎用ネットワークであるU-Mambaを紹介する。
ディープシークエンスモデルの新たなファミリーであるState Space Sequence Models (SSM) にインスパイアされ、我々はハイブリッドCNN-SSMブロックを設計する。
我々は,CTおよびMR画像における腹部臓器の3次元分節化,内視鏡画像における計器の分節化,顕微鏡画像における細胞分節化の4つの課題について実験を行った。
論文 参考訳(メタデータ) (2024-01-09T18:53:20Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。