論文の概要: MedMamba: Vision Mamba for Medical Image Classification
- arxiv url: http://arxiv.org/abs/2403.03849v4
- Date: Mon, 10 Jun 2024 14:06:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-12 00:53:58.355567
- Title: MedMamba: Vision Mamba for Medical Image Classification
- Title(参考訳): MedMamba:Vision Mamba for Medical Image Classification (動画)
- Authors: Yubiao Yue, Zhenzhang Li,
- Abstract要約: SS-Conv-SSMは,局所的な特徴を抽出するための畳み込み層と,長距離依存関係をキャプチャするSSMの機能を統合する。
グループ化された畳み込み戦略とチャネルシャッフル演算を用いることで、MedMambaはより少ないモデルパラメータと少ない計算負担を提供することに成功した。
我々の研究は、医用画像分類の新しいベースラインを確立することを目的としており、より強力なSSMベースの人工知能アルゴリズムを開発する上で貴重な洞察を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Since the era of deep learning, convolutional neural networks (CNNs) and vision transformers (ViTs) have been extensively studied and widely used in medical image classification tasks. Unfortunately, CNN's limitations in modeling long-range dependencies result in poor classification performances. In contrast, ViTs are hampered by the quadratic computational complexity of their self-attention mechanism, making them difficult to deploy in real-world settings with limited computational resources. Recent studies have shown that state space models (SSMs) represented by Mamba can effectively model long-range dependencies while maintaining linear computational complexity. Inspired by it, we proposed MedMamba, the first vision Mamba for generalized medical image classification. Concretely, we introduced a novel hybrid basic block named SS-Conv-SSM, which integrates the convolutional layers for extracting local features with the abilities of SSM to capture long-range dependencies, aiming to model medical images from different image modalities efficiently. By employing the grouped convolution strategy and channel-shuffle operation, MedMamba successfully provides fewer model parameters and a lower computational burden for efficient applications. To demonstrate the potential of MedMamba, we conducted extensive experiments using 16 datasets containing ten imaging modalities and 411,007 images. Experimental results show that the proposed MedMamba demonstrates competitive performance in classifying various medical images compared with the state-of-the-art methods. Our work is aims to establish a new baseline for medical image classification and provide valuable insights for developing more powerful SSM-based artificial intelligence algorithms and application systems in the medical field. The source codes and all pre-trained weights of MedMamba are available at https://github.com/YubiaoYue/MedMamba.
- Abstract(参考訳): ディープラーニングの時代から、畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)が医学画像分類タスクで広く研究され、広く利用されている。
残念なことに、CNNの長距離依存のモデリングにおける制限は、分類性能の低下をもたらす。
対照的に、ViTは自己保持機構の2次計算複雑性によって妨げられ、限られた計算資源を持つ現実の環境でのデプロイが困難になる。
近年の研究では、Mambaによって表現される状態空間モデル(SSM)は、線形計算複雑性を維持しながら、効果的に長距離依存をモデル化できることが示されている。
そこで我々は,汎用的な医用画像分類のための最初のビジョンであるMedMambaを提案する。
具体的には,SS-Conv-SSMという,局所的な特徴を抽出するための畳み込み層をSSMの能力と統合し,様々な画像モダリティから医用画像を効率的にモデル化することを目的とした,新しいハイブリッド・ベーシック・ブロックを導入した。
グループ化された畳み込み戦略とチャネルシャッフル演算を用いることで、MedMambaはより少ないモデルパラメータとより少ない計算負荷を効率よく提供できる。
MedMambaの可能性を実証するために,10つの画像モダリティと411,007の画像を含む16のデータセットを用いて広範囲にわたる実験を行った。
実験の結果,提案するMedMambaは,最先端の手法と比較して,様々な医用画像の分類において競争力を発揮することが示された。
我々の研究は、医用画像分類の新しいベースラインを確立することを目的としており、医療分野でより強力なSSMベースの人工知能アルゴリズムとアプリケーションシステムを開発するための貴重な洞察を提供する。
MedMambaのソースコードとトレーニング済み重量はすべてhttps://github.com/YubiaoYue/MedMamba.comで入手できる。
関連論文リスト
- A Comprehensive Survey of Mamba Architectures for Medical Image Analysis: Classification, Segmentation, Restoration and Beyond [2.838321145442743]
Mambaは、医用画像分析におけるテンプレートベースのディープラーニングアプローチに代わるものだ。
線形時間の複雑さがあり、トランスよりも大幅に改善されている。
Mambaは、注意機構のない長いシーケンスを処理し、高速な推論を可能にし、メモリを少なくする。
論文 参考訳(メタデータ) (2024-10-03T10:23:03Z) - MambaVision: A Hybrid Mamba-Transformer Vision Backbone [54.965143338206644]
本稿では,視覚応用に適した新しいハイブリッド型Mamba-TransformerバックボーンであるMambaVisionを提案する。
私たちのコアコントリビューションには、視覚的特徴の効率的なモデリング能力を高めるために、Mambaの定式化を再設計することが含まれています。
視覚変換器(ViT)とマンバの統合可能性に関する包括的アブレーション研究を行う。
論文 参考訳(メタデータ) (2024-07-10T23:02:45Z) - Self-Prior Guided Mamba-UNet Networks for Medical Image Super-Resolution [7.97504951029884]
医用画像超解像のための自己優先型マンバ-UNetネットワーク(SMamba-UNet)を提案する。
提案手法は,Mamba-UNetネットワーク下での自己優先型マルチスケールコンテキスト特徴を学習することを目的としている。
論文 参考訳(メタデータ) (2024-07-08T14:41:53Z) - HC-Mamba: Vision MAMBA with Hybrid Convolutional Techniques for Medical Image Segmentation [5.318153305245246]
本稿では,現代空間モデルMambaに基づく新しい医用画像分割モデルHC-Mambaを提案する。
HC-Mambaモデルに拡張畳み込み手法を導入し,より広い範囲の文脈情報を取得する。
さらに、HC-Mambaモデルでは、深度的に分離可能な畳み込みを採用し、パラメータの数とモデルの計算能力を大幅に削減する。
論文 参考訳(メタデータ) (2024-05-08T12:24:50Z) - Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation [21.1787366866505]
Mamba-UNetは,医療画像のセグメンテーションにおいてU-Netとマンバの能力を相乗化する新しいアーキテクチャである。
Mamba-UNetは純粋にVisual Mamba(VMamba)ベースのエンコーダデコーダ構造を採用しており、ネットワークのさまざまなスケールで空間情報を保存するためにスキップ接続を注入している。
論文 参考訳(メタデータ) (2024-02-07T18:33:04Z) - Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining [85.08169822181685]
本稿では,医療画像のセグメンテーションに特化して設計された新しいマンバモデルSwin-UMambaを紹介する。
Swin-UMamba は CNN や ViT,最新の Mamba ベースのモデルと比較して,優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-05T18:58:11Z) - Vivim: a Video Vision Mamba for Medical Video Segmentation [52.11785024350253]
本稿では、医用ビデオセグメンテーションタスクのためのビデオビジョンマンバベースのフレームワークVivimを提案する。
我々のビビムは、長期表現を様々なスケールのシーケンスに効果的に圧縮することができる。
超音波検査では甲状腺分節,乳房病変分節,大腸内視鏡検査ではポリープ分節が有効で有効であった。
論文 参考訳(メタデータ) (2024-01-25T13:27:03Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - MedSegDiff-V2: Diffusion based Medical Image Segmentation with
Transformer [53.575573940055335]
我々は、MedSegDiff-V2と呼ばれるトランスフォーマーベースの拡散フレームワークを提案する。
画像の異なる20種類の画像分割作業において,その有効性を検証する。
論文 参考訳(メタデータ) (2023-01-19T03:42:36Z) - Understanding the Tricks of Deep Learning in Medical Image Segmentation:
Challenges and Future Directions [66.40971096248946]
本稿では,モデル実装の異なるフェーズに対して,MedISegの一連のトリックを収集する。
本稿では,これらの手法の有効性を一貫したベースライン上で実験的に検討する。
私たちはまた、それぞれのコンポーネントがプラグインとプレイの利点を持つ強力なMedISegリポジトリをオープンソースにしました。
論文 参考訳(メタデータ) (2022-09-21T12:30:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。