論文の概要: USEMA: a Scalable Efficient Mamba Like Attention for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2605.11131v1
- Date: Mon, 11 May 2026 18:40:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.361228
- Title: USEMA: a Scalable Efficient Mamba Like Attention for Medical Image Segmentation
- Title(参考訳): USEMA:医療画像セグメンテーションのためのスケーラブルな効率的なマンバ
- Authors: Elisha Dayag, Nhat Thanh Tran, Jack Xin,
- Abstract要約: 本稿では,畳み込みニューラルネットワーク(CNN)の局所的特徴抽出能力とSEMA注意を融合したハイブリッドUNetアーキテクチャであるUSEMAを提案する。
我々は,多種多様なモダリティと画像サイズにまたがってUSEMAを用いて実験を行い,トランスフォーマーベースモデルと比較して計算効率の向上を実証した。
- 参考スコア(独自算出の注目度): 2.0901018134712297
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate medical image segmentation is an integral part of the medical image analysis pipeline that requires the ability to merge local and global information. While vision transformers are able to capture global interactions using vanilla self-attention, their quadratic computational complexity in the input size remains a struggle for medical image segmentation tasks. Motivated by the dispersion property of vanilla self-attention and recent development of Mamba form of attention, Scalable and Efficient Mamba like Attention (SEMA) utilizes token localization via local window attention to avoid dispersion and maintain focusing, complemented by theoretically consistent arithmetic averaging to capture global aspect of attention. In this work, we present USEMA, a hybrid UNet architecture that merges the local feature extraction ability of convolutional neural networks (CNNs) with SEMA attention. We conduct experiments with USEMA across a variety of modalities and image sizes, demonstrating improved computational efficiency compared to transformer based models using full self-attention, and superior segmentation performance relative to purely convolution and Mamba-based models.
- Abstract(参考訳): 正確な医用画像セグメンテーションは、局所的な情報とグローバルな情報をマージする能力を必要とする医療用画像分析パイプラインの不可欠な部分である。
視覚変換器は、バニラ自己注意を用いてグローバルな相互作用を捉えることができるが、入力サイズにおける2次計算の複雑さは、医用画像分割タスクでは依然として困難である。
バニラ自己注意の分散特性と近年のマンバ型注意の発達により、スケーラブルで効率的なマンバ型注意(SEMA)は、局所窓の注意によるトークンの局在を利用して分散を回避し、集中を維持する。
本研究では,畳み込みニューラルネットワーク(CNN)の局所的特徴抽出能力とSEMA注意を融合したハイブリッドUNetアーキテクチャであるUSEMAを提案する。
我々はUSEMAを用いて様々なモードや画像サイズで実験を行い、完全な自己アテンションを用いたトランスフォーマーモデルと比較して計算効率が向上し、純粋な畳み込みモデルやマンバモデルと比較して優れたセグメンテーション性能を示した。
関連論文リスト
- UNet with Self-Adaptive Mamba-Like Attention and Causal-Resonance Learning for Medical Image Segmentation [2.0544282587296974]
既存のディープラーニングモデルは、効率と精度のトレードオフに直面している。
2つの重要なイノベーションを取り入れた新しいU字型アーキテクチャであるSAMA-UNetを提案する。
MRI、CT、内視鏡のデータセットの実験では、SAMA-UNetはCNN、Transformer、Mambaベースの手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2025-05-21T08:12:31Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - ASP-VMUNet: Atrous Shifted Parallel Vision Mamba U-Net for Skin Lesion Segmentation [17.88432817400751]
本稿では,新しい皮膚病変セグメンテーションフレームワークであるAtrous Shifted Parallel Vision Mamba UNet(ASP-VMUNet)を提案する。
このフレームワークは、効率よくスケーラブルなMambaアーキテクチャを統合し、従来のCNNと計算的に要求されるトランスフォーマーの制限を克服する。
4つのベンチマークデータセットでテストされたASP-VMUNetは、皮膚病変のセグメンテーションにおいて優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-03-25T08:17:22Z) - Detail Matters: Mamba-Inspired Joint Unfolding Network for Snapshot Spectral Compressive Imaging [40.80197280147993]
本研究では,HSI再建の非線形および不適切な特徴を克服するために,マンバインスパイアされたジョイント・アンフォールディング・ネットワーク(MiJUN)を提案する。
本稿では,初期最適化段階への依存を減らすために,高速化された展開ネットワーク方式を提案する。
テンソルモード-$k$展開をMambaネットワークに統合することにより,Mambaによる走査戦略を洗練する。
論文 参考訳(メタデータ) (2025-01-02T13:56:23Z) - Semi-Mamba-UNet: Pixel-Level Contrastive and Pixel-Level Cross-Supervised Visual Mamba-based UNet for Semi-Supervised Medical Image Segmentation [11.637738540262797]
本研究では,従来のCNNベースのUNetと純粋に視覚的なMambaベースのエンコーダデコーダアーキテクチャを組み込んだセミマンバUNetを,半教師付き学習フレームワークに統合する。
この革新的なSSLアプローチは、両方のネットワークを利用して擬似ラベルを生成し、ピクセルレベルで相互に相互に監督する。
本稿では,2対のプロジェクタを用いた自己教師型画素レベルのコントラスト学習戦略を導入し,特徴学習機能をさらに強化する。
論文 参考訳(メタデータ) (2024-02-11T17:09:21Z) - Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation [21.1787366866505]
Mamba-UNetは,医療画像のセグメンテーションにおいてU-Netとマンバの能力を相乗化する新しいアーキテクチャである。
Mamba-UNetは純粋にVisual Mamba(VMamba)ベースのエンコーダデコーダ構造を採用しており、ネットワークのさまざまなスケールで空間情報を保存するためにスキップ接続を注入している。
論文 参考訳(メタデータ) (2024-02-07T18:33:04Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z) - Unsupervised Bidirectional Cross-Modality Adaptation via Deeply
Synergistic Image and Feature Alignment for Medical Image Segmentation [73.84166499988443]
我々は、Synergistic Image and Feature Alignment (SIFA)と名付けられた新しい教師なしドメイン適応フレームワークを提案する。
提案するSIFAは、画像と特徴の両方の観点から、ドメインの相乗的アライメントを行う。
2つの異なるタスクに対する実験結果から,SIFA法は未ラベル対象画像のセグメンテーション性能を向上させるのに有効であることが示された。
論文 参考訳(メタデータ) (2020-02-06T13:49:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。