論文の概要: SAMA-UNet: Enhancing Medical Image Segmentation with Self-Adaptive Mamba-Like Attention and Causal-Resonance Learning
- arxiv url: http://arxiv.org/abs/2505.15234v1
- Date: Wed, 21 May 2025 08:12:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 15:42:59.216038
- Title: SAMA-UNet: Enhancing Medical Image Segmentation with Self-Adaptive Mamba-Like Attention and Causal-Resonance Learning
- Title(参考訳): SAMA-UNet:自己適応型マンバ様注意と因果共振学習による医用画像セグメンテーションの強化
- Authors: Saqib Qamar, Mohd Fazil, Parvez Ahmad, Ghulam Muhammad,
- Abstract要約: 医用画像セグメンテーションのための新しいアーキテクチャであるSAMA-UNetを紹介する。
鍵となる革新は、自己適応的マンバ様の凝集注意ブロック(SAMA)である。
MRI、CT、内視鏡画像での実験では、SAMA-UNetは現在の方法よりもセグメンテーション精度が良いことが示されている。
- 参考スコア(独自算出の注目度): 4.790894013065453
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical image segmentation plays an important role in various clinical applications, but existing models often struggle with the computational inefficiencies and challenges posed by complex medical data. State Space Sequence Models (SSMs) have demonstrated promise in modeling long-range dependencies with linear computational complexity, yet their application in medical image segmentation remains hindered by incompatibilities with image tokens and autoregressive assumptions. Moreover, it is difficult to achieve a balance in capturing both local fine-grained information and global semantic dependencies. To address these challenges, we introduce SAMA-UNet, a novel architecture for medical image segmentation. A key innovation is the Self-Adaptive Mamba-like Aggregated Attention (SAMA) block, which integrates contextual self-attention with dynamic weight modulation to prioritise the most relevant features based on local and global contexts. This approach reduces computational complexity and improves the representation of complex image features across multiple scales. We also suggest the Causal-Resonance Multi-Scale Module (CR-MSM), which enhances the flow of information between the encoder and decoder by using causal resonance learning. This mechanism allows the model to automatically adjust feature resolution and causal dependencies across scales, leading to better semantic alignment between the low-level and high-level features in U-shaped architectures. Experiments on MRI, CT, and endoscopy images show that SAMA-UNet performs better in segmentation accuracy than current methods using CNN, Transformer, and Mamba. The implementation is publicly available at GitHub.
- Abstract(参考訳): 医療画像のセグメンテーションは様々な臨床応用において重要な役割を担っているが、既存のモデルは複雑な医療データによって引き起こされる計算の非効率性と課題にしばしば苦労する。
State Space Sequence Models (SSM) は、線形計算複雑性による長距離依存関係のモデリングの可能性を実証しているが、医療画像のセグメンテーションにおけるそれらの応用は、画像トークンの不整合や自己回帰的仮定によって妨げられている。
さらに,局所的な細粒度情報とグローバルなセマンティック依存関係の両方をキャプチャする上で,バランスをとることは困難である。
これらの課題に対処するために,医療画像セグメンテーションのための新しいアーキテクチャであるSAMA-UNetを紹介する。
鍵となる革新は自己適応的マンバ様の集合的注意ブロック(SAMA)であり、これは局所的およびグローバル的文脈に基づいて最も関連性の高い特徴を優先するために、文脈的自己注意と動的重み変調を統合するものである。
このアプローチは計算複雑性を低減し、複数のスケールにわたる複雑な画像特徴の表現を改善する。
また、因果共振学習を用いてエンコーダとデコーダ間の情報の流れを向上させる因果共振マルチスケールモジュール(CR-MSM)を提案する。
このメカニズムにより、モデルは、スケールにわたる機能解決と因果依存性を自動的に調整し、U字型アーキテクチャの低レベルと高レベルの機能間のセマンティックアライメントを改善することができる。
MRI、CT、内視鏡画像での実験では、SAMA-UNetはCNN、Transformer、Mambaを用いた現在の手法よりもセグメンテーション精度が良いことが示されている。
実装はGitHubで公開されている。
関連論文リスト
- MLLA-UNet: Mamba-like Linear Attention in an Efficient U-Shape Model for Medical Image Segmentation [6.578088710294546]
従来のセグメンテーション手法は、高い解剖学的変動、ぼやけた組織の境界、低い臓器コントラスト、ノイズといった課題に対処するのに苦労する。
MLLA-UNet(Mamba-like Linear Attention UNet)を提案する。
MLLA-UNetは、FLARE22、AMOS CT、ACDCに限らず、24の異なるセグメンテーションタスクを持つ6つの挑戦的なデータセットに対して、平均88.32%の最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2024-10-31T08:54:23Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - MSVM-UNet: Multi-Scale Vision Mamba UNet for Medical Image Segmentation [3.64388407705261]
医用画像分割のためのマルチスケールビジョンマンバUNetモデルMSVM-UNetを提案する。
具体的には、VSSブロックにマルチスケールの畳み込みを導入することで、VMambaエンコーダの階層的特徴から、より効果的にマルチスケールの特徴表現をキャプチャし、集約することができる。
論文 参考訳(メタデータ) (2024-08-25T06:20:28Z) - Advancing Medical Image Segmentation: Morphology-Driven Learning with Diffusion Transformer [4.672688418357066]
本稿では,雑音の存在下での頑健なセグメンテーションのためのトランスフォーマー拡散(DTS)モデルを提案する。
画像の形態的表現を解析する本モデルでは, 種々の医用画像モダリティにおいて, 従来のモデルよりも良好な結果が得られた。
論文 参考訳(メタデータ) (2024-08-01T07:35:54Z) - VM-UNet: Vision Mamba UNet for Medical Image Segmentation [2.3876474175791302]
医用画像セグメンテーションのためのU字型アーキテクチャモデルVision Mamba UNet(VM-UNet)を提案する。
我々はISIC17,ISIC18,Synapseデータセットの総合的な実験を行い,VM-UNetが医用画像分割タスクにおいて競争力を発揮することを示す。
論文 参考訳(メタデータ) (2024-02-04T13:37:21Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。