論文の概要: SAMA-UNet: Enhancing Medical Image Segmentation with Self-Adaptive Mamba-Like Attention and Causal-Resonance Learning
- arxiv url: http://arxiv.org/abs/2505.15234v1
- Date: Wed, 21 May 2025 08:12:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 15:42:59.216038
- Title: SAMA-UNet: Enhancing Medical Image Segmentation with Self-Adaptive Mamba-Like Attention and Causal-Resonance Learning
- Title(参考訳): SAMA-UNet:自己適応型マンバ様注意と因果共振学習による医用画像セグメンテーションの強化
- Authors: Saqib Qamar, Mohd Fazil, Parvez Ahmad, Ghulam Muhammad,
- Abstract要約: 医用画像セグメンテーションのための新しいアーキテクチャであるSAMA-UNetを紹介する。
鍵となる革新は、自己適応的マンバ様の凝集注意ブロック(SAMA)である。
MRI、CT、内視鏡画像での実験では、SAMA-UNetは現在の方法よりもセグメンテーション精度が良いことが示されている。
- 参考スコア(独自算出の注目度): 4.790894013065453
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical image segmentation plays an important role in various clinical applications, but existing models often struggle with the computational inefficiencies and challenges posed by complex medical data. State Space Sequence Models (SSMs) have demonstrated promise in modeling long-range dependencies with linear computational complexity, yet their application in medical image segmentation remains hindered by incompatibilities with image tokens and autoregressive assumptions. Moreover, it is difficult to achieve a balance in capturing both local fine-grained information and global semantic dependencies. To address these challenges, we introduce SAMA-UNet, a novel architecture for medical image segmentation. A key innovation is the Self-Adaptive Mamba-like Aggregated Attention (SAMA) block, which integrates contextual self-attention with dynamic weight modulation to prioritise the most relevant features based on local and global contexts. This approach reduces computational complexity and improves the representation of complex image features across multiple scales. We also suggest the Causal-Resonance Multi-Scale Module (CR-MSM), which enhances the flow of information between the encoder and decoder by using causal resonance learning. This mechanism allows the model to automatically adjust feature resolution and causal dependencies across scales, leading to better semantic alignment between the low-level and high-level features in U-shaped architectures. Experiments on MRI, CT, and endoscopy images show that SAMA-UNet performs better in segmentation accuracy than current methods using CNN, Transformer, and Mamba. The implementation is publicly available at GitHub.
- Abstract(参考訳): 医療画像のセグメンテーションは様々な臨床応用において重要な役割を担っているが、既存のモデルは複雑な医療データによって引き起こされる計算の非効率性と課題にしばしば苦労する。
State Space Sequence Models (SSM) は、線形計算複雑性による長距離依存関係のモデリングの可能性を実証しているが、医療画像のセグメンテーションにおけるそれらの応用は、画像トークンの不整合や自己回帰的仮定によって妨げられている。
さらに,局所的な細粒度情報とグローバルなセマンティック依存関係の両方をキャプチャする上で,バランスをとることは困難である。
これらの課題に対処するために,医療画像セグメンテーションのための新しいアーキテクチャであるSAMA-UNetを紹介する。
鍵となる革新は自己適応的マンバ様の集合的注意ブロック(SAMA)であり、これは局所的およびグローバル的文脈に基づいて最も関連性の高い特徴を優先するために、文脈的自己注意と動的重み変調を統合するものである。
このアプローチは計算複雑性を低減し、複数のスケールにわたる複雑な画像特徴の表現を改善する。
また、因果共振学習を用いてエンコーダとデコーダ間の情報の流れを向上させる因果共振マルチスケールモジュール(CR-MSM)を提案する。
このメカニズムにより、モデルは、スケールにわたる機能解決と因果依存性を自動的に調整し、U字型アーキテクチャの低レベルと高レベルの機能間のセマンティックアライメントを改善することができる。
MRI、CT、内視鏡画像での実験では、SAMA-UNetはCNN、Transformer、Mambaを用いた現在の手法よりもセグメンテーション精度が良いことが示されている。
実装はGitHubで公開されている。
関連論文リスト
- MambaCAFU: Hybrid Multi-Scale and Multi-Attention Model with Mamba-Based Fusion for Medical Image Segmentation [11.967890140626716]
本稿では,CNN,トランスフォーマー,およびMambaベースのアテンションフュージョン機構を統合した3分岐エンコーダを特徴とするハイブリッドセグメンテーションアーキテクチャを提案する。
マルチスケールアテンションベースのCNNデコーダは、コンテキスト整合性を維持しつつ、きめ細かいセグメンテーションマップを再構成する。
本手法は,計算量に匹敵する複雑性を維持しつつ,精度と一般化において最先端の手法より優れる。
論文 参考訳(メタデータ) (2025-10-04T11:25:10Z) - SpectMamba: Integrating Frequency and State Space Models for Enhanced Medical Image Detection [11.43227481199105]
医用画像検出用に設計された最初のMambaベースのアーキテクチャであるSpectMambaを紹介する。
SpectMambaの重要なコンポーネントはHybrid Spatial-Frequency Attention (HSFA)ブロックである。
SpectMambaは様々な医用画像検出タスクにおいて効率的かつ効率的でありながら、最先端のパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (2025-09-01T02:56:45Z) - DeSamba: Decoupled Spectral Adaptive Framework for 3D Multi-Sequence MRI Lesion Classification [0.6749750044497732]
DeSambaは、分離された表現を抽出し、病変分類のための空間的特徴とスペクトル的特徴を適応的に融合するように設計されたフレームワークである。
DeSambaは62.10%のTop-1精度、63.62%のF1スコア、87.71%のAUC、93.55%のTop-3精度を達成した。
論文 参考訳(メタデータ) (2025-07-21T10:42:21Z) - EAGLE: An Efficient Global Attention Lesion Segmentation Model for Hepatic Echinococcosis [31.698319244945793]
本稿では,プログレッシブ・ビジュアル・ステート・スペース(PVSS)エンコーダとハイブリッド・ビジュアル・ステート・スペース(HVSS)デコーダからなるU字型ネットワークを提案する。
Dice similarity Coefficient (DSC) は89.76%で、MSVM-UNetを1.61%上回っている。
論文 参考訳(メタデータ) (2025-06-25T11:42:05Z) - MRGen: Segmentation Data Engine for Underrepresented MRI Modalities [59.61465292965639]
稀ながら臨床的に重要な画像モダリティのための医用画像分割モデルの訓練は、注釈付きデータの不足により困難である。
本稿では,データ合成における生成モデルの利用について検討する。
本稿では,テキストプロンプトとセグメンテーションマスクを条件とした医用画像合成のためのデータエンジンMRGenを提案する。
論文 参考訳(メタデータ) (2024-12-04T16:34:22Z) - MLLA-UNet: Mamba-like Linear Attention in an Efficient U-Shape Model for Medical Image Segmentation [6.578088710294546]
従来のセグメンテーション手法は、高い解剖学的変動、ぼやけた組織の境界、低い臓器コントラスト、ノイズといった課題に対処するのに苦労する。
MLLA-UNet(Mamba-like Linear Attention UNet)を提案する。
MLLA-UNetは、FLARE22、AMOS CT、ACDCに限らず、24の異なるセグメンテーションタスクを持つ6つの挑戦的なデータセットに対して、平均88.32%の最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2024-10-31T08:54:23Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - MSVM-UNet: Multi-Scale Vision Mamba UNet for Medical Image Segmentation [3.64388407705261]
医用画像分割のためのマルチスケールビジョンマンバUNetモデルMSVM-UNetを提案する。
具体的には、VSSブロックにマルチスケールの畳み込みを導入することで、VMambaエンコーダの階層的特徴から、より効果的にマルチスケールの特徴表現をキャプチャし、集約することができる。
論文 参考訳(メタデータ) (2024-08-25T06:20:28Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Advancing Medical Image Segmentation: Morphology-Driven Learning with Diffusion Transformer [4.672688418357066]
本稿では,雑音の存在下での頑健なセグメンテーションのためのトランスフォーマー拡散(DTS)モデルを提案する。
画像の形態的表現を解析する本モデルでは, 種々の医用画像モダリティにおいて, 従来のモデルよりも良好な結果が得られた。
論文 参考訳(メタデータ) (2024-08-01T07:35:54Z) - Optimizing Universal Lesion Segmentation: State Space Model-Guided Hierarchical Networks with Feature Importance Adjustment [0.0]
我々は,MAMBAフレームワークにステートスペースモデル(SSM)とアドバンスト階層ネットワーク(AHNet)を統合したMamba-Ahnetを紹介する。
Mamba-Ahnetは、SSMの特徴抽出と理解をAHNetの注意機構と画像再構成と組み合わせ、セグメンテーションの精度と堅牢性を高めることを目的としている。
論文 参考訳(メタデータ) (2024-04-26T08:15:43Z) - VM-UNet: Vision Mamba UNet for Medical Image Segmentation [2.3876474175791302]
医用画像セグメンテーションのためのU字型アーキテクチャモデルVision Mamba UNet(VM-UNet)を提案する。
我々はISIC17,ISIC18,Synapseデータセットの総合的な実験を行い,VM-UNetが医用画像分割タスクにおいて競争力を発揮することを示す。
論文 参考訳(メタデータ) (2024-02-04T13:37:21Z) - PMFSNet: Polarized Multi-scale Feature Self-attention Network For
Lightweight Medical Image Segmentation [6.134314911212846]
現在の最先端の医用画像分割法は精度を優先するが、計算要求の増大とより大きなモデルサイズを犠牲にすることも多い。
計算冗長性を避けつつグローバルな局所特徴処理のバランスをとる新しい医用画像分割モデルPMFSNetを提案する。
長期依存関係をキャプチャするために,アテンション機構に基づいたマルチスケール機能拡張モジュールであるPMFSブロックをプラグインとして組み込んでいる。
論文 参考訳(メタデータ) (2024-01-15T10:26:47Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Breast Ultrasound Tumor Classification Using a Hybrid Multitask
CNN-Transformer Network [63.845552349914186]
胸部超音波(BUS)画像分類において,グローバルな文脈情報の収集が重要な役割を担っている。
ビジョントランスフォーマーは、グローバルなコンテキスト情報をキャプチャする能力が改善されているが、トークン化操作によって局所的なイメージパターンを歪めてしまう可能性がある。
本研究では,BUS腫瘍分類とセグメンテーションを行うハイブリッドマルチタスクディープニューラルネットワークであるHybrid-MT-ESTANを提案する。
論文 参考訳(メタデータ) (2023-08-04T01:19:32Z) - Scale-aware Test-time Click Adaptation for Pulmonary Nodule and Mass
Segmentation [35.381677272157866]
肺結節と腫瘤は肺がん検診において重要な画像像である。
深層学習に基づく医用画像のセグメンテーションの成功にもかかわらず, 病変の大きさによる堅牢な評価はいまだに困難である。
この課題に対処するために,スケールアウェアなテスト時間適応を用いたマルチスケールニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2023-07-28T16:04:34Z) - 3D Medical Image Segmentation based on multi-scale MPU-Net [5.393743755706745]
本稿では,患者のCT画像に対する腫瘍分割モデルMPU-Netを提案する。
グローバルアテンション機構を備えたTransformerにインスパイアされている。
ベンチマークモデルであるU-Netと比較して、MPU-Netは優れたセグメンテーション結果を示す。
論文 参考訳(メタデータ) (2023-07-11T20:46:19Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Site Generalization: Stroke Lesion Segmentation on Magnetic Resonance
Images from Unseen Sites [40.32385363670918]
ストロークは様々な脳血管疾患の主要な原因である。
この課題に対して深層学習に基づくモデルが提案されているが、これらのモデルを見えない場所に一般化することは困難である。
SG-Netと呼ばれるU-netベースのセグメンテーションネットワークを提案する。
論文 参考訳(メタデータ) (2022-05-09T14:33:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。