論文の概要: MambaCAFU: Hybrid Multi-Scale and Multi-Attention Model with Mamba-Based Fusion for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2510.03786v1
- Date: Sat, 04 Oct 2025 11:25:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.253828
- Title: MambaCAFU: Hybrid Multi-Scale and Multi-Attention Model with Mamba-Based Fusion for Medical Image Segmentation
- Title(参考訳): MambaCAFU:医療画像分割のためのMamba-based Fusionを用いたハイブリッドマルチスケール・マルチアテンションモデル
- Authors: T-Mai Bui, Fares Bougourzi, Fadi Dornaika, Vinh Truong Hoang,
- Abstract要約: 本稿では,CNN,トランスフォーマー,およびMambaベースのアテンションフュージョン機構を統合した3分岐エンコーダを特徴とするハイブリッドセグメンテーションアーキテクチャを提案する。
マルチスケールアテンションベースのCNNデコーダは、コンテキスト整合性を維持しつつ、きめ細かいセグメンテーションマップを再構成する。
本手法は,計算量に匹敵する複雑性を維持しつつ,精度と一般化において最先端の手法より優れる。
- 参考スコア(独自算出の注目度): 11.967890140626716
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In recent years, deep learning has shown near-expert performance in segmenting complex medical tissues and tumors. However, existing models are often task-specific, with performance varying across modalities and anatomical regions. Balancing model complexity and performance remains challenging, particularly in clinical settings where both accuracy and efficiency are critical. To address these issues, we propose a hybrid segmentation architecture featuring a three-branch encoder that integrates CNNs, Transformers, and a Mamba-based Attention Fusion (MAF) mechanism to capture local, global, and long-range dependencies. A multi-scale attention-based CNN decoder reconstructs fine-grained segmentation maps while preserving contextual consistency. Additionally, a co-attention gate enhances feature selection by emphasizing relevant spatial and semantic information across scales during both encoding and decoding, improving feature interaction and cross-scale communication. Extensive experiments on multiple benchmark datasets show that our approach outperforms state-of-the-art methods in accuracy and generalization, while maintaining comparable computational complexity. By effectively balancing efficiency and effectiveness, our architecture offers a practical and scalable solution for diverse medical imaging tasks. Source code and trained models will be publicly released upon acceptance to support reproducibility and further research.
- Abstract(参考訳): 近年、深層学習は、複雑な医療組織や腫瘍の分節化において、ほぼ専門的な性能を示している。
しかし、既存のモデルはタスク固有のものが多く、性能はモジュラリティや解剖学的領域によって異なる。
モデルの複雑さとパフォーマンスのバランスをとることは、特に正確性と効率性の両方が重要である臨床環境では、依然として困難である。
これらの問題に対処するために,CNN,トランスフォーマー,およびMambaベースのアテンションフュージョン(MAF)機構を統合した3分岐エンコーダと,ローカル,グローバル,長距離の依存関係をキャプチャするハイブリッドセグメンテーションアーキテクチャを提案する。
マルチスケールアテンションベースのCNNデコーダは、コンテキスト整合性を維持しつつ、きめ細かいセグメンテーションマップを再構成する。
さらに、コアテンションゲートは、エンコーディングとデコードの両方において、関連する空間的および意味的な情報をスケールにわたって強調することにより、特徴選択を強化する。
複数のベンチマークデータセットに対する大規模な実験により、我々の手法は精度と一般化において最先端の手法よりも優れており、計算複雑性は同等であることがわかった。
効率性と効率性を効果的にバランスさせることで、我々のアーキテクチャは多様な医療画像タスクに対して実用的でスケーラブルなソリューションを提供する。
ソースコードとトレーニングされたモデルは、再現性とさらなる研究をサポートするために、受諾時に公開される。
関連論文リスト
- SpectMamba: Integrating Frequency and State Space Models for Enhanced Medical Image Detection [11.43227481199105]
医用画像検出用に設計された最初のMambaベースのアーキテクチャであるSpectMambaを紹介する。
SpectMambaの重要なコンポーネントはHybrid Spatial-Frequency Attention (HSFA)ブロックである。
SpectMambaは様々な医用画像検出タスクにおいて効率的かつ効率的でありながら、最先端のパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (2025-09-01T02:56:45Z) - MS-UMamba: An Improved Vision Mamba Unet for Fetal Abdominal Medical Image Segmentation [1.2721397985664153]
胎児超音波画像分割のためのハイブリッド・コンボリューション・マンバモデルであるMS-UMambaを提案する。
具体的には,マンバのグローバルなモデリング強度を利用するCNNブランチと統合された視覚状態空間ブロックを設計する。
また,異なる層からの特徴情報を統合した効率的なマルチスケール機能融合モジュールを提案する。
論文 参考訳(メタデータ) (2025-06-14T10:34:10Z) - InceptionMamba: Efficient Multi-Stage Feature Enhancement with Selective State Space Model for Microscopic Medical Image Segmentation [15.666926528144202]
InceptionMambaという,多段階のリッチな機能をエンコードするセグメンテーションタスクのための効率的なフレームワークを提案する。
我々は,低周波領域と高周波領域の両方を捕捉し,多段特徴を豊かにするためにセマンティック・キューを利用する。
本モデルでは,2つの挑戦的微視的セグメンテーションデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-06-13T20:25:12Z) - An Efficient and Mixed Heterogeneous Model for Image Restoration [71.85124734060665]
現在の主流のアプローチは、CNN、Transformers、Mambasの3つのアーキテクチャパラダイムに基づいている。
混合構造融合に基づく効率的で汎用的なIRモデルであるRestorMixerを提案する。
論文 参考訳(メタデータ) (2025-04-15T08:19:12Z) - Rethinking the Nested U-Net Approach: Enhancing Biomarker Segmentation with Attention Mechanisms and Multiscale Feature Fusion [2.0799865428691393]
マルチスケール・フィーチャー・フュージョンとアテンション・メカニズムを通じて、ローカルとグローバルの両方のコンテキストをキャプチャするネストされたUNetアーキテクチャを導入する。
この設計では、エンコーダからの機能統合を改善し、キーチャネルとリージョンを強調し、空間の詳細を復元してセグメンテーション性能を向上させる。
論文 参考訳(メタデータ) (2025-04-08T15:53:46Z) - MambaClinix: Hierarchical Gated Convolution and Mamba-Based U-Net for Enhanced 3D Medical Image Segmentation [6.673169053236727]
医用画像分割のための新しいU字型アーキテクチャであるMambaClinixを提案する。
MambaClinixは、階層的なゲート畳み込みネットワークとMambaを適応的なステージワイドフレームワークに統合する。
以上の結果から,MambaClinixは低モデルの複雑さを維持しつつ高いセグメンテーション精度を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-09-19T07:51:14Z) - Real-Time Image Segmentation via Hybrid Convolutional-Transformer Architecture Search [51.89707241449435]
本稿では,高分解能表現CNNにマルチヘッド自己認識を効率よく組み込むという課題に対処する。
本稿では,高解像度機能の利点をフル活用したマルチターゲットマルチブランチ・スーパーネット手法を提案する。
本稿では,Hybrid Convolutional-Transformer Architecture Search (HyCTAS)法を用いて,軽量畳み込み層とメモリ効率のよい自己保持層を最適に組み合わせたモデルを提案する。
論文 参考訳(メタデータ) (2024-03-15T15:47:54Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。