論文の概要: SpectMamba: Integrating Frequency and State Space Models for Enhanced Medical Image Detection
- arxiv url: http://arxiv.org/abs/2509.01080v1
- Date: Mon, 01 Sep 2025 02:56:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.530641
- Title: SpectMamba: Integrating Frequency and State Space Models for Enhanced Medical Image Detection
- Title(参考訳): SpectMamba: 医用画像検出のための周波数と状態空間モデルの統合
- Authors: Yao Wang, Dong Yang, Zhi Qiao, Wenjian Huang, Liuzhi Yang, Zhen Qian,
- Abstract要約: 医用画像検出用に設計された最初のMambaベースのアーキテクチャであるSpectMambaを紹介する。
SpectMambaの重要なコンポーネントはHybrid Spatial-Frequency Attention (HSFA)ブロックである。
SpectMambaは様々な医用画像検出タスクにおいて効率的かつ効率的でありながら、最先端のパフォーマンスを実現していることを示す。
- 参考スコア(独自算出の注目度): 11.43227481199105
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Abnormality detection in medical imaging is a critical task requiring both high efficiency and accuracy to support effective diagnosis. While convolutional neural networks (CNNs) and Transformer-based models are widely used, both face intrinsic challenges: CNNs have limited receptive fields, restricting their ability to capture broad contextual information, and Transformers encounter prohibitive computational costs when processing high-resolution medical images. Mamba, a recent innovation in natural language processing, has gained attention for its ability to process long sequences with linear complexity, offering a promising alternative. Building on this foundation, we present SpectMamba, the first Mamba-based architecture designed for medical image detection. A key component of SpectMamba is the Hybrid Spatial-Frequency Attention (HSFA) block, which separately learns high- and low-frequency features. This approach effectively mitigates the loss of high-frequency information caused by frequency bias and correlates frequency-domain features with spatial features, thereby enhancing the model's ability to capture global context. To further improve long-range dependencies, we propose the Visual State-Space Module (VSSM) and introduce a novel Hilbert Curve Scanning technique to strengthen spatial correlations and local dependencies, further optimizing the Mamba framework. Comprehensive experiments show that SpectMamba achieves state-of-the-art performance while being both effective and efficient across various medical image detection tasks.
- Abstract(参考訳): 医用画像における異常検出は、効果的な診断を支援するために、高効率と精度の両方を必要とする重要な課題である。
畳み込みニューラルネットワーク(CNN)とTransformerベースのモデルが広く使用されているが、どちらも固有の課題に直面している。
自然言語処理の最近の革新であるMambaは、線形複雑性で長いシーケンスを処理する能力に注目され、有望な代替手段を提供している。
この基盤の上に構築されたSpectMambaは、医療画像検出用に設計された最初のMambaベースのアーキテクチャである。
SpectMambaの重要なコンポーネントはHybrid Spatial-Frequency Attention (HSFA)ブロックである。
このアプローチは、周波数バイアスによる高周波情報の損失を効果的に軽減し、空間的特徴と周波数領域の特徴を相関させ、グローバルなコンテキストを捉える能力を高める。
長距離依存関係をさらに改善するために,視覚状態空間モジュール (VSSM) を提案し,空間相関と局所依存性を強化する新しいヒルベルト曲線走査技術を導入し,さらにMambaフレームワークを最適化する。
総合的な実験により、SpectMambaは様々な医用画像検出タスクにおいて効率的かつ効率的でありながら、最先端のパフォーマンスを達成することが示された。
関連論文リスト
- FAIM: Frequency-Aware Interactive Mamba for Time Series Classification [87.84511960413715]
時系列分類(TSC)は、環境モニタリング、診断、姿勢認識など、多くの実世界の応用において重要である。
本稿では,周波数対応対話型マンバモデルであるFAIMを提案する。
FAIMは既存の最先端(SOTA)手法を一貫して上回り、精度と効率のトレードオフが優れていることを示す。
論文 参考訳(メタデータ) (2025-11-26T08:36:33Z) - HyM-UNet: Synergizing Local Texture and Global Context via Hybrid CNN-Mamba Architecture for Medical Image Segmentation [3.976000861085382]
HyM-UNet は,CNN の局所的特徴抽出能力を,Mamba の効率的なグローバルモデリング能力と相乗化するために設計された。
エンコーダとデコーダのセマンティックギャップを埋めるため,Mamba-Guided Fusion Skip Connectionを提案する。
その結果,HyM-UNetはDice係数とIoUで既存の最先端手法を著しく上回ることがわかった。
論文 参考訳(メタデータ) (2025-11-22T09:02:06Z) - Versatile and Efficient Medical Image Super-Resolution Via Frequency-Gated Mamba [10.69081892501522]
本稿では,FGMambaを提案する。FGMambaは,グローバルな依存性モデリングと細部拡張を軽量アーキテクチャに統合した,周波数対応のゲート状態空間モデルである。
本研究は,スケーラブルかつ高精度な医用画像強調のための周波数認識状態空間モデリングの有効性を検証した。
論文 参考訳(メタデータ) (2025-10-31T09:12:12Z) - MambaCAFU: Hybrid Multi-Scale and Multi-Attention Model with Mamba-Based Fusion for Medical Image Segmentation [11.967890140626716]
本稿では,CNN,トランスフォーマー,およびMambaベースのアテンションフュージョン機構を統合した3分岐エンコーダを特徴とするハイブリッドセグメンテーションアーキテクチャを提案する。
マルチスケールアテンションベースのCNNデコーダは、コンテキスト整合性を維持しつつ、きめ細かいセグメンテーションマップを再構成する。
本手法は,計算量に匹敵する複雑性を維持しつつ,精度と一般化において最先端の手法より優れる。
論文 参考訳(メタデータ) (2025-10-04T11:25:10Z) - SP-Mamba: Spatial-Perception State Space Model for Unsupervised Medical Anomaly Detection [7.778573804475833]
本研究では, 空間知覚型マンバフレームワークであるSP-Mambaを紹介した。
ウィンドウスライディングのプロトタイプ学習とCircular-HilbertスキャニングベースのMambaを導入し、一貫性のある解剖学的パターンをうまく活用する。
論文 参考訳(メタデータ) (2025-07-25T08:57:38Z) - InceptionMamba: Efficient Multi-Stage Feature Enhancement with Selective State Space Model for Microscopic Medical Image Segmentation [15.666926528144202]
InceptionMambaという,多段階のリッチな機能をエンコードするセグメンテーションタスクのための効率的なフレームワークを提案する。
我々は,低周波領域と高周波領域の両方を捕捉し,多段特徴を豊かにするためにセマンティック・キューを利用する。
本モデルでは,2つの挑戦的微視的セグメンテーションデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-06-13T20:25:12Z) - Hypergraph Mamba for Efficient Whole Slide Image Understanding [10.285000840656808]
ホイルスライド画像 (WSI) は, 超高解像度, 大規模, 複雑な空間関係のため, 医用画像解析において重要な課題となっている。
本稿では,ハイパーグラフニューラルネットワーク(HGNN)の高次リレーショナルモデリング機能と状態空間モデルの線形時間逐次モデリング効率を一体化する新しいフレームワークであるWSI-HGMambaを紹介する。
論文 参考訳(メタデータ) (2025-05-23T04:33:54Z) - SAMA-UNet: Enhancing Medical Image Segmentation with Self-Adaptive Mamba-Like Attention and Causal-Resonance Learning [4.790894013065453]
医用画像セグメンテーションのための新しいアーキテクチャであるSAMA-UNetを紹介する。
鍵となる革新は、自己適応的マンバ様の凝集注意ブロック(SAMA)である。
MRI、CT、内視鏡画像での実験では、SAMA-UNetは現在の方法よりもセグメンテーション精度が良いことが示されている。
論文 参考訳(メタデータ) (2025-05-21T08:12:31Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.80423207808076]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。
マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。
HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - MambaClinix: Hierarchical Gated Convolution and Mamba-Based U-Net for Enhanced 3D Medical Image Segmentation [6.673169053236727]
医用画像分割のための新しいU字型アーキテクチャであるMambaClinixを提案する。
MambaClinixは、階層的なゲート畳み込みネットワークとMambaを適応的なステージワイドフレームワークに統合する。
以上の結果から,MambaClinixは低モデルの複雑さを維持しつつ高いセグメンテーション精度を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-09-19T07:51:14Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining [85.08169822181685]
本稿では,医療画像のセグメンテーションに特化して設計された新しいマンバモデルSwin-UMambaを紹介する。
Swin-UMamba は CNN や ViT,最新の Mamba ベースのモデルと比較して,優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-05T18:58:11Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。