論文の概要: FaRMamba: Frequency-based learning and Reconstruction aided Mamba for Medical Segmentation
- arxiv url: http://arxiv.org/abs/2507.20056v1
- Date: Sat, 26 Jul 2025 20:41:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:56.779306
- Title: FaRMamba: Frequency-based learning and Reconstruction aided Mamba for Medical Segmentation
- Title(参考訳): FaRMamba:医療セグメント化のための周波数ベース学習と再建支援Mamba
- Authors: Ze Rong, ZiYue Zhao, Zhaoxin Wang, Lei Ma,
- Abstract要約: Vision Mambaは、グローバルな依存関係を効率的にモデル化するために、一次元の因果状態空間の再現を用いる。
パッチトークン化と1Dシリアライゼーションは、局所的なピクセル隣接性を阻害し、ローパスフィルタリング効果を課す。
2つの相補的なモジュールを通してLHICDと2D-SSDを明示的に扱う新しい拡張であるFaRMambaを提案する。
- 参考スコア(独自算出の注目度): 3.5790602918760586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate medical image segmentation remains challenging due to blurred lesion boundaries (LBA), loss of high-frequency details (LHD), and difficulty in modeling long-range anatomical structures (DC-LRSS). Vision Mamba employs one-dimensional causal state-space recurrence to efficiently model global dependencies, thereby substantially mitigating DC-LRSS. However, its patch tokenization and 1D serialization disrupt local pixel adjacency and impose a low-pass filtering effect, resulting in Local High-frequency Information Capture Deficiency (LHICD) and two-dimensional Spatial Structure Degradation (2D-SSD), which in turn exacerbate LBA and LHD. In this work, we propose FaRMamba, a novel extension that explicitly addresses LHICD and 2D-SSD through two complementary modules. A Multi-Scale Frequency Transform Module (MSFM) restores attenuated high-frequency cues by isolating and reconstructing multi-band spectra via wavelet, cosine, and Fourier transforms. A Self-Supervised Reconstruction Auxiliary Encoder (SSRAE) enforces pixel-level reconstruction on the shared Mamba encoder to recover full 2D spatial correlations, enhancing both fine textures and global context. Extensive evaluations on CAMUS echocardiography, MRI-based Mouse-cochlea, and Kvasir-Seg endoscopy demonstrate that FaRMamba consistently outperforms competitive CNN-Transformer hybrids and existing Mamba variants, delivering superior boundary accuracy, detail preservation, and global coherence without prohibitive computational overhead. This work provides a flexible frequency-aware framework for future segmentation models that directly mitigates core challenges in medical imaging.
- Abstract(参考訳): 正確な医用画像分割は、ぼやけた病変境界(LBA)、高周波細部(LHD)の欠如、長距離解剖学的構造(DC-LRSS)のモデル化が困難であるため、依然として困難である。
Vision Mambaは1次元の因果的状態空間の再現を利用して、グローバルな依存関係を効率的にモデル化し、DC-LRSSを大幅に緩和する。
しかし、そのパッチトークン化と1Dシリアライゼーションは、局所ピクセルの隣接性を阻害し、ローパスフィルタリング効果を課すため、局所高周波情報キャプチャ障害(LHICD)と2次元空間構造劣化(2D-SSD)が生じ、LBAとLHDが悪化する。
本研究では,2つの相補的なモジュールを通してLHICDと2D-SSDを明示的に扱う新しい拡張であるFaRMambaを提案する。
マルチスケール周波数変換モジュール(MSFM)は、ウェーブレット、コサイン、フーリエ変換を介してマルチバンドスペクトルを分離・再構成することにより減衰した高周波キューを復元する。
SSRAE(Self-Supervised Reconstruction Auxiliary Encoder)は、共有Mambaエンコーダ上でピクセルレベルの再構成を行い、完全な2次元空間相関を回復し、微細なテクスチャとグローバルなコンテキストの両方を向上する。
CAMUS心エコー図、MRIベースのマウスコクラン、Kvasir-Seg内視鏡の広範囲な評価により、FaRMambaは競争力のあるCNN-Transformerハイブリッドと既存のMamba変種を一貫して上回り、計算オーバーヘッドを抑えることなく境界精度、詳細な保存、グローバルコヒーレンスを実現している。
この研究は、将来のセグメンテーションモデルのためのフレキシブルな周波数認識フレームワークを提供し、医療画像のコア課題を直接緩和する。
関連論文リスト
- SAMba-UNet: Synergizing SAM2 and Mamba in UNet with Heterogeneous Aggregation for Cardiac MRI Segmentation [6.451534509235736]
本研究ではSAMba-UNetという,革新的なデュアルエンコーダアーキテクチャを提案する。
このフレームワークは、ビジョンファウンデーションモデルSAM2、状態空間モデルMamba、そして古典的UNetを統合することで、クロスモーダルな機能協調学習を実現する。
ACDC心MRIデータセットを用いた実験により,提案モデルがDice係数0.9103,HD95境界誤差1.0859mmを達成した。
論文 参考訳(メタデータ) (2025-05-22T06:57:03Z) - DH-Mamba: Exploring Dual-domain Hierarchical State Space Models for MRI Reconstruction [6.341065683872316]
本稿では,効率的なMRI再構成のための選択状態空間モデル(Mamba)について検討する。
マンバは通常、2D画像を行と列に沿って異なる1D配列に平坦化し、k空間のユニークなスペクトルを乱す。
既存のアプローチでは、画素レベルで画像を展開するために、多方向の長軸走査を採用しており、長距離の忘れ込みと計算負荷が高い。
論文 参考訳(メタデータ) (2025-01-14T14:41:51Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Enhanced Masked Image Modeling to Avoid Model Collapse on Multi-modal MRI Datasets [6.3467517115551875]
マスク付き画像モデリング(MIM)は、ラベルなしデータの利用において有望であることを示す。
モデル崩壊を, 完全崩壊と次元崩壊の2つのタイプで解析し, 対処する。
HMPとPBTモジュールを併用した拡張MIM(E-MIM)を構築し,マルチモーダルMRIのモデル崩壊を回避する。
論文 参考訳(メタデータ) (2024-07-15T01:11:30Z) - MMR-Mamba: Multi-Modal MRI Reconstruction with Mamba and Spatial-Frequency Information Fusion [17.084083262801737]
MMR-MambaはMRI再建のためのマルチモーダル機能を完全にかつ効率的に統合する新しいフレームワークである。
具体的には,空間領域におけるTCM(Target modality-guided Cross Mamba)モジュールの設計を行う。
次に、フーリエ領域におけるグローバル情報を効率的に統合するための選択周波数融合(SFF)モジュールを提案する。
論文 参考訳(メタデータ) (2024-06-27T07:30:54Z) - Dual Hyperspectral Mamba for Efficient Spectral Compressive Imaging [102.35787741640749]
本稿では,グローバルな長距離依存関係と局所的コンテキストの両方を探索し,効率的なHSI再構成を実現するために,DHM(Dual Hyperspectral Mamba)を提案する。
具体的には、DHMは複数の双対超スペクトルS4ブロック(DHSB)から構成され、元のHSIを復元する。
論文 参考訳(メタデータ) (2024-06-01T14:14:40Z) - Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.902047563260496]
我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。
より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。
我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文 参考訳(メタデータ) (2024-05-08T11:09:24Z) - Enhancing Retinal Vascular Structure Segmentation in Images With a Novel
Design Two-Path Interactive Fusion Module Model [6.392575673488379]
網膜血管セグメンテーションの精度を高めるために設計されたSwin-Res-Netについて紹介する。
Swin-Res-Netは、パーティショニングに変位のあるシフトウィンドウを使用するSwin Transformerを使用している。
提案したアーキテクチャは,他の公開されたモデルに適合するか,あるいは超越するかという,優れた結果をもたらす。
論文 参考訳(メタデータ) (2024-03-03T01:36:11Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - Cross-Modal Causal Intervention for Medical Report Generation [107.76649943399168]
放射線医学報告生成(RRG)は, コンピュータ支援診断と薬剤指導に不可欠である。
視覚言語的バイアスによる急激な相関により、正確な病変記述の生成は依然として困難である。
我々はCrossModal Causal Representation Learning (CMCRL)という2段階のフレームワークを提案する。
IU-XrayとMIMIC-CXRの実験により、我々のCMCRLパイプラインは最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z) - AliasNet: Alias Artefact Suppression Network for Accelerated
Phase-Encode MRI [4.752084030395196]
スパース再構成はMRIの重要な側面であり、取得時間を短縮し、空間時間分解能を改善するのに役立つ。
1D AliasNetモジュールと既存の2Dディープラーニング(DL)リカバリ技術を組み合わせることで、画像の品質が向上することが実証された。
論文 参考訳(メタデータ) (2023-02-17T13:16:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。