Fugu-MT 論文翻訳(概要): InceptionMamba: Efficient Multi-Stage Feature Enhancement with Selective State Space Model for Microscopic Medical Image Segmentation

論文の概要: InceptionMamba: Efficient Multi-Stage Feature Enhancement with Selective State Space Model for Microscopic Medical Image Segmentation

arxiv url: http://arxiv.org/abs/2506.12208v1
Date: Fri, 13 Jun 2025 20:25:12 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-17 17:28:45.404967
Title: InceptionMamba: Efficient Multi-Stage Feature Enhancement with Selective State Space Model for Microscopic Medical Image Segmentation
Title（参考訳）: InceptionMamba:顕微鏡画像分割のための選択状態空間モデルによる効率的な多段階特徴強調
Authors: Daniya Najiha Abdul Kareem, Abdul Hannan, Mubashir Noman, Jean Lahoud, Mustansar Fiaz, Hisham Cholakkal,
Abstract要約: InceptionMambaという,多段階のリッチな機能をエンコードするセグメンテーションタスクのための効率的なフレームワークを提案する。我々は,低周波領域と高周波領域の両方を捕捉し,多段特徴を豊かにするためにセマンティック・キューを利用する。本モデルでは,2つの挑戦的微視的セグメンテーションデータセットに対して,最先端の性能を実現する。
参考スコア（独自算出の注目度）: 15.666926528144202
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Accurate microscopic medical image segmentation plays a crucial role in diagnosing various cancerous cells and identifying tumors. Driven by advancements in deep learning, convolutional neural networks (CNNs) and transformer-based models have been extensively studied to enhance receptive fields and improve medical image segmentation task. However, they often struggle to capture complex cellular and tissue structures in challenging scenarios such as background clutter and object overlap. Moreover, their reliance on the availability of large datasets for improved performance, along with the high computational cost, limit their practicality. To address these issues, we propose an efficient framework for the segmentation task, named InceptionMamba, which encodes multi-stage rich features and offers both performance and computational efficiency. Specifically, we exploit semantic cues to capture both low-frequency and high-frequency regions to enrich the multi-stage features to handle the blurred region boundaries (e.g., cell boundaries). These enriched features are input to a hybrid model that combines an Inception depth-wise convolution with a Mamba block, to maintain high efficiency and capture inherent variations in the scales and shapes of the regions of interest. These enriched features along with low-resolution features are fused to get the final segmentation mask. Our model achieves state-of-the-art performance on two challenging microscopic segmentation datasets (SegPC21 and GlaS) and two skin lesion segmentation datasets (ISIC2017 and ISIC2018), while reducing computational cost by about 5 times compared to the previous best performing method.
Abstract（参考訳）: 正確な顕微鏡画像分割は、様々ながん細胞の診断と腫瘍の同定において重要な役割を担っている。深層学習、畳み込みニューラルネットワーク(CNN)、トランスフォーマーベースモデルの進歩により、受容野の向上と医用画像分割タスクの改善のために、広範囲に研究されている。しかし、背景のぼやけや物体の重なりといった困難なシナリオでは、複雑な細胞や組織構造を捉えるのに苦労することが多い。さらに、パフォーマンス向上のための大規模なデータセットの可用性への依存に加えて、計算コストも高く、実用性も制限されている。これらの課題に対処するために,マルチステージリッチな特徴を符号化し,性能と計算効率の両方を提供する,InceptionMambaというセグメンテーションタスクのための効率的なフレームワークを提案する。具体的には,低周波領域と高周波領域の両方を捕捉し,多段特徴を豊かにすることにより,ぼやけた領域の境界(細胞境界など)を扱う。これらのリッチな特徴は、インセプション奥行きの畳み込みとマンバブロックを組み合わせたハイブリッドモデルに入力され、高い効率を維持し、興味のある領域のスケールと形状に固有の変化を捉える。これらのリッチな特徴と低解像度な特徴を融合させて最終セグメンテーションマスクを得る。 SegPC21 と GlaS と 2 つの皮膚病変分類データセット (ISIC2017 と ISIC2018 ) を用いて, 計算コストを従来の最高性能法に比べて約5倍削減する。

関連論文リスト

MambaCAFU: Hybrid Multi-Scale and Multi-Attention Model with Mamba-Based Fusion for Medical Image Segmentation [11.967890140626716]
本稿では,CNN,トランスフォーマー,およびMambaベースのアテンションフュージョン機構を統合した3分岐エンコーダを特徴とするハイブリッドセグメンテーションアーキテクチャを提案する。マルチスケールアテンションベースのCNNデコーダは、コンテキスト整合性を維持しつつ、きめ細かいセグメンテーションマップを再構成する。本手法は,計算量に匹敵する複雑性を維持しつつ,精度と一般化において最先端の手法より優れる。
論文参考訳（メタデータ） (2025-10-04T11:25:10Z)
SpectMamba: Integrating Frequency and State Space Models for Enhanced Medical Image Detection [11.43227481199105]
医用画像検出用に設計された最初のMambaベースのアーキテクチャであるSpectMambaを紹介する。 SpectMambaの重要なコンポーネントはHybrid Spatial-Frequency Attention (HSFA)ブロックである。 SpectMambaは様々な医用画像検出タスクにおいて効率的かつ効率的でありながら、最先端のパフォーマンスを実現していることを示す。
論文参考訳（メタデータ） (2025-09-01T02:56:45Z)
Multi-encoder nnU-Net outperforms Transformer models with self-supervised pretraining [0.0]
本研究は, 医用画像の解剖学的構造と病理的領域の自動同定と記述を含む, 医用画像セグメンテーションの課題に対処するものである。本稿では,複数のMRIモダリティを別個のエンコーダで独立に処理するために設計された,自己教師型学習用マルチエンコーダnnU-Netアーキテクチャを提案する。我々のマルチエンコーダnnU-Netは、Vanilla nnU-Net、SegResNet、Swin UNETRといった他のモデルを上回る93.72%のDice similarity Coefficient(DSC)を達成し、例外的な性能を示す。
論文参考訳（メタデータ） (2025-04-04T14:31:06Z)
MambaClinix: Hierarchical Gated Convolution and Mamba-Based U-Net for Enhanced 3D Medical Image Segmentation [6.673169053236727]
医用画像分割のための新しいU字型アーキテクチャであるMambaClinixを提案する。 MambaClinixは、階層的なゲート畳み込みネットワークとMambaを適応的なステージワイドフレームワークに統合する。以上の結果から,MambaClinixは低モデルの複雑さを維持しつつ高いセグメンテーション精度を達成できることが示唆された。
論文参考訳（メタデータ） (2024-09-19T07:51:14Z)
MSVM-UNet: Multi-Scale Vision Mamba UNet for Medical Image Segmentation [3.64388407705261]
医用画像分割のためのマルチスケールビジョンマンバUNetモデルMSVM-UNetを提案する。具体的には、VSSブロックにマルチスケールの畳み込みを導入することで、VMambaエンコーダの階層的特徴から、より効果的にマルチスケールの特徴表現をキャプチャし、集約することができる。
論文参考訳（メタデータ） (2024-08-25T06:20:28Z)
Discriminative Hamiltonian Variational Autoencoder for Accurate Tumor Segmentation in Data-Scarce Regimes [2.8498944632323755]
医用画像分割のためのエンドツーエンドハイブリッドアーキテクチャを提案する。ハミルトン変分オートエンコーダ(HVAE)と識別正則化を用いて生成画像の品質を向上する。我々のアーキテクチャはスライス・バイ・スライス・ベースで3Dボリュームを分割し、リッチな拡張データセットをカプセル化する。
論文参考訳（メタデータ） (2024-06-17T15:42:08Z)
Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文参考訳（メタデータ） (2023-12-26T12:56:31Z)
Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文参考訳（メタデータ） (2023-10-06T10:40:46Z)
3DSAM-adapter: Holistic adaptation of SAM from 2D to 3D for promptable tumor segmentation [52.699139151447945]
医用画像の領域分割を行うために, SAMを2次元から3次元に変換する新しい適応法を提案する。本モデルでは, 腎腫瘍, 膵腫瘍, 大腸癌の3つのタスクのうち8.25%, 29.87%, 10.11%の3つのタスクにおいて, ドメイン・オブ・ザ・アーティヴ・メディカル・イメージ・セグメンテーション・モデルより優れ, 肝腫瘍セグメンテーションでも同様の性能が得られる。
論文参考訳（メタデータ） (2023-06-23T12:09:52Z)
Scale-aware Super-resolution Network with Dual Affinity Learning for Lesion Segmentation from Medical Images [50.76668288066681]
低解像度医用画像から様々な大きさの病変を適応的に分割する,スケールアウェアな超解像ネットワークを提案する。提案するネットワークは,他の最先端手法と比較して一貫した改善を実現した。
論文参考訳（メタデータ） (2023-05-30T14:25:55Z)
Self-Supervised Correction Learning for Semi-Supervised Biomedical Image Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文参考訳（メタデータ） (2023-01-12T08:19:46Z)
Max-Fusion U-Net for Multi-Modal Pathology Segmentation with Attention and Dynamic Resampling [13.542898009730804]
関連するアルゴリズムの性能は、マルチモーダル情報の適切な融合によって大きく影響を受ける。 We present the Max-Fusion U-Net that achieve a improve pathology segmentation performance。マルチシーケンスCMRデータセットを併用したMyoPS(Myocardial pathology segmentation)を用いて,本手法の評価を行った。
論文参考訳（メタデータ） (2020-09-05T17:24:23Z)
DONet: Dual Objective Networks for Skin Lesion Segmentation [77.9806410198298]
本稿では,皮膚病変のセグメンテーションを改善するために,Dual Objective Networks (DONet) という,シンプルで効果的なフレームワークを提案する。我々のDONetは2つの対称デコーダを採用し、異なる目標に近づくための異なる予測を生成する。皮膚内視鏡画像における多種多様な病変のスケールと形状の課題に対処するために,再帰的コンテキスト符号化モジュール(RCEM)を提案する。
論文参考訳（メタデータ） (2020-08-19T06:02:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。