論文の概要: Mamba Goes HoME: Hierarchical Soft Mixture-of-Experts for 3D Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2507.06363v1
- Date: Tue, 08 Jul 2025 19:57:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.375973
- Title: Mamba Goes HoME: Hierarchical Soft Mixture-of-Experts for 3D Medical Image Segmentation
- Title(参考訳): MambaがHoMEへ:3D画像分割のための階層型ソフトミキサー
- Authors: Szymon Płotka, Maciej Chrabaszcz, Gizem Mert, Ewa Szczurek, Arkadiusz Sitek,
- Abstract要約: Hierarchical Soft Mixture-of-Experts (HoME) は、効率的な長文モデリングのためのトークンルーティング層である。
Mamba State-space Model (SSM)のバックボーン上に構築されたHoMEは、スパースで適応的なエキスパートルーティングを通じてシーケンシャルなモデリングを強化する。
局所的なエキスパートルーティングとグローバルなエキスパートリファインメントを組み合わせたこの階層設計により、一般化性とセグメンテーション性能が向上する。
- 参考スコア(独自算出の注目度): 0.17975553762582286
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, artificial intelligence has significantly advanced medical image segmentation. However, challenges remain, including efficient 3D medical image processing across diverse modalities and handling data variability. In this work, we introduce Hierarchical Soft Mixture-of-Experts (HoME), a two-level token-routing layer for efficient long-context modeling, specifically designed for 3D medical image segmentation. Built on the Mamba state-space model (SSM) backbone, HoME enhances sequential modeling through sparse, adaptive expert routing. The first stage employs a Soft Mixture-of-Experts (SMoE) layer to partition input sequences into local groups, routing tokens to specialized per-group experts for localized feature extraction. The second stage aggregates these outputs via a global SMoE layer, enabling cross-group information fusion and global context refinement. This hierarchical design, combining local expert routing with global expert refinement improves generalizability and segmentation performance, surpassing state-of-the-art results across datasets from the three most commonly used 3D medical imaging modalities and data quality.
- Abstract(参考訳): 近年、人工知能は医療画像のセグメンテーションを著しく進歩させてきた。
しかし、様々なモダリティにまたがる効率的な3D医療画像処理やデータの多様性の取り扱いなど、課題は残る。
本稿では,3次元医用画像のセグメンテーションに特化して設計された,効率的な長文モデリングのための2レベルトークンルーティング層であるHyerarchical Soft Mixture-of-Experts(HoME)を紹介する。
Mamba State-space Model (SSM)のバックボーン上に構築されたHoMEは、スパースで適応的なエキスパートルーティングを通じてシーケンシャルなモデリングを強化する。
第1段階では、Soft Mixture-of-Experts (SMoE) レイヤを使用して、入力シーケンスをローカルグループに分割し、局所化された特徴抽出のためにグループごとの専門家にトークンをルーティングする。
第2段階は、これらの出力をグローバルなSMoE層を介して集約し、グループ間の情報融合とグローバルなコンテキスト改善を可能にする。
この階層的な設計は、ローカルなエキスパートルーティングとグローバルなエキスパートリファインメントを組み合わせることで、一般化性とセグメンテーションのパフォーマンスが向上し、最も一般的に使用されている3つの3D医療画像モダリティとデータ品質のデータセットの最先端結果を上回っている。
関連論文リスト
- TK-Mamba: Marrying KAN with Mamba for Text-Driven 3D Medical Image Segmentation [22.62310549476759]
3次元画像分割は臨床診断と治療に不可欠である。
CNNやTransformerのような従来の単一モダリティネットワークは、計算の非効率性と制約付きコンテキストモデリングによって制限されることが多い。
本稿では,Mamba と Kolmogorov-Arnold Networks (KAN) を長周期モデリングのための効率的なバックボーンとして活用する,新しいマルチモーダルフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-24T05:41:55Z) - Mamba Based Feature Extraction And Adaptive Multilevel Feature Fusion For 3D Tumor Segmentation From Multi-modal Medical Image [8.999013226631893]
マルチモーダルな3次元医用画像分割は、異なるモーダルの腫瘍領域を正確に同定することを目的としている。
従来の畳み込みニューラルネットワーク(CNN)ベースの手法は、グローバルな特徴を捉えるのに苦労する。
トランスフォーマーに基づく手法は,グローバルな文脈を効果的に捉えつつも,3次元医用画像のセグメンテーションにおいて高い計算コストに直面する。
論文 参考訳(メタデータ) (2025-04-30T03:29:55Z) - MRGen: Segmentation Data Engine For Underrepresented MRI Modalities [59.61465292965639]
稀ながら臨床的に重要な画像モダリティのための医用画像分割モデルの訓練は、注釈付きデータの不足により困難である。
本稿では、生成モデルを利用してトレーニングデータを合成し、未表現のモダリティに対するセグメンテーションモデルを訓練する。
論文 参考訳(メタデータ) (2024-12-04T16:34:22Z) - Improving 3D Medical Image Segmentation at Boundary Regions using Local Self-attention and Global Volume Mixing [14.0825980706386]
ボリューム・メディカル・イメージ・セグメンテーションは、与えられた3次元ボリューム・メディカル・イメージをボクセルレベルの精度で正確に分類することを目的とする医用画像解析の基本的な問題である。
本研究では,3次元医用画像セグメンテーションにおける局所的およびグローバルな依存関係を明示的に捉えることを目的とした,階層型エンコーダデコーダベースの新しいフレームワークを提案する。
提案フレームワークは,局所的なボリュームベースの自己アテンションを利用して局所的な依存関係を高解像度でエンコードし,低解像度の特徴表現でグローバルな依存関係をキャプチャする新しいボリュームミキサを導入する。
論文 参考訳(メタデータ) (2024-10-20T11:08:38Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - ShapeMamba-EM: Fine-Tuning Foundation Model with Local Shape Descriptors and Mamba Blocks for 3D EM Image Segmentation [49.42525661521625]
本稿では3次元EMセグメンテーションのための特殊微調整法であるShapeMamba-EMを提案する。
5つのセグメンテーションタスクと10のデータセットをカバーする、幅広いEMイメージでテストされている。
論文 参考訳(メタデータ) (2024-08-26T08:59:22Z) - Swin SMT: Global Sequential Modeling in 3D Medical Image Segmentation [4.915744683251151]
我々は,Swin UNETRに基づく新しいアーキテクチャであるSwin Soft Mixture Transformer (Swin SMT)を紹介する。
このモデルにはSoft Mixture-of-Experts (Soft MoE)が組み込まれており、複雑で多様な長距離依存関係を効果的に扱う。
We evaluate Swin SMT on the public available TotalSegmentator-V2 dataset, including 117 major anatomical structure in WBCT images。
論文 参考訳(メタデータ) (2024-07-10T10:05:22Z) - Discriminative Hamiltonian Variational Autoencoder for Accurate Tumor Segmentation in Data-Scarce Regimes [2.8498944632323755]
医用画像分割のためのエンドツーエンドハイブリッドアーキテクチャを提案する。
ハミルトン変分オートエンコーダ(HVAE)と識別正則化を用いて生成画像の品質を向上する。
我々のアーキテクチャはスライス・バイ・スライス・ベースで3Dボリュームを分割し、リッチな拡張データセットをカプセル化する。
論文 参考訳(メタデータ) (2024-06-17T15:42:08Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - Unpaired Multi-modal Segmentation via Knowledge Distillation [77.39798870702174]
本稿では,不対向画像分割のための新しい学習手法を提案する。
提案手法では,CTおよびMRI間での畳み込みカーネルの共有により,ネットワークパラメータを多用する。
我々は2つの多クラスセグメンテーション問題に対するアプローチを広範囲に検証した。
論文 参考訳(メタデータ) (2020-01-06T20:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。