論文の概要: TopoMamba: Topology-Aware Scanning and Fusion for Segmenting Heterogeneous Medical Visual Media
- arxiv url: http://arxiv.org/abs/2604.25545v1
- Date: Tue, 28 Apr 2026 12:11:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.845354
- Title: TopoMamba: Topology-Aware Scanning and Fusion for Segmenting Heterogeneous Medical Visual Media
- Title(参考訳): TopoMamba:異種医用医用画像メディアのトポロジカルスキャンと融合
- Authors: Fuchen Zheng, Chengpei Xu, Long Ma, Weixuan Li, Junhua Zhou, Xuhang Chen, Weihuang Liu, Haolun Li, Quanjun Li, Zhenxi Zhang, Lei Zhao, Chi-Man Pun, Shoujun Zhou,
- Abstract要約: TopoMambaは、異質な医用ビジュアルメディアをセグメント化するためのトポロジー対応のスキャン・アンド・フューズフレームワークである。
TopoMambaは、強力なCNN、Transformer、SSMベースラインよりもセグメンテーション品質を一貫して改善することを示す。
- 参考スコア(独自算出の注目度): 36.26611641287451
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual state-space models (SSMs) have shown strong potential for medical image segmentation, yet their effectiveness is often limited by two practical issues: axis-biased scan ordering weakens the modeling of oblique and curved structures, and naive multi-branch fusion tends to amplify redundant responses. We present TopoMamba, a topology-aware scan-and-fuse framework for segmenting heterogeneous medical visual media. The method combines a diagonal/anti-diagonal TopoA-Scan branch with the standard Cross-Scan branch to provide complementary structural priors, and introduces ScanCache, a device-aware caching mechanism that amortizes explicit scan-index construction across recurring resolutions. To fuse heterogeneous scan features efficiently, we further propose a lightweight HSIC Gate that regulates branch interaction using a dependence-aware scalar gating rule. We also instantiate a volumetric TopoMamba-3D for practical 3D clinical segmentation. Experiments on Synapse CT, ISIC 2017 dermoscopy, and CVC-ClinicDB endoscopy show that TopoMamba consistently improves segmentation quality over strong CNN, Transformer, and SSM baselines, with particularly clear gains on thin or curved targets such as the pancreas and gallbladder, while maintaining favorable deployment efficiency under dynamic input resolutions. These results suggest that topology-aware scan ordering and lightweight dependence-aware fusion form an effective and practical design for medical multimedia segmentation. The code will be made publicly available.
- Abstract(参考訳): 視覚的状態空間モデル(SSM)は、医用画像のセグメンテーションに強い可能性を示しているが、その有効性は2つの実践的な問題によって制限されている: 軸バイアススキャン順序付けは斜めと湾曲構造のモデリングを弱め、単純多分岐融合は冗長な応答を増幅する傾向がある。
TopoMambaは、異種医用画像メディアをセグメント化するためのトポロジー対応スキャン・アンド・フューズ・フレームワークである。
この方法は、対角線/対角線TopoA-Scanブランチと標準のクロススキャンブランチを組み合わせることで、補完的な構造上の事前情報を提供する。
ヘテロジニアススキャン機能を効率よく融合させるために,従属型スカラーゲーティングルールを用いて分岐相互作用を制御する軽量HSICゲートを提案する。
また,3次元クリニカルセグメンテーションのためのボリューム型TopoMamba-3Dのインスタンス化も行った。
Synapse CT, ISIC 2017 dermoscopy, CVC-ClinicDB endoscopy による実験では,TopoMamba は強いCNN, Transformer, SSM ベースラインよりもセグメンテーション品質を一貫して改善し,特に膵臓や胆嚢などの薄いあるいは湾曲したターゲットでは顕著に向上し, 動的入力解像度下でのデプロイメント効率は良好である。
以上の結果から,トポロジカルスキャンの順序付けと軽度依存型融合が医療マルチメディアセグメンテーションに有効かつ実用的な設計となっていることが示唆された。
コードは公開されます。
関連論文リスト
- MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models [59.180043227905294]
MedPrunerは、3次元医用画像の効率的な理解のためのトレーニング不要でモデルに依存しない階層的トークンプレーニングフレームワークである。
我々は、MedPrunerによって、MedGemmaのようなモデルが元の性能を維持したり、超えたりすることが可能であり、ビジュアルトークンの5%以下を維持していることを示す。
論文 参考訳(メタデータ) (2026-03-12T07:37:00Z) - TGC-Net: A Structure-Aware and Semantically-Aligned Framework for Text-Guided Medical Image Segmentation [56.09179939570486]
本稿では,パラメータ効率,タスク固有適応に着目したCLIPベースのフレームワークであるTGC-Netを提案する。
TGC-Netは、挑戦的なベンチマークで顕著なDiceゲインを含む、トレーニング可能なパラメータをかなり少なくして、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-12-24T12:06:26Z) - MOSAIC: A Multi-View 2.5D Organ Slice Selector with Cross-Attentional Reasoning for Anatomically-Aware CT Localization in Medical Organ Segmentation [0.8747606955991707]
既存の3Dセグメンテーションアプローチは計算的かつメモリ集約的であり、多くの場合、多くの解剖学的に無関係なスライスを含む全ボリュームを処理する。
セグメント化に先立って入力量を削減できる新しい解剖学的スライスセレクタパイプラインを提案する。
提案モデルでは, 構造的関連性の高いスライスを選択的に保持する多視点表現を前提として, 解剖学的局所化の「専門家」として機能する。
論文 参考訳(メタデータ) (2025-05-15T19:32:28Z) - A Novel Hybrid Approach for Retinal Vessel Segmentation with Dynamic Long-Range Dependency and Multi-Scale Retinal Edge Fusion Enhancement [0.3611754783778107]
既存の方法は、マルチスケールの船の変動性、複雑な曲率、曖昧な境界といった課題に対処する。
本稿では,CNNとMambaを相乗的に統合した新しいハイブリッドフレームワークを提案する。
本手法は血管の連続性維持と低コントラスト領域の血管の分断を効果的に行う上で,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-04-18T08:41:35Z) - ATM-Net: Anatomy-Aware Text-Guided Multi-Modal Fusion for Fine-Grained Lumbar Spine Segmentation [38.04249138515548]
ATM-Netは, 解剖学的, テキスト誘導, マルチモーダル融合機構を用いて, 腰椎部分構造のきめ細かなセグメンテーションを行う, 革新的なフレームワークである。
ATM-Net は SPIDER の 9.91 ピクセルの 79.39% と HD95 を達成し、競合する SpineParseNet をそれぞれ 8.31% と 4.14 ピクセルで上回っている。
論文 参考訳(メタデータ) (2025-04-04T14:36:12Z) - Prototype Learning Guided Hybrid Network for Breast Tumor Segmentation in DCE-MRI [58.809276442508256]
本稿では,畳み込みニューラルネットワーク(CNN)とトランスフォーマー層を組み合わせたハイブリッドネットワークを提案する。
プライベートおよびパブリックなDCE-MRIデータセットの実験結果から,提案したハイブリッドネットワークは最先端の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-11T15:46:00Z) - SliceMamba with Neural Architecture Search for Medical Image Segmentation [13.837666496926351]
SliceMambaは,シンプルで効果的なマンバ型医用画像分割モデルである。
SliceMambaには、双方向機能スライシングを行う効率的な双方向スライススキャンモジュール(BSS)が含まれている。
また,対象データの特徴に基づいて最適な特徴スライス法を自動決定する適応スライス探索手法を提案する。
論文 参考訳(メタデータ) (2024-07-11T13:13:31Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z) - RetiFluidNet: A Self-Adaptive and Multi-Attention Deep Convolutional
Network for Retinal OCT Fluid Segmentation [3.57686754209902]
OCTガイド下治療には網膜液の定量化が必要である。
RetiFluidNetと呼ばれる新しい畳み込みニューラルアーキテクチャは、多クラス網膜流体セグメンテーションのために提案されている。
モデルは、テクスチャ、コンテキスト、エッジといった特徴の階層的な表現学習の恩恵を受ける。
論文 参考訳(メタデータ) (2022-09-26T07:18:00Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。