論文の概要: MambaMIL+: Modeling Long-Term Contextual Patterns for Gigapixel Whole Slide Image
- arxiv url: http://arxiv.org/abs/2512.17726v1
- Date: Fri, 19 Dec 2025 16:01:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.473656
- Title: MambaMIL+: Modeling Long-Term Contextual Patterns for Gigapixel Whole Slide Image
- Title(参考訳): MambaMIL+:ギガピクセル全スライド画像の長期パターンモデリング
- Authors: Qian Zeng, Yihui Wang, Shu Yang, Yingxue Xu, Fengtao Zhou, Jiabo Ma, Dejia Cai, Zhengyu Zhang, Lijuan Qu, Yu Wang, Li Liang, Hao Chen,
- Abstract要約: 多重インスタンス学習(MIL)は、各WSIをパッチレベルのインスタンスの袋として扱うことでソリューションを提供する。
Mambaは長いシーケンス学習のための有望な代替手段として登場し、数千のトークンに線形にスケーリングしている。
長距離依存性モデリングを維持しながら空間コンテキストを明示的に統合する新しいMILフレームワークであるMambaMIL+を提案する。
- 参考スコア(独自算出の注目度): 24.093388981091717
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Whole-slide images (WSIs) are an important data modality in computational pathology, yet their gigapixel resolution and lack of fine-grained annotations challenge conventional deep learning models. Multiple instance learning (MIL) offers a solution by treating each WSI as a bag of patch-level instances, but effectively modeling ultra-long sequences with rich spatial context remains difficult. Recently, Mamba has emerged as a promising alternative for long sequence learning, scaling linearly to thousands of tokens. However, despite its efficiency, it still suffers from limited spatial context modeling and memory decay, constraining its effectiveness to WSI analysis. To address these limitations, we propose MambaMIL+, a new MIL framework that explicitly integrates spatial context while maintaining long-range dependency modeling without memory forgetting. Specifically, MambaMIL+ introduces 1) overlapping scanning, which restructures the patch sequence to embed spatial continuity and instance correlations; 2) a selective stripe position encoder (S2PE) that encodes positional information while mitigating the biases of fixed scanning orders; and 3) a contextual token selection (CTS) mechanism, which leverages supervisory knowledge to dynamically enlarge the contextual memory for stable long-range modeling. Extensive experiments on 20 benchmarks across diagnostic classification, molecular prediction, and survival analysis demonstrate that MambaMIL+ consistently achieves state-of-the-art performance under three feature extractors (ResNet-50, PLIP, and CONCH), highlighting its effectiveness and robustness for large-scale computational pathology
- Abstract(参考訳): WSI(Whole-Slide Image)は、計算病理学において重要なデータモダリティであるが、そのギガピクセルの解像度と細かいアノテーションの欠如は、従来のディープラーニングモデルに挑戦する。
多重インスタンス学習(MIL)は、各WSIをパッチレベルのインスタンスの袋として扱うことでソリューションを提供するが、空間コンテキストが豊富な超長いシーケンスを効果的にモデル化することは困難である。
最近、Mambaは長いシーケンス学習のための有望な代替手段として現れ、数千のトークンに線形にスケールしている。
しかし、その効率性にもかかわらず、その効果をWSI分析に限定して、空間的コンテキストモデリングとメモリ崩壊に悩まされている。
これらの制約に対処するため、メモリを忘れずに長距離依存性モデリングを維持しながら空間コンテキストを明示的に統合する新しいMILフレームワークであるMambaMIL+を提案する。
具体的には、MambaMIL+が紹介される
1) 重複走査は,空間連続性とインスタンス相関を埋め込むためにパッチシーケンスを再構成する。
2 固定走査順序のバイアスを緩和しつつ位置情報を符号化する選択的ストライプ位置エンコーダ(S2PE)
3) コンテクスト・トークン・セレクション(CTS)機構は,コンテクスト・メモリを動的に拡張し,安定な長距離モデリングを実現する。
診断分類、分子予測、生存分析を含む20のベンチマークの大規模な実験により、MambaMIL+は3つの特徴抽出器(ResNet-50、PLIP、CONCH)の下で一貫して最先端の性能を達成し、大規模計算病理学におけるその有効性と堅牢性を強調した。
関連論文リスト
- TSkel-Mamba: Temporal Dynamic Modeling via State Space Model for Human Skeleton-based Action Recognition [59.99922360648663]
TSkel-Mambaは、空間力学と時間力学の両方を効果的に捉えるハイブリッドトランスフォーマー-Mambaフレームワークである。
MTIモジュールはマルチスケールのCycle演算子を使用して、チャネル間の時間的相互作用をキャプチャする。
論文 参考訳(メタデータ) (2025-12-12T11:55:16Z) - Hypergraph Mamba for Efficient Whole Slide Image Understanding [10.285000840656808]
ホイルスライド画像 (WSI) は, 超高解像度, 大規模, 複雑な空間関係のため, 医用画像解析において重要な課題となっている。
本稿では,ハイパーグラフニューラルネットワーク(HGNN)の高次リレーショナルモデリング機能と状態空間モデルの線形時間逐次モデリング効率を一体化する新しいフレームワークであるWSI-HGMambaを紹介する。
論文 参考訳(メタデータ) (2025-05-23T04:33:54Z) - Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.80423207808076]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。
マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。
HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - Mamba2MIL: State Space Duality Based Multiple Instance Learning for Computational Pathology [17.329498427735565]
本稿では,Mamba2MILと呼ばれる新しいマルチインスタンス学習フレームワークを提案する。
Mamba2MILは順序関係と順序に依存しない特徴を利用しており、配列情報の最適部分の利用をもたらす。
私たちは、複数のデータセットにまたがって広範な実験を行い、ほぼすべてのパフォーマンス指標の改善を実現しています。
論文 参考訳(メタデータ) (2024-08-27T13:01:19Z) - MambaMIL: Enhancing Long Sequence Modeling with Sequence Reordering in
Computational Pathology [10.933433327636918]
MIL(Multiple Instance Learning)は、WSI(Whole Slide Images)内の識別的特徴表現を計算病理学で抽出する主要なパラダイムとして登場した。
本稿では,線形複雑度を持つ長周期モデリングのために,Selective Scan Space State Sequential Model(Mamba)をMIL(Multiple Instance Learning)に組み込む。
提案するフレームワークは,最先端のMIL手法に対して良好に機能する。
論文 参考訳(メタデータ) (2024-03-11T15:17:25Z) - MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models [56.37780601189795]
本稿では,WSI分析のためのフレームワークMamMILを提案する。
私たちは各WSIを非指向グラフとして表現します。
マンバが1次元シーケンスしか処理できない問題に対処するために、トポロジ対応の走査機構を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:02:13Z) - Hierarchical Transformer for Survival Prediction Using Multimodality
Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。
本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。
より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文 参考訳(メタデータ) (2022-11-29T23:47:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。