論文の概要: Graph Mamba for Efficient Whole Slide Image Understanding
- arxiv url: http://arxiv.org/abs/2505.17457v1
- Date: Fri, 23 May 2025 04:33:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.811012
- Title: Graph Mamba for Efficient Whole Slide Image Understanding
- Title(参考訳): 効率的な全スライド画像理解のためのグラフマンバ
- Authors: Jiaxuan Lu, Junyan Shi, Yuhui Lin, Fang Yan, Yue Gao, Shaoting Zhang, Xiaosong Wang,
- Abstract要約: ワイルスライド画像(WSI)は,大規模医用画像解析において重要な課題である。
本稿では,GNNのリレーショナルモデリング強度とMambaの効率性を組み合わせたWSI-GMambaフレームワークを提案する。
提案されたGMambaブロックは、Message Passing、Graph Scanning & Flattening、双方向状態空間モデルによる機能集約を統合している。
- 参考スコア(独自算出の注目度): 16.513300568934977
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Whole Slide Images (WSIs) in histopathology present a significant challenge for large-scale medical image analysis due to their high resolution, large size, and complex tile relationships. Existing Multiple Instance Learning (MIL) methods, such as Graph Neural Networks (GNNs) and Transformer-based models, face limitations in scalability and computational cost. To bridge this gap, we propose the WSI-GMamba framework, which synergistically combines the relational modeling strengths of GNNs with the efficiency of Mamba, the State Space Model designed for sequence learning. The proposed GMamba block integrates Message Passing, Graph Scanning & Flattening, and feature aggregation via a Bidirectional State Space Model (Bi-SSM), achieving Transformer-level performance with 7* fewer FLOPs. By leveraging the complementary strengths of lightweight GNNs and Mamba, the WSI-GMamba framework delivers a scalable solution for large-scale WSI analysis, offering both high accuracy and computational efficiency for slide-level classification.
- Abstract(参考訳): 病理組織学における全スライド画像(WSI)は,高分解能,大型,複雑なタイル関係のため,大規模医用画像解析において重要な課題となる。
グラフニューラルネットワーク(GNN)やトランスフォーマーベースのモデルなど、既存のMIL(Multiple Instance Learning)メソッドは、スケーラビリティと計算コストの制限に直面している。
このギャップを埋めるために、GNNのリレーショナルモデリング強度と、シーケンス学習用に設計されたステートスペースモデルであるMambaの効率を相乗的に組み合わせたWSI-GMambaフレームワークを提案する。
提案したGMambaブロックは、メッセージパッシング、グラフスキャンとフラット化、双方向状態空間モデル(Bi-SSM)による機能集約を統合し、7*より少ないFLOPでトランスフォーマーレベルのパフォーマンスを実現する。
WSI-GMambaフレームワークは、軽量GNNとMambaの相補的な長所を活用することで、大規模WSI分析のためのスケーラブルなソリューションを提供し、スライドレベルの分類に高い精度と計算効率を提供する。
関連論文リスト
- LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba [54.85262314960038]
局所的意図的マンバブロックは、大域的コンテキストと局所的詳細の両方を線形複雑性でキャプチャする。
このモデルは, 256x256の解像度で, ImageNet上の様々なモデルスケールでDiTの性能を上回り, 優れたスケーラビリティを示す。
ImageNet 256x256 と 512x512 の最先端拡散モデルと比較すると,最大 62% GFLOP の削減など,我々の最大のモデルには顕著な利点がある。
論文 参考訳(メタデータ) (2024-08-05T16:39:39Z) - Mamba-in-Mamba: Centralized Mamba-Cross-Scan in Tokenized Mamba Model for Hyperspectral Image Classification [4.389334324926174]
本研究では、このタスクにステートスペースモデル(SSM)をデプロイする最初の試みである、HSI分類のための革新的なMamba-in-Mamba(MiM)アーキテクチャを紹介する。
MiMモデルには,1)イメージをシーケンスデータに変換する新しい集中型Mamba-Cross-Scan(MCS)機構,2)Tokenized Mamba(T-Mamba)エンコーダ,3)Weighted MCS Fusion(WMF)モジュールが含まれる。
3つの公開HSIデータセットによる実験結果から,本手法は既存のベースラインや最先端アプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-05-20T13:19:02Z) - EfficientVMamba: Atrous Selective Scan for Light Weight Visual Mamba [19.062950348441426]
本研究は、軽量モデル設計における視覚状態空間モデルの可能性を探究し、EfficientVMambaと呼ばれる新しい効率的なモデル変種を導入することを提案する。
我々のEfficientVMambaは、グローバルおよびローカルの両方の表現機能を利用するように設計されたビルディングブロックを構成する効率的なスキップサンプリングにより、アトラスベースの選択的スキャン手法を統合する。
実験の結果,EfficientVMambaは計算複雑性を縮小し,様々な視覚タスクの競合結果が得られることがわかった。
論文 参考訳(メタデータ) (2024-03-15T02:48:47Z) - MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models [56.37780601189795]
本稿では,WSI分析のためのフレームワークMamMILを提案する。
私たちは各WSIを非指向グラフとして表現します。
マンバが1次元シーケンスしか処理できない問題に対処するために、トポロジ対応の走査機構を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:02:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。