Fugu-MT 論文翻訳(概要): MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models

論文の概要: MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models

arxiv url: http://arxiv.org/abs/2403.05160v1
Date: Fri, 8 Mar 2024 09:02:13 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-11 20:29:20.122561
Title: MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models
Title（参考訳）: MamMIL: 状態空間モデルによる全スライド画像の複数インスタンス学習
Authors: Zijie Fang, Yifeng Wang, Zhi Wang, Jian Zhang, Xiangyang Ji, Yongbing Zhang
Abstract要約: がん診断のゴールドスタンダードである病理診断は、TransformerとMIL(Multiple Case Learning)フレームワークを併用して、全スライド画像(WSI)を用いて、優れたパフォーマンスを実現している。選択的構造化状態空間モデル(Mamba)とMILとの協調によるWSI分類のためのMamMILフレームワークを提案する。具体的には、マンバが一方向一次元(一次元)シーケンスモデリングしか行えないという問題を解決するため、双方向状態空間モデルと2次元コンテキスト認識ブロックを革新的に導入する。
参考スコア（独自算出の注目度）: 58.39336492765728
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Recently, pathological diagnosis, the gold standard for cancer diagnosis, has achieved superior performance by combining the Transformer with the multiple instance learning (MIL) framework using whole slide images (WSIs). However, the giga-pixel nature of WSIs poses a great challenge for the quadratic-complexity self-attention mechanism in Transformer to be applied in MIL. Existing studies usually use linear attention to improve computing efficiency but inevitably bring performance bottlenecks. To tackle this challenge, we propose a MamMIL framework for WSI classification by cooperating the selective structured state space model (i.e., Mamba) with MIL for the first time, enabling the modeling of instance dependencies while maintaining linear complexity. Specifically, to solve the problem that Mamba can only conduct unidirectional one-dimensional (1D) sequence modeling, we innovatively introduce a bidirectional state space model and a 2D context-aware block to enable MamMIL to learn the bidirectional instance dependencies with 2D spatial relationships. Experiments on two datasets show that MamMIL can achieve advanced classification performance with smaller memory footprints than the state-of-the-art MIL frameworks based on the Transformer. The code will be open-sourced if accepted.
Abstract（参考訳）: 近年,がん診断のゴールドスタンダードである病理診断は,TransformerとMIL(Multiple Case Learning)フレームワークを併用し,全スライド画像(WSIs)を併用することで,優れたパフォーマンスを実現している。しかし、WSIs のギガピクセルの性質は、トランスフォーマーの二次複雑自己保持機構を MIL に適用するには大きな課題となる。既存の研究は通常、線形注意を使って計算効率を向上させるが、必然的に性能ボトルネックをもたらす。本稿では,wsi 分類のための mammil フレームワークを提案する。まず,選択的構造化状態空間モデル (mamba) と mil を初めて連携させ,線形複雑性を維持しつつインスタンス依存のモデリングを可能にする。具体的には,mambaが一方向一次元(1次元)シーケンスモデリングしか行えないという問題を解決するために,双方向状態空間モデルと2次元文脈認識ブロックを導入して,mammilが2次元空間関係を持つ双方向インスタンス依存性を学習できるようにする。 2つのデータセットの実験により、MamMILはTransformerをベースにした最先端のMILフレームワークよりもメモリフットプリントが小さい高度な分類性能を達成できることが示された。コードが受け入れられれば、オープンソース化される。

関連論文リスト

Hypergraph Mamba for Efficient Whole Slide Image Understanding [10.285000840656808]
ホイルスライド画像 (WSI) は, 超高解像度, 大規模, 複雑な空間関係のため, 医用画像解析において重要な課題となっている。本稿では,ハイパーグラフニューラルネットワーク(HGNN)の高次リレーショナルモデリング機能と状態空間モデルの線形時間逐次モデリング効率を一体化する新しいフレームワークであるWSI-HGMambaを紹介する。
論文参考訳（メタデータ） (2025-05-23T04:33:54Z)
DAMamba: Vision State Space Model with Dynamic Adaptive Scan [51.81060691414399]
状態空間モデル(SSM)は近年、コンピュータビジョンにおいて大きな注目を集めている。スキャン順序と領域を適応的に割り当てるデータ駆動型動的適応スキャン(DAS)を提案する。 DASをベースとしたビジョンバックボーンDAMambaの提案は,現在のビジョンタスクにおけるMambaモデルよりもはるかに優れている。
論文参考訳（メタデータ） (2025-02-18T08:12:47Z)
The Role of Graph-based MIL and Interventional Training in the Generalization of WSI Classifiers [8.867734798489037]
病理スライドの高解像度デジタルスキャンを含むWSI(Whole Slide Imaging)は、がん診断のゴールドスタンダードとなっている。ギガピクセルの解像度と注釈付きデータセットの不足は、ディープラーニングモデルの課題を示している。 WSI 分類のための新しいフレームワークである Graph-based Multiple Instance Learning with Interventional Training (GMIL-IT) を導入する。
論文参考訳（メタデータ） (2025-01-31T11:21:08Z)
SAM-MIL: A Spatial Contextual Aware Multiple Instance Learning Approach for Whole Slide Image Classification [9.69491390062406]
本研究では,空間的文脈認識を重視し,空間的文脈を明示的に取り入れた新しいMILフレームワークSAM-MILを提案する。提案手法は,空間的文脈に基づくグループ特徴抽出とSAM-Guided Group Masking戦略を含む。 CAMELYON-16およびTCGA肺がんデータセットの実験結果から,提案したSAM-MILモデルは,WSIs分類において既存の主流手法よりも優れていることが示された。
論文参考訳（メタデータ） (2024-07-25T01:12:48Z)
GroupMamba: Parameter-Efficient and Accurate Group Visual State Space Model [66.35608254724566]
状態空間モデル(SSM)は、二次的複雑性を伴う長距離依存のモデリングにおいて効果的な性能を示した。しかし、純粋なSSMベースのモデルは、コンピュータビジョンタスクにおける安定性と最適性能の達成に関連する課題に直面している。本稿では,コンピュータビジョンのためのSSMベースのモデルをスケールする上での課題,特に大規模モデルの不安定性と非効率性について論じる。
論文参考訳（メタデータ） (2024-07-18T17:59:58Z)
Combining Graph Neural Network and Mamba to Capture Local and Global Tissue Spatial Relationships in Whole Slide Images [1.1813933389519358]
計算病理学では、ギガピクセル全体のスライド画像(WSI)から空間的特徴を抽出することが基本的な課題である。本稿では,メッセージパッシンググラフニューラルネットワーク(GNN)と状態空間モデル(Mamba)を組み合わせて,局所的およびグローバルな空間関係を捉えるモデルを提案する。早期肺腺癌患者の無再発生存予測に有効であった。
論文参考訳（メタデータ） (2024-06-05T22:06:57Z)
Rethinking Attention-Based Multiple Instance Learning for Whole-Slide Pathological Image Classification: An Instance Attribute Viewpoint [11.09441191807822]
マルチプル・インスタンス・ラーニング (MIL) は、WSI解析のための堅牢なパラダイムである。本稿では,これらの問題に対処する属性駆動型MIL(AttriMIL)フレームワークを提案する。
論文参考訳（メタデータ） (2024-03-30T13:04:46Z)
MambaMIL: Enhancing Long Sequence Modeling with Sequence Reordering in Computational Pathology [10.933433327636918]
MIL(Multiple Instance Learning)は、WSI(Whole Slide Images)内の識別的特徴表現を計算病理学で抽出する主要なパラダイムとして登場した。本稿では,線形複雑度を持つ長周期モデリングのために,Selective Scan Space State Sequential Model(Mamba)をMIL(Multiple Instance Learning)に組み込む。提案するフレームワークは,最先端のMIL手法に対して良好に機能する。
論文参考訳（メタデータ） (2024-03-11T15:17:25Z)
Histopathology Whole Slide Image Analysis with Heterogeneous Graph Representation Learning [78.49090351193269]
本稿では,WSI分析のために,異なる種類の核間の相互関係を利用する新しいグラフベースのフレームワークを提案する。具体的には、WSI を各ノードに "nucleus-type" 属性と各エッジに類似した意味属性を持つ異種グラフとして定式化する。我々のフレームワークは、様々なタスクに対してかなりのマージンで最先端の手法より優れています。
論文参考訳（メタデータ） (2023-07-09T14:43:40Z)
Sparse Modular Activation for Efficient Sequence Modeling [94.11125833685583]
線形状態空間モデルと自己アテンション機構を組み合わせた最近のモデルでは、様々なシーケンスモデリングタスクにおいて顕著な結果が示されている。現在のアプローチでは、アテンションモジュールを静的かつ均一に入力シーケンスのすべての要素に適用し、最適以下の品質効率のトレードオフをもたらす。 SMA(Sparse Modular Activation)は,ニューラルネットワークが配列要素のサブモジュールを異なる方法でスパースに活性化する機構である。
論文参考訳（メタデータ） (2023-06-19T23:10:02Z)
Task-specific Fine-tuning via Variational Information Bottleneck for Weakly-supervised Pathology Whole Slide Image Classification [10.243293283318415]
MIL(Multiple Instance Learning)は、デジタル・パスロジー・ホール・スライド・イメージ(WSI)分類において有望な結果を示している。本稿では,Information Bottleneck 理論を動機とした効率的な WSI 微調整フレームワークを提案する。我々のフレームワークは、様々なWSIヘッド上の5つの病理WSIデータセットで評価される。
論文参考訳（メタデータ） (2023-03-15T08:41:57Z)
Hierarchical Transformer for Survival Prediction Using Multimodality Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文参考訳（メタデータ） (2022-11-29T23:47:56Z)
Multi-Scale Semantics-Guided Neural Networks for Efficient Skeleton-Based Human Action Recognition [140.18376685167857]
スケルトンに基づく行動認識には,単純なマルチスケールセマンティクス誘導ニューラルネットワークが提案されている。 MS-SGNは、NTU60、NTU120、SYSUデータセットの最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2021-11-07T03:50:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。