論文の概要: WSD-MIL: Window Scale Decay Multiple Instance Learning for Whole Slide Image Classification
- arxiv url: http://arxiv.org/abs/2512.19982v1
- Date: Tue, 23 Dec 2025 02:10:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.712832
- Title: WSD-MIL: Window Scale Decay Multiple Instance Learning for Whole Slide Image Classification
- Title(参考訳): WSD-MIL:全スライド画像分類のためのマルチインスタンス学習
- Authors: Le Feng, Li Xiao,
- Abstract要約: ウィンドウスケール崩壊MIL (WSD-MIL) は、様々なスケールの腫瘍領域をモデル化する能力を高めるために設計された。
WSD-MIL は CAMELYON16 と TCGA-BRCA のデータセット上での最先端のパフォーマンスを実現し、計算メモリの 62% を削減した。
- 参考スコア(独自算出の注目度): 2.760935655675299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, the integration of pre-trained foundational models with multiple instance learning (MIL) has improved diagnostic accuracy in computational pathology. However, existing MIL methods focus on optimizing feature extractors and aggregation strategies while overlooking the complex semantic relationships among instances within whole slide image (WSI). Although Transformer-based MIL approaches aiming to model instance dependencies, the quadratic computational complexity limits their scalability to large-scale WSIs. Moreover, due to the pronounced variations in tumor region scales across different WSIs, existing Transformer-based methods employing fixed-scale attention mechanisms face significant challenges in precisely capturing local instance correlations and fail to account for the distance-based decay effect of patch relevance. To address these challenges, we propose window scale decay MIL (WSD-MIL), designed to enhance the capacity to model tumor regions of varying scales while improving computational efficiency. WSD-MIL comprises: 1) a window scale decay based attention module, which employs a cluster-based sampling strategy to reduce computational costs while progressively decaying attention window-scale to capture local instance relationships at varying scales; and 2) a squeeze-and-excitation based region gate module, which dynamically adjusts window weights to enhance global information modeling. Experimental results demonstrate that WSD-MIL achieves state-of-the-art performance on the CAMELYON16 and TCGA-BRCA datasets while reducing 62% of the computational memory. The code will be publicly available.
- Abstract(参考訳): 近年,MIL(Multiple Case Learning)と事前学習した基礎モデルの統合により,計算病理学における診断精度が向上している。
しかし、既存のMIL手法は、スライド画像全体(WSI)内のインスタンス間の複雑な意味関係を見越しながら、特徴抽出器と集約戦略の最適化に重点を置いている。
TransformerベースのMILアプローチは、インスタンス依存をモデル化することを目的としているが、二次計算の複雑さはスケーラビリティを大規模WSIに制限している。
さらに,WSI間の腫瘍領域のスケールの変動が顕著であることから,固定スケールの注意機構を用いたTransformerベースの既存手法は,局所的なインスタンス相関を正確に把握する上で重大な課題に直面し,パッチ関連性による距離ベース崩壊の影響を考慮できない。
これらの課題に対処するため、我々は、様々なスケールの腫瘍領域をモデル化し、計算効率を向上させるために、ウィンドウスケール崩壊MIL(WSD-MIL)を提案する。
WSD-MIL は:
1)ウィンドウスケールの減衰に基づくアテンションモジュールで、クラスタベースのサンプリング戦略を用いて計算コストを削減しつつ、徐々にアテンションスケールを低下させ、様々なスケールでローカルインスタンスの関係を捉えている。
2) ウィンドウ重みを動的に調整し,グローバルな情報モデリングを強化した圧縮励起型領域ゲートモジュール。
実験結果から,WSD-MILはCAMELYON16およびTCGA-BRCAデータセット上での最先端性能を実現し,計算メモリの62%を削減した。
コードは公開されます。
関連論文リスト
- Fourier Transform Multiple Instance Learning for Whole Slide Image Classification [13.494732719425159]
Whole Slide Image (WSI)分類は、空間パッチ機能を備えたMIL(Multiple Instance Learning)に依存している。
本稿では、MILを周波数領域の分岐で拡張し、コンパクトなグローバルコンテキストを提供するフレームワークを提案する。
FFT-MILは3つの公開データセット上で6つの最先端MIL手法で評価された。
論文 参考訳(メタデータ) (2025-10-16T20:54:58Z) - EfficientMIL: Efficient Linear-Complexity MIL Method for WSI Classification [7.789973233645291]
パッチ選択モジュールAdaptive Patch Selector (APS) を用いた全スライド画像(WSI)分類のための新しい線形複雑MIL手法であるEfficientMILを導入する。
効率的なMILは、複数の病理組織学データセットにまたがる他のMIL法よりも優れた計算効率の向上を実現している。
論文 参考訳(メタデータ) (2025-09-28T04:47:11Z) - SemaMIL: Semantic-Aware Multiple Instance Learning with Retrieval-Guided State Space Modeling for Whole Slide Images [17.674866281320046]
SemaMILは,スライド画像全体から識別特徴を抽出する適応的手法である。
セマンティックに類似したパッチを、可逆的な置換によってシーケンスでクラスタ化する。
FLOPやパラメータを少なくして最先端のサブタイプ精度を実現する。
論文 参考訳(メタデータ) (2025-08-30T10:13:18Z) - A Spatially-Aware Multiple Instance Learning Framework for Digital Pathology [4.012490059423154]
マルチプル・インスタンス・ラーニング (MIL) は、スライド画像全体を用いた病理学における弱い教師付き分類のための有望なアプローチである。
トランスフォーマーベースMIL(Transformer Based MIL)のような最近の進歩は、空間的コンテキストとパッチ間関係を取り入れている。
本研究では,この問題に対処するための対話対応表現を統合することで,ABMILフレームワークを強化する。
論文 参考訳(メタデータ) (2025-04-24T08:53:46Z) - Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.80423207808076]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。
マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。
HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.902047563260496]
我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。
より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。
我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文 参考訳(メタデータ) (2024-05-08T11:09:24Z) - MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models [56.37780601189795]
本稿では,WSI分析のためのフレームワークMamMILを提案する。
私たちは各WSIを非指向グラフとして表現します。
マンバが1次元シーケンスしか処理できない問題に対処するために、トポロジ対応の走査機構を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:02:13Z) - Coarse-to-Fine Embedded PatchMatch and Multi-Scale Dynamic Aggregation
for Reference-based Super-Resolution [48.093500219958834]
参照型スーパーリゾリューションのためのAMSA(Accelerated Multi-Scale Aggregation Network)を提案する。
提案したAMSAは,定量評価と定性評価の両面において,最先端の手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-01-12T08:40:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。