論文の概要: Enabling Progressive Whole-slide Image Analysis with Multi-scale Pyramidal Network
- arxiv url: http://arxiv.org/abs/2602.01951v1
- Date: Mon, 02 Feb 2026 11:00:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:34.092909
- Title: Enabling Progressive Whole-slide Image Analysis with Multi-scale Pyramidal Network
- Title(参考訳): マルチスケールピラミッドネットワークを用いた進行的全すべり画像解析
- Authors: Shuyang Wu, Yifu Qiu, Ines P. Nearchou, Sandrine Prost, Jonathan A Fallowfield, Hakan Bilen, Timothy J Kendall,
- Abstract要約: マルチスケールピラミッドネットワーク(MSPN)は、注意に基づくMIL(Multiple-instance Learning)に対するプラグアンドプレイである
MSPNは,(1)粗い特徴を引き出すために高倍率機能を利用するグリッドベースのリマッピングと,(2)粗い文脈を学習する粗いガイダンスネットワーク(CGN)から構成される。
MSPNは、軽量で使いやすくながら、比較した構成やタスクに対して一貫してMILを改善していることを示す。
- 参考スコア(独自算出の注目度): 20.608639560019967
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multiple-instance Learning (MIL) is commonly used to undertake computational pathology (CPath) tasks, and the use of multi-scale patches allows diverse features across scales to be learned. Previous studies using multi-scale features in clinical applications rely on multiple inputs across magnifications with late feature fusion, which does not retain the link between features across scales while the inputs are dependent on arbitrary, manufacturer-defined magnifications, being inflexible and computationally expensive. In this paper, we propose the Multi-scale Pyramidal Network (MSPN), which is plug-and-play over attention-based MIL that introduces progressive multi-scale analysis on WSI. Our MSPN consists of (1) grid-based remapping that uses high magnification features to derive coarse features and (2) the coarse guidance network (CGN) that learns coarse contexts. We benchmark MSPN as an add-on module to 4 attention-based frameworks using 4 clinically relevant tasks across 3 types of foundation model, as well as the pre-trained MIL framework. We show that MSPN consistently improves MIL across the compared configurations and tasks, while being lightweight and easy-to-use.
- Abstract(参考訳): MIL(Multiple-instance Learning)は一般に計算病理学(CPath)のタスクに使われており、マルチスケールパッチを使用することで、スケールにまたがる多様な特徴を学習することができる。
臨床応用におけるマルチスケール特徴を用いた従来の研究は、複数の倍率にまたがる複数の入力に依存しており、これは、任意のメーカーが定義した倍率に依存し、柔軟性がなく、計算コストがかかる一方で、スケール間の特徴間のリンクを保たない。
本稿では,WSI 上でのプログレッシブなマルチスケール解析を導入し,注目度に基づく MIL をプラグアンドプレイするMulti-scale Pyramidal Network (MSPN) を提案する。
MSPNは,(1)粗い特徴を引き出すために高倍率機能を利用するグリッドベースのリマッピングと,(2)粗い文脈を学習する粗いガイダンスネットワーク(CGN)から構成される。
MSPNを3種類の基礎モデルにまたがる4つの臨床的関連タスクと、事前訓練されたMILフレームワークを用いて、4つの注意ベースのフレームワークのアドオンモジュールとしてベンチマークする。
MSPNは、軽量で使いやすくながら、比較した構成やタスクに対して一貫してMILを改善していることを示す。
関連論文リスト
- MS-ISSM: Objective Quality Assessment of Point Clouds Using Multi-scale Implicit Structural Similarity [65.85858856481131]
点雲の非構造的で不規則な性質は、客観的品質評価(PCQA)に重大な課題をもたらす
マルチスケールインシシシット構造類似度測定(MS-ISSM)を提案する。
論文 参考訳(メタデータ) (2026-01-03T14:58:52Z) - Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs [78.09559830840595]
本稿では拡散に基づく言語モデルの定量化に関する最初の体系的研究について述べる。
異常に大きなアクティベーション値によって特徴付けられるアクティベーションアウトリーチの存在を同定する。
我々は最先端のPTQ手法を実装し、包括的な評価を行う。
論文 参考訳(メタデータ) (2025-08-20T17:59:51Z) - AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification [51.525891360380285]
AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。
2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。
分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-07T07:47:16Z) - Multi-scale Feature Enhancement in Multi-task Learning for Medical Image Analysis [1.6916040234975798]
医用画像における伝統的な深層学習法は、分割や分類にのみ焦点をあてることが多い。
このモデルでは,デコーダがセグメント化マスクを生成するのに対して,エンコーダによって抽出された特徴を分類ラベルの予測に利用する。
複数の医療データセットにまたがる実験結果から, セグメンテーションタスクと分類タスクの両方において, モデルの優れた性能が確認された。
論文 参考訳(メタデータ) (2024-11-30T04:20:05Z) - Mamba2MIL: State Space Duality Based Multiple Instance Learning for Computational Pathology [17.329498427735565]
本稿では,Mamba2MILと呼ばれる新しいマルチインスタンス学習フレームワークを提案する。
Mamba2MILは順序関係と順序に依存しない特徴を利用しており、配列情報の最適部分の利用をもたらす。
私たちは、複数のデータセットにまたがって広範な実験を行い、ほぼすべてのパフォーマンス指標の改善を実現しています。
論文 参考訳(メタデータ) (2024-08-27T13:01:19Z) - MUSE: Mamba is Efficient Multi-scale Learner for Text-video Retrieval [73.77101139365912]
効率的なクロスレゾリューションモデリングのための線形計算複雑性を持つマルチスケールマンバであるMUSEを提案する。
具体的には、最後の単一スケールのフィーチャーマップに特徴ピラミッドを適用することで、マルチスケールの表現を生成する。
我々は,Mamba構造を効率的なマルチスケール学習者として用いて,スケールワイド表現を共同学習する。
論文 参考訳(メタデータ) (2024-08-20T06:30:37Z) - TPMIL: Trainable Prototype Enhanced Multiple Instance Learning for Whole
Slide Image Classification [13.195971707693365]
我々は、弱い教師付きWSI分類のための訓練可能なプロトタイプ強化深層MILフレームワークを開発した。
本手法により, 異なる腫瘍のサブタイプ間の相関関係を明らかにすることができる。
提案手法を2つのWSIデータセット上でテストし,新たなSOTAを実現する。
論文 参考訳(メタデータ) (2023-05-01T07:39:19Z) - Learning Visual Representation from Modality-Shared Contrastive
Language-Image Pre-training [88.80694147730883]
本稿では,多種多様なモダリティ共有コントラスト言語-画像事前学習(MS-CLIP)フレームワークについて検討する。
学習条件下では、視覚と言語信号のためのほとんど統一されたエンコーダが、より多くのパラメータを分離する他のすべてのバリエーションより優れていることが観察された。
我々のアプローチは、24の下流視覚タスクのコレクションに基づいて、線形探索においてバニラCLIPを1.6ポイント上回ります。
論文 参考訳(メタデータ) (2022-07-26T05:19:16Z) - Attention Awareness Multiple Instance Neural Network [4.061135251278187]
本稿では,マルチインスタンスニューラルネットワークフレームワークを提案する。
インスタンスレベルの分類器と、空間的注意に基づくトレーニング可能なMILプーリング演算子と、バッグレベルの分類層で構成される。
一連のパターン認識タスクに対する実証実験により、我々のフレームワークは最先端のMILメソッドよりも優れていることが示された。
論文 参考訳(メタデータ) (2022-05-27T03:29:17Z) - Machine Learning-enhanced Receive Processing for MU-MIMO OFDM Systems [15.423422040627331]
機械学習は、マルチユーザマルチインプットマルチアウトプット(MU-MIMO)受信処理を改善するために使用できる。
本稿では,従来の受信機の利点を保ちつつ,特定の部品をMLコンポーネントで強化する新たな戦略を提案する。
論文 参考訳(メタデータ) (2021-06-30T14:02:27Z) - A^2-FPN: Attention Aggregation based Feature Pyramid Network for
Instance Segmentation [68.10621089649486]
アテンションアグリゲーションに基づく機能ピラミッドネットワーク(A2-FPN)を提案し、マルチスケール機能学習を改善します。
A2-FPNは、Cascade Mask R-CNNやHybrid Task Cascadeといった強力なベースラインに統合された場合、2.0%と1.4%のマスクAPを改善する。
論文 参考訳(メタデータ) (2021-05-07T11:51:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。