論文の概要: LRMIL: Efficient Low-Resolution Multiple Instance Learning via High-Resolution Knowledge Distillation for Whole Slide Image Classification
- arxiv url: http://arxiv.org/abs/2606.06864v1
- Date: Fri, 05 Jun 2026 03:21:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.540656
- Title: LRMIL: Efficient Low-Resolution Multiple Instance Learning via High-Resolution Knowledge Distillation for Whole Slide Image Classification
- Title(参考訳): LRMIL:全スライド画像分類のための高分解能知識蒸留による高分解能マルチインスタンス学習
- Authors: Yonghan Shin, Won-Ki Jeong,
- Abstract要約: 多重インスタンス学習(MIL)は、デジタル病理学における全スライド画像(WSI)解析の標準パラダイムとなっている。
本稿では,高分解能知識を低分解能表現に伝達する高分解能マルチインスタンス学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.741100658955037
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multiple instance learning (MIL) has become a standard paradigm for whole slide image (WSI) analysis in digital pathology, as it enables slide-level prediction without dense annotations. Existing MIL methods typically rely on exhaustive extraction and encoding of high-resolution patches. However, this practice suffers from two critical limitations in real-world clinical settings: it struggles to capture global visual cues at lower magnifications, and incurs substantial computational overhead due to the massive number of high-resolution patches per slide. To address these limitations, we propose an efficient low-resolution multiple instance learning (LRMIL) framework that transfers high-resolution knowledge to low-resolution representations. LRMIL adopts a two-stage distillation strategy. First, patch-level cross-resolution distillation aligns low-resolution patch embeddings with high-resolution representations. Second, slide-level knowledge distillation trains a low-resolution student MIL model under both slide-level supervision and teacher guidance. At inference time, LRMIL operates exclusively on low-resolution patches, substantially reducing data preprocessing and computational cost. Extensive experiments on multiple WSI benchmarks demonstrate that LRMIL consistently outperforms state-of-the-art MIL methods while achieving more efficient inference. These results highlight LRMIL as a practical and scalable solution for WSI analysis in clinical pathology.
- Abstract(参考訳): 多重インスタンス学習(MIL)は,高密度アノテーションを使わずにスライドレベルの予測を可能にするため,デジタル病理学における全スライド画像(WSI)解析の標準パラダイムとなっている。
既存のMIL法は、通常、高解像度パッチの抜粋と符号化に頼っている。
しかし、このプラクティスは、実際の臨床環境では2つの重要な制限に悩まされる: グローバルな視覚的手がかりを低い倍率で捉えるのに苦労し、スライド1枚あたりの高解像度パッチが大量にあるため、かなりの計算オーバーヘッドを発生させる。
これらの制約に対処するために,高分解能知識を低分解能表現に転送する効率的な低分解能多重インスタンス学習(LRMIL)フレームワークを提案する。
LRMILは2段階の蒸留戦略を採用している。
第一に、パッチレベルのクロスレゾリューション蒸留は、低解像度のパッチ埋め込みと高解像度の表現を一致させる。
第2に、スライドレベルの知識蒸留は、スライドレベルの監督と教師指導の両方の下で、低解像度の学生MILモデルを訓練する。
推測時、LRMILは低解像度のパッチのみで動作し、データ前処理と計算コストを大幅に削減する。
複数のWSIベンチマークでの大規模な実験により、LRMILはより効率的な推論を実現しつつ、最先端のMILメソッドを一貫して上回っていることが示された。
これらの結果から,臨床病理学におけるWSI解析のための実用的でスケーラブルなソリューションとして LRMIL が注目されている。
関連論文リスト
- WSD-MIL: Window Scale Decay Multiple Instance Learning for Whole Slide Image Classification [2.760935655675299]
ウィンドウスケール崩壊MIL (WSD-MIL) は、様々なスケールの腫瘍領域をモデル化する能力を高めるために設計された。
WSD-MIL は CAMELYON16 と TCGA-BRCA のデータセット上での最先端のパフォーマンスを実現し、計算メモリの 62% を削減した。
論文 参考訳(メタデータ) (2025-12-23T02:10:24Z) - FineRS: Fine-grained Reasoning and Segmentation of Small Objects with Reinforcement Learning [62.11389260206383]
textscFineRSは、非常に小さなオブジェクトをセグメント化するための2段階のMLLMベースの強化学習フレームワークである。
textscFineRS-4kは,属性レベルの推論に基づくMLLMの評価と,微妙で小規模なターゲットに対する画素レベルのセグメンテーションのための新しいデータセットである。
論文 参考訳(メタデータ) (2025-10-24T10:14:17Z) - AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification [51.525891360380285]
AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。
2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。
分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-07T07:47:16Z) - Two-Stage Random Alternation Framework for One-Shot Pansharpening [12.385955231193675]
本稿では,任意のマルチスペクトル(MS)/パンクロマティック(PAN)ペアに対して,インスタンス固有の最適化を行う2段階ランダム交互化フレームワーク(TRA-PAN)を提案する。
TRA-PANは、縮小解像度画像からの強い監督制約とフル解像度画像の物理的特性を効果的に統合する。
実験の結果,TRA-PANは実世界のシナリオにおいて,定量的な測定値と視覚的品質において,最先端(SOTA)手法よりも優れていた。
論文 参考訳(メタデータ) (2025-05-10T09:26:22Z) - Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning [51.525891360380285]
HDMILは階層的な蒸留マルチインスタンス学習フレームワークであり、無関係なパッチを排除して高速かつ正確な分類を実現する。
HDMILは、動的マルチインスタンスネットワーク(DMIN)と軽量インスタンスプレスクリーンネットワーク(LIPN)の2つの重要なコンポーネントで構成されている。
論文 参考訳(メタデータ) (2025-02-28T15:10:07Z) - Robust Analysis of Multi-Task Learning Efficiency: New Benchmarks on Light-Weighed Backbones and Effective Measurement of Multi-Task Learning Challenges by Feature Disentanglement [69.51496713076253]
本稿では,既存のMTL手法の効率性に焦点をあてる。
バックボーンを小さくしたメソッドの大規模な実験と,MetaGraspNetデータセットを新しいテストグラウンドとして実施する。
また,MTLにおける課題の新規かつ効率的な識別子として,特徴分散尺度を提案する。
論文 参考訳(メタデータ) (2024-02-05T22:15:55Z) - Learning from Multi-Perception Features for Real-Word Image
Super-resolution [87.71135803794519]
入力画像の複数の知覚的特徴を利用する新しいSR手法MPF-Netを提案する。
本稿では,MPFEモジュールを組み込んで,多様な知覚情報を抽出する手法を提案する。
また、モデルの学習能力を向上する対照的な正規化項(CR)も導入する。
論文 参考訳(メタデータ) (2023-05-26T07:35:49Z) - Differentiable Zooming for Multiple Instance Learning on Whole-Slide
Images [4.928363812223965]
本稿では,エンドツーエンドでマルチレベルズームを行う方法であるZoomMILを提案する。
提案手法は2つの大規模データセット上でWSI分類における最先端のMIL法より優れている。
論文 参考訳(メタデータ) (2022-04-26T17:20:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。