論文の概要: AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification
- arxiv url: http://arxiv.org/abs/2508.05114v1
- Date: Thu, 07 Aug 2025 07:47:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-08 21:11:55.668311
- Title: AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification
- Title(参考訳): AHDMIL: 高速かつ高精度な全すべり画像分類のための非対称階層的蒸留マルチインスタンス学習
- Authors: Jiuyang Dong, Jiahan Li, Junjun Jiang, Kui Jiang, Yongbing Zhang,
- Abstract要約: AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。
2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。
分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
- 参考スコア(独自算出の注目度): 51.525891360380285
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although multi-instance learning (MIL) has succeeded in pathological image classification, it faces the challenge of high inference costs due to the need to process thousands of patches from each gigapixel whole slide image (WSI). To address this, we propose AHDMIL, an Asymmetric Hierarchical Distillation Multi-Instance Learning framework that enables fast and accurate classification by eliminating irrelevant patches through a two-step training process. AHDMIL comprises two key components: the Dynamic Multi-Instance Network (DMIN), which operates on high-resolution WSIs, and the Dual-Branch Lightweight Instance Pre-screening Network (DB-LIPN), which analyzes corresponding low-resolution counterparts. In the first step, self-distillation (SD), DMIN is trained for WSI classification while generating per-instance attention scores to identify irrelevant patches. These scores guide the second step, asymmetric distillation (AD), where DB-LIPN learns to predict the relevance of each low-resolution patch. The relevant patches predicted by DB-LIPN have spatial correspondence with patches in high-resolution WSIs, which are used for fine-tuning and efficient inference of DMIN. In addition, we design the first Chebyshev-polynomial-based Kolmogorov-Arnold (CKA) classifier in computational pathology, which improves classification performance through learnable activation layers. Extensive experiments on four public datasets demonstrate that AHDMIL consistently outperforms previous state-of-the-art methods in both classification performance and inference speed. For example, on the Camelyon16 dataset, it achieves a relative improvement of 5.3% in accuracy and accelerates inference by 1.2.times. Across all datasets, area under the curve (AUC), accuracy, f1 score, and brier score show consistent gains, with average inference speedups ranging from 1.2 to 2.1 times. The code is available.
- Abstract(参考訳): MIL (Multi-instance Learning) は画像の病理分類に成功しているが、各スライド画像(WSI)から数千のパッチを処理する必要があるため、高い推論コストの課題に直面している。
そこで本稿では,非対称な階層的蒸留多インスタンス学習フレームワークであるAHDMILを提案する。
AHDMIL は、高解像度 WSI で動作する Dynamic Multi-Instance Network (DMIN) と、それに対応する低解像度のものを分析する Dual-Branch Lightweight Instance Pre-screening Network (DB-LIPN) の2つの主要なコンポーネントから構成されている。
最初のステップでは、自己蒸留(SD)として、DMINはWSI分類のためにトレーニングされ、インスタンス毎の注意スコアを生成して、無関係なパッチを特定する。
これらのスコアは、2番目のステップである非対称蒸留(AD)を導き、DB-LIPNは各低解像度パッチの関連性を予測する。
DB-LIPNによって予測される関連するパッチは、DMINの微調整と効率的な推論に使用される高分解能WSIのパッチと空間的対応を持つ。
さらに,CKA分類器をChebyshev-polynomial-based Kolmogorov-Arnold (CKA) に設計し,学習可能なアクティベーション層による分類性能を向上させる。
4つの公開データセットに対する大規模な実験により、AHDMILは、分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っていることが示された。
例えば、Camelyon16データセットでは、相対的に5.3%の精度向上を実現し、1.2.timesの推論を加速している。
全てのデータセット、曲線(AUC)の下の領域、精度、f1スコア、ブライアスコアは一貫した利得を示し、平均的な推論速度は1.2倍から2.1倍である。
コードは利用可能です。
関連論文リスト
- Clustering-Guided Multi-Layer Contrastive Representation Learning for Citrus Disease Classification [17.627760587507737]
シトラス(Citrus)は、世界でもっとも経済的に重要な果実の1つである。
正確な疾患の検出と分類は、標的とするコントロール対策を実施するための重要な前提条件である。
人工知能の最近の進歩、特にディープラーニングベースのコンピュータビジョンアルゴリズムは、時間と労働の要求を大幅に減らしている。
論文 参考訳(メタデータ) (2025-07-15T10:22:52Z) - Stochastic Primal-Dual Double Block-Coordinate for Two-way Partial AUC Maximization [56.805574957824135]
2方向部分AUCAUCは、不均衡なデータを持つバイナリ分類における重要な性能指標である。
TPAUC最適化のための既存のアルゴリズムは未探索のままである。
TPAUC最適化のための2つの革新的な二重座標ブロック座標アルゴリズムを導入する。
論文 参考訳(メタデータ) (2025-05-28T03:55:05Z) - Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning [51.525891360380285]
HDMILは階層的な蒸留マルチインスタンス学習フレームワークであり、無関係なパッチを排除して高速かつ正確な分類を実現する。
HDMILは、動的マルチインスタンスネットワーク(DMIN)と軽量インスタンスプレスクリーンネットワーク(LIPN)の2つの重要なコンポーネントで構成されている。
論文 参考訳(メタデータ) (2025-02-28T15:10:07Z) - DiTMoS: Delving into Diverse Tiny-Model Selection on Microcontrollers [34.282971510732736]
我々は、セレクタ分類器アーキテクチャを備えた新しいDNNトレーニングおよび推論フレームワークであるDiTMoSを紹介する。
弱いモデルの合成は高い多様性を示すことができ、それらの結合は精度の上限を大幅に高めることができる。
我々は,Nucleo STM32F767ZIボード上にDiTMoSをデプロイし,人間の活動認識,キーワードスポッティング,感情認識のための時系列データセットに基づいて評価する。
論文 参考訳(メタデータ) (2024-03-14T02:11:38Z) - NearbyPatchCL: Leveraging Nearby Patches for Self-Supervised Patch-Level
Multi-Class Classification in Whole-Slide Images [10.8479107614771]
全スライディング画像(WSI)解析は、がんの診断と治療において重要な役割を担っている。
本稿では,新しい自己教師型学習手法であるNearby Patch Contrastive Learning(NearbyPatchCL)を紹介する。
本手法は,トップ1分類精度87.56%で,教師付きベースラインと最先端SSL法を著しく上回っている。
論文 参考訳(メタデータ) (2023-12-12T18:24:44Z) - Voxelmorph++ Going beyond the cranial vault with keypoint supervision
and multi-channel instance optimisation [8.88841928746097]
近年のLearn2Regベンチマークでは,単スケールU-Netアーキテクチャーは腹部または患者内肺登録の最先端性能に劣っている。
本稿では、この精度のギャップを大幅に減らすための2つの簡単な手順を提案する。
まず、離散化されたヒートマップを予測する新しいネットワークヘッドを備えたキーポイント・セルフスーパービジョンを用いる。
次に、複数の学習した微調整ステップを、手作りの機能とAdamオプティマイザでひとつのインスタンスに置き換える。
論文 参考訳(メタデータ) (2022-02-28T19:23:29Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Improving Calibration for Long-Tailed Recognition [68.32848696795519]
このようなシナリオにおけるキャリブレーションとパフォーマンスを改善する2つの方法を提案します。
異なるサンプルによるデータセットバイアスに対して,シフトバッチ正規化を提案する。
提案手法は,複数の長尾認識ベンチマークデータセットに新しいレコードをセットする。
論文 参考訳(メタデータ) (2021-04-01T13:55:21Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。