論文の概要: Feature Re-calibration based MIL for Whole Slide Image Classification
- arxiv url: http://arxiv.org/abs/2206.10878v1
- Date: Wed, 22 Jun 2022 07:00:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-24 02:29:18.905156
- Title: Feature Re-calibration based MIL for Whole Slide Image Classification
- Title(参考訳): 全スライド画像分類のための特徴再校正に基づくMIL
- Authors: Philip Chikontwe, Soo Jeong Nam, Heounjeong Go, Meejeong Kim, Hyun
Jung Sung, Sang Hyun Park
- Abstract要約: 全スライド画像(WSI)分類は疾患の診断と治療の基本的な課題である。
本稿では,WSI バッグ (インスタンス) の分布を,最大インスタンス (クリティカル) 特性の統計値を用いて再校正することを提案する。
位置符号化モジュール(PEM)を用いて空間・形態情報をモデル化し,マルチヘッド自己アテンション(PSMA)をトランスフォーマーエンコーダでプーリングする。
- 参考スコア(独自算出の注目度): 7.92885032436243
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Whole slide image (WSI) classification is a fundamental task for the
diagnosis and treatment of diseases; but, curation of accurate labels is
time-consuming and limits the application of fully-supervised methods. To
address this, multiple instance learning (MIL) is a popular method that poses
classification as a weakly supervised learning task with slide-level labels
only. While current MIL methods apply variants of the attention mechanism to
re-weight instance features with stronger models, scant attention is paid to
the properties of the data distribution. In this work, we propose to
re-calibrate the distribution of a WSI bag (instances) by using the statistics
of the max-instance (critical) feature. We assume that in binary MIL, positive
bags have larger feature magnitudes than negatives, thus we can enforce the
model to maximize the discrepancy between bags with a metric feature loss that
models positive bags as out-of-distribution. To achieve this, unlike existing
MIL methods that use single-batch training modes, we propose balanced-batch
sampling to effectively use the feature loss i.e., (+/-) bags simultaneously.
Further, we employ a position encoding module (PEM) to model
spatial/morphological information, and perform pooling by multi-head
self-attention (PSMA) with a Transformer encoder. Experimental results on
existing benchmark datasets show our approach is effective and improves over
state-of-the-art MIL methods.
- Abstract(参考訳): 全スライド画像(wsi)分類は疾患の診断と治療の基本的な課題であるが、正確なラベルのキュレーションは時間がかかり、完全に監督された方法の適用が制限される。
これを解決するために、MIL(Multiple Case Learning)はスライドレベルラベルのみを用いた弱い教師付き学習タスクとして分類される一般的な手法である。
現在のMIL法では、より強力なモデルを持つ再重み付けのインスタンス機能にアテンションメカニズムの変種を適用するが、データ分散の特性には注意が払われる。
本稿では,max-instance (critical) 特徴の統計情報を用いて,wsi バッグ(インスタンス)の分布を再調整することを提案する。
二元的MILでは、正の袋は負よりも大きな特徴量を持つので、正の袋を分布外としてモデル化する計量的特徴損失を持つ袋間の差を最大化するために、モデルを強制することができると仮定する。
そこで本研究では, 単一バッチ学習モードを用いた既存のMIL手法と異なり, 機能損失(+/-)を同時に効果的に活用するための平衡バッチサンプリングを提案する。
さらに、位置符号化モジュール(PEM)を用いて空間・形態情報をモデル化し、トランスフォーマーエンコーダを用いたマルチヘッド自己アテンション(PSMA)によるプールを行う。
既存のベンチマークデータセットによる実験結果から,我々のアプローチは有効であり,最先端のMIL法よりも改善されている。
関連論文リスト
- Attention Is Not What You Need: Revisiting Multi-Instance Learning for Whole Slide Image Classification [51.95824566163554]
我々は,標準MIL仮定と変分推論を相乗化することにより,スプリアス相関ではなく腫瘍形態学に焦点を合わせることができると主張している。
また, ハードインスタンスの識別に優れた分類境界を実現し, バッグとラベルの相互関係を緩和する。
論文 参考訳(メタデータ) (2024-08-18T12:15:22Z) - Bring Metric Functions into Diffusion Models [145.71911023514252]
DDPM(Denoising Diffusion Probabilistic Model)を改善するカスケード拡散モデル(Cas-DM)を導入する。
提案した拡散モデルバックボーンはLPIPS損失の有効利用を可能にし,最先端画像品質(FID, sFID, IS)を実現する。
実験結果から,提案した拡散モデルバックボーンはLPIPS損失の有効利用を可能にし,最新画像品質(FID, sFID, IS)につながることが示された。
論文 参考訳(メタデータ) (2024-01-04T18:55:01Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Interventional Bag Multi-Instance Learning On Whole-Slide Pathological
Images [30.82201485481452]
バグの文脈的事前は、バッグとラベルの間の急激な相関を捉えるためにモデルを騙すかもしれない。
本稿では, バッグレベルの非整合予測を実現するための新しい手法, Interventional Bag Multi-Instance Learning (IBMIL) を提案する。
論文 参考訳(メタデータ) (2023-03-13T05:46:56Z) - DGMIL: Distribution Guided Multiple Instance Learning for Whole Slide
Image Classification [9.950131528559211]
本稿では,WSI分類と正のパッチローカライゼーションのための機能分布ガイド付きディープMILフレームワークを提案する。
CAMELYON16 データセットと TCGA Lung Cancer データセットを用いた実験により,本手法はグローバルな分類と正のパッチローカライゼーションの両タスクにおいて,新たな SOTA を実現することが示された。
論文 参考訳(メタデータ) (2022-06-17T16:04:30Z) - Momentum Pseudo-Labeling for Semi-Supervised Speech Recognition [55.362258027878966]
本稿では,半教師付き音声認識のための簡易かつ効果的な手法として,モーメント擬似ラベル(MPL)を提案する。
MPLは、平均的な教師メソッドにインスパイアされて、相互に相互作用し、学習するオンラインとオフラインの2つのモデルで構成されている。
実験の結果,MPLはベースモデルよりも効果的に改善され,様々な半教師付きシナリオに拡張可能であることが示された。
論文 参考訳(メタデータ) (2021-06-16T16:24:55Z) - Dual-stream Multiple Instance Learning Network for Whole Slide Image
Classification with Self-supervised Contrastive Learning [16.84711797934138]
スライド画像全体分類(WSI)の課題に対処する。
WSI分類は、スライドレベルラベルのみが利用可能である場合、多重インスタンス学習(MIL)問題としてキャストすることができる。
局所アノテーションを必要としないWSI分類と腫瘍検出のためのMILベースの手法を提案する。
論文 参考訳(メタデータ) (2020-11-17T20:51:15Z) - Sparse Network Inversion for Key Instance Detection in Multiple Instance
Learning [24.66638752977373]
複数インスタンス学習(MIL)では、バッグレベルの正または負のラベルを与えられたインスタンスの袋の1つのラベルを予測する。
注目に基づくディープMILモデルは、バッグレベルの分類とキーインスタンス検出の両方において最近の進歩である。
KIDタスクにおける注意に基づく深層MILモデルの改善手法を提案する。
論文 参考訳(メタデータ) (2020-09-07T07:01:59Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z) - Dual-stream Maximum Self-attention Multi-instance Learning [11.685285490589981]
MIL(Multi-Instance Learning)は、インスタンスレベルのラベルが利用できない間に単一のクラスラベルがインスタンスのバッグに割り当てられる弱い教師付き学習の一種である。
ニューラルネットワークによりパラメータ化されたDSMILモデル(Dual-stream maximum self-attention MIL model)を提案する。
提案手法は,最高のMIL手法と比較して優れた性能を示し,ベンチマークMILデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2020-06-09T22:44:58Z) - Weakly-Supervised Action Localization with Expectation-Maximization
Multi-Instance Learning [82.41415008107502]
弱教師付きアクションローカライゼーションでは、ビデオレベルアクションラベルのみを与えられたビデオ内のアクションセグメントをローカライズするモデルをトレーニングする必要がある。
バッグ(ビデオ)には複数のインスタンス(アクションセグメント)が含まれている。
我々のEM-MILアプローチは、学習目標とMIL仮定の両方をより正確にモデル化することを示します。
論文 参考訳(メタデータ) (2020-03-31T23:36:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。