論文の概要: Iteratively Coupled Multiple Instance Learning from Instance to Bag
Classifier for Whole Slide Image Classification
- arxiv url: http://arxiv.org/abs/2303.15749v2
- Date: Wed, 23 Aug 2023 06:04:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 18:20:23.851378
- Title: Iteratively Coupled Multiple Instance Learning from Instance to Bag
Classifier for Whole Slide Image Classification
- Title(参考訳): 全スライド画像分類のためのインスタンスからバッグ分類器への反復結合多重インスタンス学習
- Authors: Hongyi Wang, Luyang Luo, Fang Wang, Ruofeng Tong, Yen-Wei Chen,
Hongjie Hu, Lanfen Lin, and Hao Chen
- Abstract要約: Whole Slide Image (WSI)分類は、非常に高解像度であり、きめ細かいラベルがないため、依然として課題である。
我々は,バッグレベルの分類器からパッチ埋め込み装置への損失バックプロパゲーションプロセスをブリッジする,ICMIL (Iteratively Coupled MIL) と呼ばれる新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.16848269555692
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Whole Slide Image (WSI) classification remains a challenge due to their
extremely high resolution and the absence of fine-grained labels. Presently,
WSI classification is usually regarded as a Multiple Instance Learning (MIL)
problem when only slide-level labels are available. MIL methods involve a patch
embedding module and a bag-level classification module, but they are
prohibitively expensive to be trained in an end-to-end manner. Therefore,
existing methods usually train them separately, or directly skip the training
of the embedder. Such schemes hinder the patch embedder's access to slide-level
semantic labels, resulting in inconsistency within the entire MIL pipeline. To
overcome this issue, we propose a novel framework called Iteratively Coupled
MIL (ICMIL), which bridges the loss back-propagation process from the bag-level
classifier to the patch embedder. In ICMIL, we use category information in the
bag-level classifier to guide the patch-level fine-tuning of the patch feature
extractor. The refined embedder then generates better instance representations
for achieving a more accurate bag-level classifier. By coupling the patch
embedder and bag classifier at a low cost, our proposed framework enables
information exchange between the two modules, benefiting the entire MIL
classification model. We tested our framework on two datasets using three
different backbones, and our experimental results demonstrate consistent
performance improvements over state-of-the-art MIL methods. The code is
available at: https://github.com/Dootmaan/ICMIL.
- Abstract(参考訳): Whole Slide Image (WSI)分類は、非常に高解像度であり、きめ細かいラベルがないため、依然として課題である。
現在、wsi分類は通常、スライドレベルラベルのみが利用できる場合、多重インスタンス学習(mil)問題と見なされる。
MILメソッドには、パッチの埋め込みモジュールとバッグレベルの分類モジュールが含まれるが、エンドツーエンドでトレーニングすることは違法に高価である。
したがって、既存のメソッドは通常、個別にトレーニングするか、あるいは埋め込み器のトレーニングを直接スキップする。
このようなスキームは、パッチ埋め込み者のスライドレベルのセマンティックラベルへのアクセスを妨げるため、MILパイプライン全体の一貫性が低下する。
この問題を解決するために,バッグレベルの分類器からパッチ埋め込み装置への損失バックプロパゲーションプロセスをブリッジするICMIL (Iteratively Coupled MIL) という新しいフレームワークを提案する。
icmilでは,バグレベル分類器のカテゴリ情報を用いてパッチ特徴抽出器のパッチレベルの微調整を行う。
洗練された埋め込み器は、より正確なバッグレベルの分類器を達成するためのより良いインスタンス表現を生成する。
パッチ埋め込みとバッグ分類器を低コストで結合することにより、2つのモジュール間の情報交換を可能にし、MIL分類モデル全体の恩恵を受けることができる。
我々は3つの異なるバックボーンを用いて2つのデータセット上でフレームワークをテストし、実験の結果、最先端のMIL法よりも一貫した性能改善が示された。
コードは、https://github.com/Dootmaan/ICMIL.comで入手できる。
関連論文リスト
- African or European Swallow? Benchmarking Large Vision-Language Models for Fine-Grained Object Classification [53.89380284760555]
textttFOCI (textbfFine-fine textbfObject textbfClasstextbfIfication) は、きめ細かいオブジェクト分類のための難しい多重選択ベンチマークである。
textttFOCIxspaceは、ImageNet-21kから4つのドメイン固有のサブセットで5つの一般的な分類データセットを補完する。
論文 参考訳(メタデータ) (2024-06-20T16:59:39Z) - MamMIL: Multiple Instance Learning for Whole Slide Images with State
Space Models [58.39336492765728]
がん診断のゴールドスタンダードである病理診断は、TransformerとMIL(Multiple Case Learning)フレームワークを併用して、全スライド画像(WSI)を用いて、優れたパフォーマンスを実現している。
選択的構造化状態空間モデル(Mamba)とMILとの協調によるWSI分類のためのMamMILフレームワークを提案する。
具体的には、マンバが一方向一次元(一次元)シーケンスモデリングしか行えないという問題を解決するため、双方向状態空間モデルと2次元コンテキスト認識ブロックを革新的に導入する。
論文 参考訳(メタデータ) (2024-03-08T09:02:13Z) - Rethinking Multiple Instance Learning for Whole Slide Image
Classification: A Bag-Level Classifier is a Good Instance-Level Teacher [22.080213609228547]
複数のインスタンス学習は、WSI(Whole Slide Image)分類において約束されている。
既存の手法は一般に2段階のアプローチを採用しており、学習不可能な特徴埋め込み段階と分類器訓練段階からなる。
バッグレベルの分類器は、良いインスタンスレベルの教師になれると提案する。
論文 参考訳(メタデータ) (2023-12-02T10:16:03Z) - SC-MIL: Sparsely Coded Multiple Instance Learning for Whole Slide Image
Classification [2.506648245691747]
多重インスタンス学習(MIL)は、弱い教師付き全スライド画像(WSI)分類に広く用いられている。
本稿では,この2つの側面を同時に扱うために,スパース辞書学習を活用して,スパース符号化MIL(SC-MIL)を提案する。
提案したSCモジュールは,プラグイン・アンド・プレイ方式で既存のMILフレームワークに組み込むことができる。
論文 参考訳(メタデータ) (2023-10-31T18:01:41Z) - Prediction Calibration for Generalized Few-shot Semantic Segmentation [101.69940565204816]
汎用Few-shot Semantic (GFSS) は、各画像ピクセルを、豊富なトレーニング例を持つベースクラスか、クラスごとにわずかに(例: 1-5)のトレーニングイメージを持つ新しいクラスのいずれかに分割することを目的としている。
我々は、融合したマルチレベル機能を用いて、分類器の最終予測をガイドするクロスアテンションモジュールを構築する。
私たちのPCNは、最先端の代替品よりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2022-10-15T13:30:12Z) - ReMix: A General and Efficient Framework for Multiple Instance Learning
based Whole Slide Image Classification [14.78430890440035]
ワイルスライド画像(WSI)分類は、ギガピクセル解像度画像とスライドレベルのラベルを扱うために弱教師付き多重インスタンス学習(MIL)法に依存することが多い。
MILに基づくWSI分類のための汎用的で効率的なフレームワークであるReMixを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:21:35Z) - Feature Re-calibration based MIL for Whole Slide Image Classification [7.92885032436243]
全スライド画像(WSI)分類は疾患の診断と治療の基本的な課題である。
本稿では,WSI バッグ (インスタンス) の分布を,最大インスタンス (クリティカル) 特性の統計値を用いて再校正することを提案する。
位置符号化モジュール(PEM)を用いて空間・形態情報をモデル化し,マルチヘッド自己アテンション(PSMA)をトランスフォーマーエンコーダでプーリングする。
論文 参考訳(メタデータ) (2022-06-22T07:00:39Z) - BatchFormerV2: Exploring Sample Relationships for Dense Representation
Learning [88.82371069668147]
BatchFormerV2はより一般的なバッチトランスフォーマーモジュールである。
BatchFormerV2は、現在のDETRベースの検出方法を1.3%以上改善している。
論文 参考訳(メタデータ) (2022-04-04T05:53:42Z) - SWAT: Spatial Structure Within and Among Tokens [53.525469741515884]
我々は,トークン化時に空間構造が保存される場合,モデルが顕著な利得が得られることを論じる。
本研究では,(1)構造認識のトークン化と(2)構造認識のミキシングという2つの重要なコントリビューションを提案する。
論文 参考訳(メタデータ) (2021-11-26T18:59:38Z) - Dual-stream Multiple Instance Learning Network for Whole Slide Image
Classification with Self-supervised Contrastive Learning [16.84711797934138]
スライド画像全体分類(WSI)の課題に対処する。
WSI分類は、スライドレベルラベルのみが利用可能である場合、多重インスタンス学習(MIL)問題としてキャストすることができる。
局所アノテーションを必要としないWSI分類と腫瘍検出のためのMILベースの手法を提案する。
論文 参考訳(メタデータ) (2020-11-17T20:51:15Z) - Weakly-Supervised Action Localization with Expectation-Maximization
Multi-Instance Learning [82.41415008107502]
弱教師付きアクションローカライゼーションでは、ビデオレベルアクションラベルのみを与えられたビデオ内のアクションセグメントをローカライズするモデルをトレーニングする必要がある。
バッグ(ビデオ)には複数のインスタンス(アクションセグメント)が含まれている。
我々のEM-MILアプローチは、学習目標とMIL仮定の両方をより正確にモデル化することを示します。
論文 参考訳(メタデータ) (2020-03-31T23:36:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。