論文の概要: Cluster-to-Conquer: A Framework for End-to-End Multi-Instance Learning
for Whole Slide Image Classification
- arxiv url: http://arxiv.org/abs/2103.10626v1
- Date: Fri, 19 Mar 2021 04:24:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 20:01:43.217410
- Title: Cluster-to-Conquer: A Framework for End-to-End Multi-Instance Learning
for Whole Slide Image Classification
- Title(参考訳): Cluster-to-Conquer: 全スライド画像分類のためのエンドツーエンドマルチインスタンス学習フレームワーク
- Authors: Yash Sharma, Aman Shrivastava, Lubaina Ehsan, Christopher A. Moskaluk,
Sana Syed, Donald E. Brown
- Abstract要約: 本稿では,WSI (Whole Slide Images) からのパッチを$k$-groupsにクラスタリングし,各グループから$k'$のパッチをサンプルし,スライドレベルの予測に適応的な注意機構を用いるエンドツーエンドフレームワークを提案する。
このフレームワークは、スライドレベルのクロスエントロピー、パッチレベルのクロスエントロピー、KLの分散損失に最適化されている。
- 参考スコア(独自算出の注目度): 7.876654642325896
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, the availability of digitized Whole Slide Images (WSIs) has
enabled the use of deep learning-based computer vision techniques for automated
disease diagnosis. However, WSIs present unique computational and algorithmic
challenges. WSIs are gigapixel-sized ($\sim$100K pixels), making them
infeasible to be used directly for training deep neural networks. Also, often
only slide-level labels are available for training as detailed annotations are
tedious and can be time-consuming for experts. Approaches using
multiple-instance learning (MIL) frameworks have been shown to overcome these
challenges. Current state-of-the-art approaches divide the learning framework
into two decoupled parts: a convolutional neural network (CNN) for encoding the
patches followed by an independent aggregation approach for slide-level
prediction. In this approach, the aggregation step has no bearing on the
representations learned by the CNN encoder. We have proposed an end-to-end
framework that clusters the patches from a WSI into ${k}$-groups, samples
${k}'$ patches from each group for training, and uses an adaptive attention
mechanism for slide level prediction; Cluster-to-Conquer (C2C). We have
demonstrated that dividing a WSI into clusters can improve the model training
by exposing it to diverse discriminative features extracted from the patches.
We regularized the clustering mechanism by introducing a KL-divergence loss
between the attention weights of patches in a cluster and the uniform
distribution. The framework is optimized end-to-end on slide-level
cross-entropy, patch-level cross-entropy, and KL-divergence loss
(Implementation: https://github.com/YashSharma/C2C).
- Abstract(参考訳): 近年,Digitalized Whole Slide Images (WSIs) の利用可能化により,深層学習に基づくコンピュータビジョン技術による診断の自動化が実現されている。
しかし、WSIは独自の計算とアルゴリズムの課題を提示している。
WSIはギガピクセルサイズの100Kピクセルで、ディープニューラルネットワークのトレーニングに直接使うことはできない。
また、詳細なアノテーションが面倒で専門家にとって時間がかかるため、しばしばスライドレベルのラベルのみがトレーニング用に利用できる。
MIL(Multiple-instance Learning)フレームワークを用いたアプローチは、これらの課題を克服することが示されている。
現在の最先端アプローチでは、学習フレームワークを2つの分離された部分に分割している。パッチをエンコードするための畳み込みニューラルネットワーク(CNN)と、スライドレベルの予測のための独立した集約アプローチだ。
このアプローチでは、アグリゲーションステップはcnnエンコーダによって学習された表現に依存しない。
我々は,wsi から ${k}$-groups にパッチをクラスタし,各グループから ${k}'$ パッチをサンプルしてトレーニングを行うエンドツーエンドフレームワークを提案し,スライドレベル予測のための適応的注意機構 (cluster-to-conquer (c2c)) を用いる。
我々は、WSIをクラスタに分割することで、パッチから抽出した様々な識別機能に公開することにより、モデルトレーニングを改善することを実証した。
クラスタ内のパッチの注意重みと均一分布との間にKL分散損失を導入することでクラスタリング機構を正規化した。
このフレームワークは、スライドレベルのクロスエントロピー、パッチレベルのクロスエントロピー、KLの分散損失(実装:https://github.com/YashSharma/C2C)にエンドツーエンドで最適化されている。
関連論文リスト
- MUSTANG: Multi-Stain Self-Attention Graph Multiple Instance Learning
Pipeline for Histopathology Whole Slide Images [1.127806343149511]
Whole Slide Images (WSIs)は、ギガピクセルサイズとアーティファクトの存在により、コンピュータビジョンの課題を提示している。
実世界の臨床データセットは、患者レベルにラベルがある異種WSIのセットとして提供され、アノテーションが不足している。
本稿では,エンドツーエンドのマルチスタンプ・セルフアテンション・グラフ(MUSTANG)マルチインスタンス学習パイプラインを提案する。
論文 参考訳(メタデータ) (2023-09-19T14:30:14Z) - Neural Collapse Inspired Feature-Classifier Alignment for Few-Shot Class
Incremental Learning [120.53458753007851]
FSCIL(Few-shot class-incremental Learning)は、新しいセッションにおいて、新しいクラスごとにいくつかのトレーニングサンプルしかアクセスできないため、難しい問題である。
我々は最近発見された神経崩壊現象にインスパイアされたFSCILのこの不整合ジレンマに対処する。
我々は、FSCILのための神経崩壊誘発フレームワークを提案する。MiniImageNet、CUB-200、CIFAR-100データセットの実験により、提案したフレームワークが最先端のパフォーマンスより優れていることを示す。
論文 参考訳(メタデータ) (2023-02-06T18:39:40Z) - Scale Attention for Learning Deep Face Representation: A Study Against
Visual Scale Variation [69.45176408639483]
我々はスケール空間理論に頼って凸層を再構築する。
我々はSCale AttentioN Conv Neural Network(textbfSCAN-CNN)という新しいスタイルを構築した。
単発方式として、推論はマルチショット融合よりも効率的である。
論文 参考訳(メタデータ) (2022-09-19T06:35:04Z) - Gigapixel Whole-Slide Images Classification using Locally Supervised
Learning [31.213316201151954]
組織全スライド画像(WSI)は臨床研究において非常に重要な役割を担い、多くのがん診断におけるゴールドスタンダードとして機能する。
従来のメソッドはパッチレベルでWSIを処理するために、多重インスタンス学習(MIL)戦略に依存しています。
本稿では,局所的およびグローバルな情報全体を探索し,スライド全体を処理する,局所的な教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-17T19:31:54Z) - Deep Image Clustering with Contrastive Learning and Multi-scale Graph
Convolutional Networks [58.868899595936476]
コントラスト学習とマルチスケールグラフ畳み込みネットワーク(IcicleGCN)を用いた画像クラスタリング手法を提案する。
複数の画像データセットの実験は、最先端のIcicleGCNよりも優れたクラスタリング性能を示している。
論文 参考訳(メタデータ) (2022-07-14T19:16:56Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Accounting for Dependencies in Deep Learning Based Multiple Instance
Learning for Whole Slide Imaging [8.712556146101953]
多重インスタンス学習(MIL)は、スライド画像全体(WSI)を分類するための鍵となるアルゴリズムである。
ヒストロジー WSI には数十億ピクセルのピクセルがあり、膨大な計算とアノテーションの課題を生み出す。
本稿では,インスタンスの擬似ラベルに基づくインスタンス単位の損失関数を提案する。
論文 参考訳(メタデータ) (2021-11-01T06:50:33Z) - Learning Hierarchical Graph Neural Networks for Image Clustering [81.5841862489509]
本稿では,画像の集合を未知の個数にクラスタリングする方法を学ぶ階層型グラフニューラルネットワーク(GNN)モデルを提案する。
我々の階層的なGNNは、階層の各レベルで予測される連結コンポーネントをマージして、次のレベルで新しいグラフを形成するために、新しいアプローチを用いています。
論文 参考訳(メタデータ) (2021-07-03T01:28:42Z) - Pay Attention with Focus: A Novel Learning Scheme for Classification of
Whole Slide Images [8.416553728391309]
スライド画像全体(WSI)を解析するための新しい2段階アプローチを提案する。
まず、WSIから代表パッチ(モザイクと呼ばれる)を抽出する。
モザイクの各パッチは、ディープネットワークを用いて特徴ベクトルに符号化される。
第2段階では、WSIから符号化されたパッチレベルの一連の特徴を用いて、一次診断確率を算出する。
論文 参考訳(メタデータ) (2021-06-11T21:59:02Z) - Embedding Propagation: Smoother Manifold for Few-Shot Classification [131.81692677836202]
本稿では, 組込み伝搬を非教師なし非パラメトリック正規化器として, 数ショット分類における多様体平滑化に用いることを提案する。
埋め込み伝播がより滑らかな埋め込み多様体を生み出すことを実証的に示す。
複数の半教師付き学習シナリオにおいて,埋め込み伝搬によりモデルの精度が最大16%向上することを示す。
論文 参考訳(メタデータ) (2020-03-09T13:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。