論文の概要: RoFormer for Position Aware Multiple Instance Learning in Whole Slide
Image Classification
- arxiv url: http://arxiv.org/abs/2310.01924v1
- Date: Tue, 3 Oct 2023 09:59:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-04 14:59:20.033240
- Title: RoFormer for Position Aware Multiple Instance Learning in Whole Slide
Image Classification
- Title(参考訳): 全スライド画像分類における複数インスタンス学習位置認識のためのロフォーマ
- Authors: Etienne Pochet, Rami Maroun, Roger Trullo
- Abstract要約: 全スライド画像(WSI)分類は、計算病理学において重要な課題である。
現在の手法は、凍結した特徴抽出器を備えたMIL(Multiple-instance Learning)モデルに依存している。
本手法は,弱い教師付き分類タスクにおいて,最先端のMILモデルよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Whole slide image (WSI) classification is a critical task in computational
pathology. However, the gigapixel-size of such images remains a major challenge
for the current state of deep-learning. Current methods rely on
multiple-instance learning (MIL) models with frozen feature extractors. Given
the the high number of instances in each image, MIL methods have long assumed
independence and permutation-invariance of patches, disregarding the tissue
structure and correlation between patches. Recent works started studying this
correlation between instances but the computational workload of such a high
number of tokens remained a limiting factor. In particular, relative position
of patches remains unaddressed. We propose to apply a straightforward encoding
module, namely a RoFormer layer , relying on memory-efficient exact
self-attention and relative positional encoding. This module can perform full
self-attention with relative position encoding on patches of large and
arbitrary shaped WSIs, solving the need for correlation between instances and
spatial modeling of tissues. We demonstrate that our method outperforms
state-of-the-art MIL models on three commonly used public datasets (TCGA-NSCLC,
BRACS and Camelyon16)) on weakly supervised classification tasks. Code is
available at https://github.com/Sanofi-Public/DDS-RoFormerMIL
- Abstract(参考訳): 全スライド画像(WSI)分類は、計算病理学において重要な課題である。
しかし、こうした画像のギガピクセルサイズは、現在のディープラーニングにおける大きな課題である。
現在の手法は、凍結した特徴抽出器を備えたMILモデルに依存している。
画像のインスタンス数が多ければ多いほど、mil法は長い間パッチの独立性と置換非分散を仮定しており、組織構造やパッチ間の相関を無視している。
最近の研究はインスタンス間の相関を研究し始めたが、そのような大量のトークンの計算負荷は制限要因として残った。
特にパッチの相対的な位置は変わっていない。
本稿では,メモリ効率の高い自己アテンションと相対的な位置エンコーディングに頼って,直接符号化モジュール,すなわちRoFormer層を適用することを提案する。
このモジュールは、大または任意の形状のWSIのパッチに相対的な位置エンコーディングを施した完全な自己アテンションを実行でき、インスタンス間の相関と組織の空間的モデリングの必要性を解決することができる。
本手法は,3つのパブリックデータセット(TCGA-NSCLC, BRACS, Camelyon16)上で,教師付き分類タスクにおいて,最先端のMILモデルよりも優れていることを示す。
コードはhttps://github.com/Sanofi-Public/DDS-RoFormerMILで入手できる。
関連論文リスト
- MamMIL: Multiple Instance Learning for Whole Slide Images with State
Space Models [58.39336492765728]
がん診断のゴールドスタンダードである病理診断は、TransformerとMIL(Multiple Case Learning)フレームワークを併用して、全スライド画像(WSI)を用いて、優れたパフォーマンスを実現している。
選択的構造化状態空間モデル(Mamba)とMILとの協調によるWSI分類のためのMamMILフレームワークを提案する。
具体的には、マンバが一方向一次元(一次元)シーケンスモデリングしか行えないという問題を解決するため、双方向状態空間モデルと2次元コンテキスト認識ブロックを革新的に導入する。
論文 参考訳(メタデータ) (2024-03-08T09:02:13Z) - Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。
我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。
実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文 参考訳(メタデータ) (2023-12-12T14:45:45Z) - Deep Multiple Instance Learning with Distance-Aware Self-Attention [9.361964965928063]
距離認識型自己注意型MILモデル(DAS-MIL)を提案する。
離散的な自己注意のための既存の相対的な位置表現とは異なり、我々の手法は注意重みの計算に連続的な距離依存項を導入する。
MNISTをベースとしたカスタムMILデータセットと,CAMELYON16で利用可能な癌転移検出データセットであるCAMELYON16を用いて,本モデルの評価を行った。
論文 参考訳(メタデータ) (2023-05-17T20:11:43Z) - Hierarchical Transformer for Survival Prediction Using Multimodality
Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。
本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。
より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文 参考訳(メタデータ) (2022-11-29T23:47:56Z) - Gigapixel Whole-Slide Images Classification using Locally Supervised
Learning [31.213316201151954]
組織全スライド画像(WSI)は臨床研究において非常に重要な役割を担い、多くのがん診断におけるゴールドスタンダードとして機能する。
従来のメソッドはパッチレベルでWSIを処理するために、多重インスタンス学習(MIL)戦略に依存しています。
本稿では,局所的およびグローバルな情報全体を探索し,スライド全体を処理する,局所的な教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-17T19:31:54Z) - Feature Re-calibration based MIL for Whole Slide Image Classification [7.92885032436243]
全スライド画像(WSI)分類は疾患の診断と治療の基本的な課題である。
本稿では,WSI バッグ (インスタンス) の分布を,最大インスタンス (クリティカル) 特性の統計値を用いて再校正することを提案する。
位置符号化モジュール(PEM)を用いて空間・形態情報をモデル化し,マルチヘッド自己アテンション(PSMA)をトランスフォーマーエンコーダでプーリングする。
論文 参考訳(メタデータ) (2022-06-22T07:00:39Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction [138.04956118993934]
本稿では, サース・トゥ・ファインス・スパース・トランス (CST) を用いた新しいトランス方式を提案する。
HSI再構成のための深層学習にHSI空間を埋め込んだCST
特に,CSTは,提案したスペクトル認識スクリーニング機構(SASM)を粗いパッチ選択に使用し,選択したパッチを,細かなピクセルクラスタリングと自己相似性キャプチャのために,カスタマイズしたスペクトル集約ハッシュ型マルチヘッド自己アテンション(SAH-MSA)に入力する。
論文 参考訳(メタデータ) (2022-03-09T16:17:47Z) - Accounting for Dependencies in Deep Learning Based Multiple Instance
Learning for Whole Slide Imaging [8.712556146101953]
多重インスタンス学習(MIL)は、スライド画像全体(WSI)を分類するための鍵となるアルゴリズムである。
ヒストロジー WSI には数十億ピクセルのピクセルがあり、膨大な計算とアノテーションの課題を生み出す。
本稿では,インスタンスの擬似ラベルに基づくインスタンス単位の損失関数を提案する。
論文 参考訳(メタデータ) (2021-11-01T06:50:33Z) - Sparse convolutional context-aware multiple instance learning for whole
slide image classification [7.18791111462057]
スライドのスライド全体は、診断を導く組織と、多くの疾患に対する治療の選択に関する多くの手がかりを示している。
この問題を解決するために、MIL(Multiple Case Learning)は、スライドイメージ全体ではなくパッチのバッグを分類する。
提案手法は,sparse-input convolutional-based mil戦略によるパッチの空間情報の統合によるパラダイムシフトを示す。
論文 参考訳(メタデータ) (2021-05-06T14:46:09Z) - Cross-Scale Internal Graph Neural Network for Image Super-Resolution [147.77050877373674]
自然画像における非局所的な自己相似性は、画像修復に有効な先行研究として、よく研究されている。
単一の画像超解像(SISR)の場合、既存のディープ非局所法のほとんどは、低解像度(LR)入力画像と同じ規模のパッチしか利用していない。
これは、新しいクロススケールな内部グラフニューラルネットワーク(IGNN)を用いて実現される。
論文 参考訳(メタデータ) (2020-06-30T10:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。