論文の概要: Aggregation Schemes for Single-Vector WSI Representation Learning in Digital Pathology
- arxiv url: http://arxiv.org/abs/2501.17822v1
- Date: Wed, 29 Jan 2025 18:14:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-30 15:54:52.736894
- Title: Aggregation Schemes for Single-Vector WSI Representation Learning in Digital Pathology
- Title(参考訳): デジタル病理における単一ベクトルWSI表現学習のための集約方式
- Authors: Sobhan Hemati, Ghazal Alabtah, Saghir Alfasly, H. R. Tizhoosh,
- Abstract要約: 計算病理学においてWSI(Whole Slide Images)を効率的に統合するための重要なステップは、1つの高品質な特徴ベクトル、すなわち1つの埋め込みを各WSIに割り当てることである。
本稿では,最近開発された複数の集約手法のWSI検索性能を評価する。
- 参考スコア(独自算出の注目度): 2.0088541799100392
- License:
- Abstract: A crucial step to efficiently integrate Whole Slide Images (WSIs) in computational pathology is assigning a single high-quality feature vector, i.e., one embedding, to each WSI. With the existence of many pre-trained deep neural networks and the emergence of foundation models, extracting embeddings for sub-images (i.e., tiles or patches) is straightforward. However, for WSIs, given their high resolution and gigapixel nature, inputting them into existing GPUs as a single image is not feasible. As a result, WSIs are usually split into many patches. Feeding each patch to a pre-trained model, each WSI can then be represented by a set of patches, hence, a set of embeddings. Hence, in such a setup, WSI representation learning reduces to set representation learning where for each WSI we have access to a set of patch embeddings. To obtain a single embedding from a set of patch embeddings for each WSI, multiple set-based learning schemes have been proposed in the literature. In this paper, we evaluate the WSI search performance of multiple recently developed aggregation techniques (mainly set representation learning techniques) including simple average or max pooling operations, Deep Sets, Memory networks, Focal attention, Gaussian Mixture Model (GMM) Fisher Vector, and deep sparse and binary Fisher Vector on four different primary sites including bladder, breast, kidney, and Colon from TCGA. Further, we benchmark the search performance of these methods against the median of minimum distances of patch embeddings, a non-aggregating approach used for WSI retrieval.
- Abstract(参考訳): 計算病理学においてWSI(Whole Slide Images)を効率的に統合するための重要なステップは、1つの高品質な特徴ベクトル、すなわち1つの埋め込みを各WSIに割り当てることである。
多くの事前訓練されたディープニューラルネットワークの存在と基礎モデルの出現により、サブイメージ(タイルやパッチなど)への埋め込みの抽出は簡単である。
しかし、WSIの高解像度とギガピクセルの性質を考えると、単一のイメージとして既存のGPUに入力することは不可能である。
結果として、WSIは通常、多くのパッチに分割される。
各パッチを事前訓練されたモデルにフィードすると、各WSIはパッチのセットで表現され、そのため埋め込みのセットとなる。
したがって、そのような設定では、WSI表現学習は、各WSIに対してパッチの埋め込みセットにアクセス可能な表現学習に還元されます。
各WSIに対するパッチ埋め込みの集合から1つの埋め込みを得るため、本論文では複数のセットベース学習スキームが提案されている。
本稿では, 膀胱, 乳腺, 腎臓, 大腸の4つの一次部位において, 単純な平均, 最大プール操作, 深部集合, メモリネットワーク, 焦点注意, ガウス混合モデル(GMM) フィッシャーベクトル, 深部スパースおよび二分フィッシャーベクトルを含む, 最近開発された複数のアグリゲーション技術(主に表現学習技術)のWSI検索性能を評価する。
さらに,これらの手法の検索性能を,WSI検索に使用される非集約的アプローチであるパッチ埋め込みの最小距離の中央値に対してベンチマークする。
関連論文リスト
- A self-supervised framework for learning whole slide representations [52.774822784847565]
我々は、全スライド画像のギガピクセルスケールの自己スーパービジョンのためのSlide Pre-trained Transformer (SPT)を提案する。
バイオメディカル・マイクロスコープ・データセットを用いて,5つの診断課題におけるSPT視覚表現のベンチマークを行った。
論文 参考訳(メタデータ) (2024-02-09T05:05:28Z) - BROW: Better featuRes fOr Whole slide image based on self-distillation [19.295596638166536]
各種疾患の標準診断において,WSI処理が重要な要素となっている。
ほとんどのWSI関連タスクのパフォーマンスは、WSIパッチの特徴表現を抽出するバックボーンの有効性に依存します。
我々は、WSIのより良い特徴表現を抽出するための基礎モデルBROWを提案し、微調整を伴わずに下流タスクに便利に適用できることを示した。
論文 参考訳(メタデータ) (2023-09-15T09:11:09Z) - ProtoDiv: Prototype-guided Division of Consistent Pseudo-bags for
Whole-slide Image Classification [5.836559246348487]
Pseudo-bag の分割スキームは、しばしば分類性能に欠かせないものであり、探求する価値のあるトピックである。
本稿では,WSI 擬似バッグの分割を誘導するために,バッグプロトタイプを用いた新しいスキーム ProtoDiv を提案する。
論文 参考訳(メタデータ) (2023-04-13T16:27:08Z) - Hierarchical Transformer for Survival Prediction Using Multimodality
Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。
本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。
より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文 参考訳(メタデータ) (2022-11-29T23:47:56Z) - Learning Binary and Sparse Permutation-Invariant Representations for
Fast and Memory Efficient Whole Slide Image Search [3.2580463372881234]
本稿では, 深層生成モデルとフィッシャーベクトルを用いて, バイナリおよびスパースWSI表現を学習するための新しいフレームワークを提案する。
本稿では、インスタンスベーストレーニングを用いたスパースと二分置換不変WSI表現を学習するための新しい損失関数を提案する。
提案手法は, 検索精度と速度の両面で, ヨッティクセル(最近の病理画像検索エンジン)より優れていた。
論文 参考訳(メタデータ) (2022-08-29T14:56:36Z) - Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction [138.04956118993934]
本稿では, サース・トゥ・ファインス・スパース・トランス (CST) を用いた新しいトランス方式を提案する。
HSI再構成のための深層学習にHSI空間を埋め込んだCST
特に,CSTは,提案したスペクトル認識スクリーニング機構(SASM)を粗いパッチ選択に使用し,選択したパッチを,細かなピクセルクラスタリングと自己相似性キャプチャのために,カスタマイズしたスペクトル集約ハッシュ型マルチヘッド自己アテンション(SAH-MSA)に入力する。
論文 参考訳(メタデータ) (2022-03-09T16:17:47Z) - Learning Prototype-oriented Set Representations for Meta-Learning [85.19407183975802]
集合構造データから学ぶことは、近年注目を集めている根本的な問題である。
本稿では,既存の要約ネットワークを改善するための新しい最適輸送方式を提案する。
さらに、少数ショット分類と暗黙的メタ生成モデリングの事例にインスタンス化する。
論文 参考訳(メタデータ) (2021-10-18T09:49:05Z) - DSNet: A Dual-Stream Framework for Weakly-Supervised Gigapixel Pathology
Image Analysis [78.78181964748144]
スライド画像全体(WSI)を分類するための弱教師付きフレームワークを提案する。
WSIは通常、パッチレベルのラベルを持つパッチワイド分類によって処理される。
イメージレベルのラベルのみの場合、パッチの外観とイメージレベルのラベルの矛盾のため、パッチの分類はサブ最適となる。
論文 参考訳(メタデータ) (2021-09-13T09:10:43Z) - An Efficient Cervical Whole Slide Image Analysis Framework Based on
Multi-scale Semantic and Spatial Features using Deep Learning [2.7218168309244652]
本研究では,YOLCO(You Only Look Cytopathology Once)という名前の軽量モデルを構築するために,マルチスケール接続を充実させることにより,新しいインライン接続ネットワーク(InCNet)を設計する。
提案したモデルでは、入力サイズをメガピクセルに拡大し、平均リピートで重なり合うことなくWSIを縫合することができる。
統合マルチスケールマルチタスクの特徴を分類するためのTransformerに基づいて、実験結果は、WSI分類における従来の方法よりも0.872$ AUCスコアが良く、2.51times$速く見える。
論文 参考訳(メタデータ) (2021-06-29T06:24:55Z) - Pay Attention with Focus: A Novel Learning Scheme for Classification of
Whole Slide Images [8.416553728391309]
スライド画像全体(WSI)を解析するための新しい2段階アプローチを提案する。
まず、WSIから代表パッチ(モザイクと呼ばれる)を抽出する。
モザイクの各パッチは、ディープネットワークを用いて特徴ベクトルに符号化される。
第2段階では、WSIから符号化されたパッチレベルの一連の特徴を用いて、一次診断確率を算出する。
論文 参考訳(メタデータ) (2021-06-11T21:59:02Z) - CARAFE++: Unified Content-Aware ReAssembly of FEatures [132.49582482421246]
この目標を達成するために、ユニバーサルで軽量で高効率なオペレータであるContent-Aware ReAssembly of FEatures(CARAFE++)を提案します。
CARAFE++は、インスタンス固有のコンテンツ認識処理を可能にするアダプティブカーネルをオンザフライで生成する。
計算のオーバーヘッドが無視できるすべてのタスクにおいて、一貫性と実質的な利益を示しています。
論文 参考訳(メタデータ) (2020-12-07T07:34:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。