論文の概要: Learning Binary and Sparse Permutation-Invariant Representations for
Fast and Memory Efficient Whole Slide Image Search
- arxiv url: http://arxiv.org/abs/2208.13653v1
- Date: Mon, 29 Aug 2022 14:56:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-30 14:10:41.060279
- Title: Learning Binary and Sparse Permutation-Invariant Representations for
Fast and Memory Efficient Whole Slide Image Search
- Title(参考訳): 高速かつメモリ効率の良い全スライド画像検索のためのバイナリとスパース置換不変表現の学習
- Authors: Sobhan Hemati, Shivam Kalra, Morteza Babaie, H.R. Tizhoosh
- Abstract要約: 本稿では, 深層生成モデルとフィッシャーベクトルを用いて, バイナリおよびスパースWSI表現を学習するための新しいフレームワークを提案する。
本稿では、インスタンスベーストレーニングを用いたスパースと二分置換不変WSI表現を学習するための新しい損失関数を提案する。
提案手法は, 検索精度と速度の両面で, ヨッティクセル(最近の病理画像検索エンジン)より優れていた。
- 参考スコア(独自算出の注目度): 3.2580463372881234
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Learning suitable Whole slide images (WSIs) representations for efficient
retrieval systems is a non-trivial task. The WSI embeddings obtained from
current methods are in Euclidean space not ideal for efficient WSI retrieval.
Furthermore, most of the current methods require high GPU memory due to the
simultaneous processing of multiple sets of patches. To address these
challenges, we propose a novel framework for learning binary and sparse WSI
representations utilizing a deep generative modelling and the Fisher Vector. We
introduce new loss functions for learning sparse and binary
permutation-invariant WSI representations that employ instance-based training
achieving better memory efficiency. The learned WSI representations are
validated on The Cancer Genomic Atlas (TCGA) and Liver-Kidney-Stomach (LKS)
datasets. The proposed method outperforms Yottixel (a recent search engine for
histopathology images) both in terms of retrieval accuracy and speed. Further,
we achieve competitive performance against SOTA on the public benchmark LKS
dataset for WSI classification.
- Abstract(参考訳): 効率的な検索システムのための適切なWSI(Whole Slide Image)表現の学習は簡単ではない。
現在の方法から得られるWSI埋め込みは、効率的なWSI検索には理想的ではない。
さらに、現在の方法の多くは、複数のパッチセットを同時に処理するため、高いgpuメモリを必要とする。
これらの課題に対処するため,我々は,深層生成モデルとフィッシャーベクトルを用いて,バイナリ表現とスパースwsi表現を学習するための新しいフレームワークを提案する。
本稿では,メモリ効率を向上させるインスタンスベーストレーニングを用いた,スパースおよびバイナリ置換不変なwsi表現を学ぶための新たな損失関数を提案する。
得られたWSI表現は、The Cancer Genomic Atlas (TCGA)とLiver-Kidney-Stomach (LKS)データセットで検証されている。
提案手法は, 検索精度と速度の両面で, ヨッティクセル(最近の病理画像検索エンジン)より優れていた。
さらに、WSI分類のための公開ベンチマークLKSデータセットにおいて、SOTAに対する競合性能を実現する。
関連論文リスト
- Efficient Whole Slide Image Classification through Fisher Vector Representation [2.4472081831862655]
本稿では,最も情報性の高いパッチの識別と検証を自動化し,WSI分類の新しい手法を提案する。
提案手法は2段階からなる。まず,その病理学的意義に基づいて,WSIから少数のパッチのみを抽出し,次いで,これらのパッチから抽出した特徴を表現するためにFisherベクトルを用いる。
このアプローチは、WSI表現内の主要な病理的特徴をアクセントするだけでなく、計算オーバーヘッドを大幅に減らし、プロセスをより効率的かつスケーラブルにする。
論文 参考訳(メタデータ) (2024-11-13T11:24:12Z) - TSI-Bench: Benchmarking Time Series Imputation [52.27004336123575]
TSI-Benchは、ディープラーニング技術を利用した時系列計算のための総合ベンチマークスイートである。
TSI-Benchパイプラインは、実験的な設定を標準化し、計算アルゴリズムの公平な評価を可能にする。
TSI-Benchは、計算目的のために時系列予測アルゴリズムを調整するための体系的なパラダイムを革新的に提供する。
論文 参考訳(メタデータ) (2024-06-18T16:07:33Z) - Multimodal Learned Sparse Retrieval with Probabilistic Expansion Control [66.78146440275093]
学習検索(LSR)は、クエリとドキュメントを疎語彙ベクトルにエンコードするニューラルネットワークのファミリーである。
テキスト画像検索に焦点をあて,マルチモーダル領域へのLSRの適用について検討する。
LexLIPやSTAIRのような現在のアプローチでは、大規模なデータセットで複雑なマルチステップのトレーニングが必要です。
提案手法は, 密度ベクトルを凍結密度モデルからスパース語彙ベクトルへ効率的に変換する。
論文 参考訳(メタデータ) (2024-02-27T14:21:56Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - ProtoDiv: Prototype-guided Division of Consistent Pseudo-bags for
Whole-slide Image Classification [5.836559246348487]
Pseudo-bag の分割スキームは、しばしば分類性能に欠かせないものであり、探求する価値のあるトピックである。
本稿では,WSI 擬似バッグの分割を誘導するために,バッグプロトタイプを用いた新しいスキーム ProtoDiv を提案する。
論文 参考訳(メタデータ) (2023-04-13T16:27:08Z) - A Dual-branch Self-supervised Representation Learning Framework for
Tumour Segmentation in Whole Slide Images [12.961686610789416]
自己教師付き学習(SSL)は、スライドイメージ全体のアノテーションオーバーヘッドを低減する代替ソリューションとして登場した。
これらのSSLアプローチは、識別画像の特徴を学習する際の性能を制限するマルチレゾリューションWSIを扱うために設計されていない。
マルチ解像度WSIから画像特徴を効果的に学習できるDSF-WSI(Dual-branch SSL Framework for WSI tumour segmentation)を提案する。
論文 参考訳(メタデータ) (2023-03-20T10:57:28Z) - Task-specific Fine-tuning via Variational Information Bottleneck for
Weakly-supervised Pathology Whole Slide Image Classification [10.243293283318415]
MIL(Multiple Instance Learning)は、デジタル・パスロジー・ホール・スライド・イメージ(WSI)分類において有望な結果を示している。
本稿では,Information Bottleneck 理論を動機とした効率的な WSI 微調整フレームワークを提案する。
我々のフレームワークは、様々なWSIヘッド上の5つの病理WSIデータセットで評価される。
論文 参考訳(メタデータ) (2023-03-15T08:41:57Z) - ReMix: A General and Efficient Framework for Multiple Instance Learning
based Whole Slide Image Classification [14.78430890440035]
ワイルスライド画像(WSI)分類は、ギガピクセル解像度画像とスライドレベルのラベルを扱うために弱教師付き多重インスタンス学習(MIL)法に依存することが多い。
MILに基づくWSI分類のための汎用的で効率的なフレームワークであるReMixを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:21:35Z) - Improving Calibration for Long-Tailed Recognition [68.32848696795519]
このようなシナリオにおけるキャリブレーションとパフォーマンスを改善する2つの方法を提案します。
異なるサンプルによるデータセットバイアスに対して,シフトバッチ正規化を提案する。
提案手法は,複数の長尾認識ベンチマークデータセットに新しいレコードをセットする。
論文 参考訳(メタデータ) (2021-04-01T13:55:21Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - ResNeSt: Split-Attention Networks [86.25490825631763]
このアーキテクチャは、異なるネットワークブランチにチャンネルワイズを応用し、機能間相互作用のキャプチャと多様な表現の学習の成功を活用する。
我々のモデルはResNeStと呼ばれ、画像分類の精度と遅延トレードオフにおいてEfficientNetより優れています。
論文 参考訳(メタデータ) (2020-04-19T20:40:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。