論文の概要: Dynamic Residual Encoding with Slide-Level Contrastive Learning for End-to-End Whole Slide Image Representation
- arxiv url: http://arxiv.org/abs/2511.05034v1
- Date: Fri, 07 Nov 2025 07:17:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-10 21:00:44.698858
- Title: Dynamic Residual Encoding with Slide-Level Contrastive Learning for End-to-End Whole Slide Image Representation
- Title(参考訳): エンド・ツー・エンドのスライド画像表現のためのスライドレベルコントラスト学習による動的残差符号化
- Authors: Jing Jin, Xu Liu, Te Gao, Zhihong Shi, Yixiong Liang, Ruiqing Zheng, Hulin Kuang, Min Zeng, Shichao Kan,
- Abstract要約: 全スライド画像(WSI)の表現は、がんのサブタイプ、がんの認識、突然変異予測に重要である。
本稿では,スライドレベルコントラスト学習(DRE-SLCL)を用いた動的残差符号化手法を提案する。
- 参考スコア(独自算出の注目度): 20.60316821474408
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Whole Slide Image (WSI) representation is critical for cancer subtyping, cancer recognition and mutation prediction.Training an end-to-end WSI representation model poses significant challenges, as a standard gigapixel slide can contain tens of thousands of image tiles, making it difficult to compute gradients of all tiles in a single mini-batch due to current GPU limitations. To address this challenge, we propose a method of dynamic residual encoding with slide-level contrastive learning (DRE-SLCL) for end-to-end WSI representation. Our approach utilizes a memory bank to store the features of tiles across all WSIs in the dataset. During training, a mini-batch usually contains multiple WSIs. For each WSI in the batch, a subset of tiles is randomly sampled and their features are computed using a tile encoder. Then, additional tile features from the same WSI are selected from the memory bank. The representation of each individual WSI is generated using a residual encoding technique that incorporates both the sampled features and those retrieved from the memory bank. Finally, the slide-level contrastive loss is computed based on the representations and histopathology reports ofthe WSIs within the mini-batch. Experiments conducted over cancer subtyping, cancer recognition, and mutation prediction tasks proved the effectiveness of the proposed DRE-SLCL method.
- Abstract(参考訳): WSI(Whole Slide Image)表現は、がんのサブタイプ、がんの認識、突然変異予測に不可欠である。エンドツーエンドのWSI表現モデルの構築は、標準的なギガピクセルのスライドには数万のイメージタイルが含まれているため、現在のGPU制限のため、単一のミニバッチですべてのタイルの勾配を計算するのが難しくなるため、大きな課題となる。
この課題に対処するために,スライドレベルのコントラスト学習(DRE-SLCL)を用いた動的残差符号化手法を提案する。
このアプローチでは、メモリバンクを使用して、データセット内のすべてのWSIにまたがるタイルの特徴を格納します。
トレーニング中、ミニバッチは通常複数のWSIを含む。
バッチ内の各WSIに対して、タイルのサブセットをランダムにサンプリングし、その特徴をタイルエンコーダを使って計算する。
そして、同じWSIから追加のタイル特徴をメモリバンクから選択する。
各WSIの表現は、サンプリングされた特徴とメモリバンクから取得した特徴の両方を組み込んだ残留符号化技術を用いて生成される。
最後に、スライドレベルのコントラスト損失は、ミニバッチ内のWSIの表現と病理組織学的報告に基づいて計算される。
DRE-SLCL法の有効性を証明した。
関連論文リスト
- Aggregation Schemes for Single-Vector WSI Representation Learning in Digital Pathology [2.0088541799100392]
計算病理学においてWSI(Whole Slide Images)を効率的に統合するための重要なステップは、1つの高品質な特徴ベクトル、すなわち1つの埋め込みを各WSIに割り当てることである。
本稿では,最近開発された複数の集約手法のWSI検索性能を評価する。
論文 参考訳(メタデータ) (2025-01-29T18:14:51Z) - MSCPT: Few-shot Whole Slide Image Classification with Multi-scale and Context-focused Prompt Tuning [47.66327196203432]
複数のインスタンス学習は、スライド画像全体の弱教師付き分類の標準パラダイムとなっている。
トレーニングデータの欠如と稀な疾患の存在は、これらの方法に重大な課題をもたらす。
本稿では,Few-shot Weakly Supervised WSI 分類タスクのためのマルチスケールおよびコンテキスト中心の Prompt Tuning (MSCPT) 手法を提案する。
論文 参考訳(メタデータ) (2024-08-21T10:25:51Z) - Subobject-level Image Tokenization [60.80949852899857]
パッチベースの画像トークン化は、視覚世界の形態を無視する。
サブワードトークン化にヒントを得て,サブオブジェクトレベルの適応トークンセグメンテーションを導入する。
サブオブジェクトのトークン化は、より少ない視覚トークンを使用しながら、より高速な収束とより優れた一般化を可能にすることを示す。
論文 参考訳(メタデータ) (2024-02-22T06:47:44Z) - A self-supervised framework for learning whole slide representations [52.774822784847565]
我々は、全スライド画像のギガピクセルスケールの自己スーパービジョンのためのSlide Pre-trained Transformer (SPT)を提案する。
バイオメディカル・マイクロスコープ・データセットを用いて,5つの診断課題におけるSPT視覚表現のベンチマークを行った。
論文 参考訳(メタデータ) (2024-02-09T05:05:28Z) - Artifact-Robust Graph-Based Learning in Digital Pathology [2.9998889086656586]
全スライド画像(WSI)は、高度なスキャナーを用いてガラススライドに配置された組織のデジタル化画像である。
本研究では,これらのアーティファクトを考慮に入れた,新しい堅牢な学習手法を提案する。
前立腺癌データセットを用いたモデルの精度とスコアは、非ロバストアルゴリズムと比較すると、癌診断において顕著な改善が見られた。
論文 参考訳(メタデータ) (2023-10-27T15:06:01Z) - Hierarchical Transformer for Survival Prediction Using Multimodality
Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。
本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。
より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文 参考訳(メタデータ) (2022-11-29T23:47:56Z) - Learning Binary and Sparse Permutation-Invariant Representations for
Fast and Memory Efficient Whole Slide Image Search [3.2580463372881234]
本稿では, 深層生成モデルとフィッシャーベクトルを用いて, バイナリおよびスパースWSI表現を学習するための新しいフレームワークを提案する。
本稿では、インスタンスベーストレーニングを用いたスパースと二分置換不変WSI表現を学習するための新しい損失関数を提案する。
提案手法は, 検索精度と速度の両面で, ヨッティクセル(最近の病理画像検索エンジン)より優れていた。
論文 参考訳(メタデータ) (2022-08-29T14:56:36Z) - Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and
Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。
SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。
Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文 参考訳(メタデータ) (2022-03-19T09:19:55Z) - Scalable Visual Transformers with Hierarchical Pooling [61.05787583247392]
本稿では,視覚的トークンを徐々にプールしてシーケンス長を縮小する階層的ビジュアルトランスフォーマ(hvt)を提案する。
計算の複雑さを増すことなく、深さ/幅/解像度/パッチサイズの寸法をスケールすることで、大きなメリットをもたらします。
当社のHVTはImageNetとCIFAR-100データセットの競合ベースラインを上回っています。
論文 参考訳(メタデータ) (2021-03-19T03:55:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。