論文の概要: Promptable Representation Distribution Learning and Data Augmentation for Gigapixel Histopathology WSI Analysis
- arxiv url: http://arxiv.org/abs/2412.14473v1
- Date: Thu, 19 Dec 2024 02:47:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-20 13:31:31.742874
- Title: Promptable Representation Distribution Learning and Data Augmentation for Gigapixel Histopathology WSI Analysis
- Title(参考訳): ギガピクセル病理組織学WSI解析のための確率的表現分布学習とデータ拡張
- Authors: Kunming Tang, Zhiguo Jiang, Jun Shi, Wei Wang, Haibo Wu, Yushan Zheng,
- Abstract要約: 本稿では,パッチレベルの表現学習とWSIレベルのデータ拡張のためのPRDL(Promptable Representation Distribution Learning)を提案する。
提案手法は最先端の手法よりも安定して性能を向上する。
- 参考スコア(独自算出の注目度): 7.823674912857107
- License:
- Abstract: Gigapixel image analysis, particularly for whole slide images (WSIs), often relies on multiple instance learning (MIL). Under the paradigm of MIL, patch image representations are extracted and then fixed during the training of the MIL classifiers for efficiency consideration. However, the invariance of representations makes it difficult to perform data augmentation for WSI-level model training, which significantly limits the performance of the downstream WSI analysis. The current data augmentation methods for gigapixel images either introduce additional computational costs or result in a loss of semantic information, which is hard to meet the requirements for efficiency and stability needed for WSI model training. In this paper, we propose a Promptable Representation Distribution Learning framework (PRDL) for both patch-level representation learning and WSI-level data augmentation. Meanwhile, we explore the use of prompts to guide data augmentation in feature space, which achieves promptable data augmentation for training robust WSI-level models. The experimental results have demonstrated that the proposed method stably outperforms state-of-the-art methods.
- Abstract(参考訳): ギガピクセル画像解析、特に全スライド画像(WSI)は、しばしば多重インスタンス学習(MIL)に依存している。
MILのパラダイムの下では、パッチ画像表現を抽出し、効率を考慮したMIL分類器の訓練中に固定する。
しかし、表現の不変性により、WSIレベルのモデルトレーニングのためのデータ拡張の実行が困難になるため、下流のWSI分析の性能が著しく制限される。
ギガピクセル画像の現在のデータ拡張手法は、追加の計算コストを導入するか、意味情報の喪失をもたらすかのいずれかであり、WSIモデルトレーニングに必要な効率と安定性の要件を満たすことは困難である。
本稿では,パッチレベルの表現学習とWSIレベルのデータ拡張のためのPRDL(Promptable Representation Distribution Learning)を提案する。
一方、機能空間におけるデータ拡張を導くためのプロンプトの利用について検討し、ロバストなWSIレベルのモデルをトレーニングするために、迅速なデータ拡張を実現する。
実験結果から,提案手法は最先端手法よりも安定に性能を向上することが示された。
関連論文リスト
- Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - On the Scalability of Diffusion-based Text-to-Image Generation [97.64837704129005]
拡散に基づくテキスト・ツー・イメージ(T2I)モデルのスケーリング特性について検討する。
モデルスケーリングでは、既存のUNet設計の性能を区別して、クロスアテンションの位置と量を求める。
データスケーリングの面では、単にデータセットのサイズではなく、トレーニングセットの品質と多様性が重要です。
論文 参考訳(メタデータ) (2024-04-03T17:34:28Z) - A self-supervised framework for learning whole slide representations [52.774822784847565]
我々は、全スライド画像のギガピクセルスケールの自己スーパービジョンのためのSlide Pre-trained Transformer (SPT)を提案する。
バイオメディカル・マイクロスコープ・データセットを用いて,5つの診断課題におけるSPT視覚表現のベンチマークを行った。
論文 参考訳(メタデータ) (2024-02-09T05:05:28Z) - Diffusion-based generation of Histopathological Whole Slide Images at a
Gigapixel scale [10.481781668319886]
Synthetic Whole Slide Images (WSI)は、多くの計算アプリケーションの性能を高めるためにトレーニングデータセットを増強することができる。
既存のディープラーニングベースの手法は、WSIを通常高い解像度で生成しない。
本稿では,高分解能 WSI の画像生成に取り組むために,新しい粗大なサンプリング手法を提案する。
論文 参考訳(メタデータ) (2023-11-14T14:33:39Z) - BROW: Better featuRes fOr Whole slide image based on self-distillation [19.295596638166536]
各種疾患の標準診断において,WSI処理が重要な要素となっている。
ほとんどのWSI関連タスクのパフォーマンスは、WSIパッチの特徴表現を抽出するバックボーンの有効性に依存します。
我々は、WSIのより良い特徴表現を抽出するための基礎モデルBROWを提案し、微調整を伴わずに下流タスクに便利に適用できることを示した。
論文 参考訳(メタデータ) (2023-09-15T09:11:09Z) - A Dual-branch Self-supervised Representation Learning Framework for
Tumour Segmentation in Whole Slide Images [12.961686610789416]
自己教師付き学習(SSL)は、スライドイメージ全体のアノテーションオーバーヘッドを低減する代替ソリューションとして登場した。
これらのSSLアプローチは、識別画像の特徴を学習する際の性能を制限するマルチレゾリューションWSIを扱うために設計されていない。
マルチ解像度WSIから画像特徴を効果的に学習できるDSF-WSI(Dual-branch SSL Framework for WSI tumour segmentation)を提案する。
論文 参考訳(メタデータ) (2023-03-20T10:57:28Z) - Task-specific Fine-tuning via Variational Information Bottleneck for
Weakly-supervised Pathology Whole Slide Image Classification [10.243293283318415]
MIL(Multiple Instance Learning)は、デジタル・パスロジー・ホール・スライド・イメージ(WSI)分類において有望な結果を示している。
本稿では,Information Bottleneck 理論を動機とした効率的な WSI 微調整フレームワークを提案する。
我々のフレームワークは、様々なWSIヘッド上の5つの病理WSIデータセットで評価される。
論文 参考訳(メタデータ) (2023-03-15T08:41:57Z) - Embedding Space Augmentation for Weakly Supervised Learning in
Whole-Slide Images [3.858809922365453]
多重インスタンス学習(MIL)は、WSIレベルのアノテーションからギガピクセル全体スライディングイメージ(WSI)を学習するための広く使われているフレームワークである。
EmbAugmenterは、画素空間ではなく埋め込み空間でデータ拡張を合成できるデータ拡張生成逆数ネットワーク(DA-GAN)である。
提案手法は,MILを改良することなく性能を向上し,MILトレーニングにおける従来のパッチレベルの強化と同等であり,より高速である。
論文 参考訳(メタデータ) (2022-10-31T02:06:39Z) - Learning Representational Invariances for Data-Efficient Action
Recognition [52.23716087656834]
我々は,データ拡張戦略により,Kinetics-100,UCF-101,HMDB-51データセットのパフォーマンスが期待できることを示す。
また,完全な教師付き設定でデータ拡張戦略を検証し,性能向上を実証した。
論文 参考訳(メタデータ) (2021-03-30T17:59:49Z) - Data Augmentation for Meta-Learning [58.47185740820304]
メタ学習アルゴリズムは、各トレーニングステップでデータ、クエリデータ、タスクをサンプリングする。
データ拡張は、クラス毎に利用可能な画像の数を増やすだけでなく、全く新しいクラス/タスクを生成するためにも使用できる。
提案したメタ固有データ拡張は,数ショットの分類ベンチマークにおいて,メタラーナーの性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-10-14T13:48:22Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。