論文の概要: Task-specific Fine-tuning via Variational Information Bottleneck for
Weakly-supervised Pathology Whole Slide Image Classification
- arxiv url: http://arxiv.org/abs/2303.08446v1
- Date: Wed, 15 Mar 2023 08:41:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-16 14:29:38.521689
- Title: Task-specific Fine-tuning via Variational Information Bottleneck for
Weakly-supervised Pathology Whole Slide Image Classification
- Title(参考訳): 弱教師付き病理画像分類のための変分情報ボトルネックによるタスク特異的微調整
- Authors: Honglin Li, Chenglu Zhu, Yunlong Zhang, Yuxuan Sun, Zhongyi Shui,
Wenwei Kuang, Sunyi Zheng, Lin Yang
- Abstract要約: MIL(Multiple Instance Learning)は、デジタル・パスロジー・ホール・スライド・イメージ(WSI)分類において有望な結果を示している。
本稿では,Information Bottleneck 理論を動機とした効率的な WSI 微調整フレームワークを提案する。
我々のフレームワークは、様々なWSIヘッド上の5つの病理WSIデータセットで評価される。
- 参考スコア(独自算出の注目度): 10.243293283318415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While Multiple Instance Learning (MIL) has shown promising results in digital
Pathology Whole Slide Image (WSI) classification, such a paradigm still faces
performance and generalization problems due to challenges in high computational
costs on Gigapixel WSIs and limited sample size for model training. To deal
with the computation problem, most MIL methods utilize a frozen pretrained
model from ImageNet to obtain representations first. This process may lose
essential information owing to the large domain gap and hinder the
generalization of model due to the lack of image-level training-time
augmentations. Though Self-supervised Learning (SSL) proposes viable
representation learning schemes, the improvement of the downstream task still
needs to be further explored in the conversion from the task-agnostic features
of SSL to the task-specifics under the partial label supervised learning. To
alleviate the dilemma of computation cost and performance, we propose an
efficient WSI fine-tuning framework motivated by the Information Bottleneck
theory. The theory enables the framework to find the minimal sufficient
statistics of WSI, thus supporting us to fine-tune the backbone into a
task-specific representation only depending on WSI-level weak labels. The
WSI-MIL problem is further analyzed to theoretically deduce our fine-tuning
method. Our framework is evaluated on five pathology WSI datasets on various
WSI heads. The experimental results of our fine-tuned representations show
significant improvements in both accuracy and generalization compared with
previous works. Source code will be available at
https://github.com/invoker-LL/WSI-finetuning.
- Abstract(参考訳): 複数インスタンス学習 (mil) は、デジタル病理学全体のスライド画像分類 (wsi) において有望な結果を示しているが、gigapixel wsisの計算コストの高い問題やモデルトレーニングのためのサンプルサイズが限られているため、これらのパラダイムは依然として性能と一般化の問題に直面している。
計算問題に対処するため、ほとんどのMILメソッドはImageNetから凍結した事前学習モデルを用いてまず表現を得る。
このプロセスは、大きなドメインギャップによる必須情報を失い、画像レベルのトレーニング時間拡張が欠如しているため、モデルの一般化を妨げる可能性がある。
自己教師あり学習(ssl)は実行可能な表現学習方式を提案するが、sslのタスクに依存しない機能から部分ラベル教師あり学習のタスク固有機能への変換において、下流タスクの改善をさらに検討する必要がある。
計算コストと性能のジレンマを軽減するため,Information Bottleneck理論によって動機付けられた効率的なWSI微調整フレームワークを提案する。
この理論により、フレームワークは、wsiの最小限の統計量を見つけることができるので、wsiレベルの弱いラベルのみに応じて、バックボーンをタスク固有の表現に微調整できる。
さらにWSI-MIL問題を解析し,提案手法を理論的に導出する。
我々のフレームワークは、様々なWSIヘッド上の5つの病理WSIデータセットで評価される。
微調整表現実験の結果,従来の作品に比べて精度と一般化が有意に向上した。
ソースコードはhttps://github.com/invoker-ll/wsi-finetuningで入手できる。
関連論文リスト
- Giga-SSL: Self-Supervised Learning for Gigapixel Images [0.8029049649310211]
全スライド画像(WSI)は、医療現場で診断と治療のために定期的に準備された染色組織スライドの顕微鏡画像である。
現在の最先端(SoTA)アプローチでは、WSIはそれらをタイルに分類し、事前訓練されたネットワークでエンコードし、MIL(Multiple Instance Learning)を適用して、特定の下流タスクのトレーニングを行います。
本稿では,強力なスライド表現を推論するアノテーションを使わずに,多数のWSIを活用するためのスライドレベルSSLの戦略を提案する。
論文 参考訳(メタデータ) (2022-12-06T19:09:19Z) - Hierarchical Transformer for Survival Prediction Using Multimodality
Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。
本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。
より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文 参考訳(メタデータ) (2022-11-29T23:47:56Z) - Language models are good pathologists: using attention-based sequence
reduction and text-pretrained transformers for efficient WSI classification [0.6091702876917279]
全体スライド画像(WSI)解析は通常、多重インスタンス学習(MIL)問題として定式化される。
本稿では,WSI分類への標準,凍結,テキスト事前学習,トランスフォーマ言語モデルの適用を実演する。
論文 参考訳(メタデータ) (2022-11-14T14:11:31Z) - Learning Binary and Sparse Permutation-Invariant Representations for
Fast and Memory Efficient Whole Slide Image Search [3.2580463372881234]
本稿では, 深層生成モデルとフィッシャーベクトルを用いて, バイナリおよびスパースWSI表現を学習するための新しいフレームワークを提案する。
本稿では、インスタンスベーストレーニングを用いたスパースと二分置換不変WSI表現を学習するための新しい損失関数を提案する。
提案手法は, 検索精度と速度の両面で, ヨッティクセル(最近の病理画像検索エンジン)より優れていた。
論文 参考訳(メタデータ) (2022-08-29T14:56:36Z) - ClusTR: Exploring Efficient Self-attention via Clustering for Vision
Transformers [70.76313507550684]
本稿では,密集自己注意の代替として,コンテンツに基づくスパースアテンション手法を提案する。
具体的には、合計トークン数を減少させるコンテンツベースの方法として、キーとバリュートークンをクラスタ化し、集約する。
結果として得られたクラスタ化されたTokenシーケンスは、元の信号のセマンティックな多様性を保持するが、より少ない計算コストで処理できる。
論文 参考訳(メタデータ) (2022-08-28T04:18:27Z) - Pay Attention with Focus: A Novel Learning Scheme for Classification of
Whole Slide Images [8.416553728391309]
スライド画像全体(WSI)を解析するための新しい2段階アプローチを提案する。
まず、WSIから代表パッチ(モザイクと呼ばれる)を抽出する。
モザイクの各パッチは、ディープネットワークを用いて特徴ベクトルに符号化される。
第2段階では、WSIから符号化されたパッチレベルの一連の特徴を用いて、一次診断確率を算出する。
論文 参考訳(メタデータ) (2021-06-11T21:59:02Z) - SUPERB: Speech processing Universal PERformance Benchmark [78.41287216481203]
自然言語処理(NLP)とコンピュータビジョン(CV)の研究を進める上で、SSL(Self-supervised Learning)は不可欠です。
SuperBは、幅広い音声処理タスクで共有モデルのパフォーマンスをベンチマークするためのリーダーボードです。
凍結共有モデル上にタスク特化軽量予測ヘッドを学習することで、SUPERBタスクを解決するためのシンプルなフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-03T17:51:09Z) - Exploiting Invariance in Training Deep Neural Networks [4.169130102668252]
動物視覚システムの2つの基本的なメカニズムに触発され、ディープニューラルネットワークのトレーニングに不変性を与える特徴変換技術を紹介します。
結果として得られるアルゴリズムはパラメータチューニングを少なくし、初期学習率1.0でうまくトレーニングし、異なるタスクに簡単に一般化する。
ImageNet、MS COCO、Cityscapesデータセットでテストされた当社の提案手法は、トレーニングにより少ないイテレーションを必要とし、すべてのベースラインを大きなマージンで上回り、小規模および大規模のバッチサイズのトレーニングをシームレスに行い、画像分類、オブジェクト検出、セマンティックセグメンテーションの異なるコンピュータビジョンタスクに適用します。
論文 参考訳(メタデータ) (2021-03-30T19:18:31Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。