論文の概要: A Dual-branch Self-supervised Representation Learning Framework for
Tumour Segmentation in Whole Slide Images
- arxiv url: http://arxiv.org/abs/2303.11019v1
- Date: Mon, 20 Mar 2023 10:57:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 15:55:02.995222
- Title: A Dual-branch Self-supervised Representation Learning Framework for
Tumour Segmentation in Whole Slide Images
- Title(参考訳): 全スライド画像におけるTumour Segmentationのためのデュアルブランチ自己教師型表現学習フレームワーク
- Authors: Hao Wang, Euijoon Ahn, Jinman Kim
- Abstract要約: 自己教師付き学習(SSL)は、スライドイメージ全体のアノテーションオーバーヘッドを低減する代替ソリューションとして登場した。
これらのSSLアプローチは、識別画像の特徴を学習する際の性能を制限するマルチレゾリューションWSIを扱うために設計されていない。
マルチ解像度WSIから画像特徴を効果的に学習できるDSF-WSI(Dual-branch SSL Framework for WSI tumour segmentation)を提案する。
- 参考スコア(独自算出の注目度): 12.961686610789416
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Supervised deep learning methods have achieved considerable success in
medical image analysis, owing to the availability of large-scale and
well-annotated datasets. However, creating such datasets for whole slide images
(WSIs) in histopathology is a challenging task due to their gigapixel size. In
recent years, self-supervised learning (SSL) has emerged as an alternative
solution to reduce the annotation overheads in WSIs, as it does not require
labels for training. These SSL approaches, however, are not designed for
handling multi-resolution WSIs, which limits their performance in learning
discriminative image features. In this paper, we propose a Dual-branch SSL
Framework for WSI tumour segmentation (DSF-WSI) that can effectively learn
image features from multi-resolution WSIs. Our DSF-WSI connected two branches
and jointly learnt low and high resolution WSIs in a self-supervised manner.
Moreover, we introduced a novel Context-Target Fusion Module (CTFM) and a
masked jigsaw pretext task to align the learnt multi-resolution features.
Furthermore, we designed a Dense SimSiam Learning (DSL) strategy to maximise
the similarity of different views of WSIs, enabling the learnt representations
to be more efficient and discriminative. We evaluated our method using two
public datasets on breast and liver cancer segmentation tasks. The experiment
results demonstrated that our DSF-WSI can effectively extract robust and
efficient representations, which we validated through subsequent fine-tuning
and semi-supervised settings. Our proposed method achieved better accuracy than
other state-of-the-art approaches. Code is available at
https://github.com/Dylan-H-Wang/dsf-wsi.
- Abstract(参考訳): 教師付きディープラーニングは、大規模かつ注釈付きデータセットが利用可能であることから、医用画像解析でかなりの成功を収めている。
しかしながら、病理組織学におけるスライド画像全体(WSI)に対するそのようなデータセットの作成は、ギガピクセルサイズのため難しい課題である。
近年では、ラベルをトレーニングする必要がないため、WSIのアノテーションオーバーヘッドを減らすための代替ソリューションとして、自己教師型学習(SSL)が登場している。
しかし、これらのSSLアプローチは、識別画像の特徴を学習する際の性能を制限する多重解像度WSIを扱うように設計されていない。
本稿では,多解像度WSIから画像特徴を効果的に学習できるDSF-WSI(Dual-branch SSL Framework for WSI tumour segmentation)を提案する。
DSF-WSIは2つの枝を接続し、低分解能および高分解能のWSIを自己指導的に学習した。
さらに,学習可能なマルチレゾリューション機能を調整するために,新しいコンテキストターゲット融合モジュール(ctfm)とマスク付きjigsawプリテキストタスクを導入した。
さらに,wsisの異なる視点の類似性を最大化し,学習表現をより効率的かつ判別可能な,密なシムシアム学習(dsl)戦略を考案した。
乳腺・肝癌分画課題に関する2つの公開データセットを用いて評価を行った。
実験の結果,DSF-WSIは頑健で効率的な表現を効果的に抽出できることを示した。
提案手法は他の最先端手法よりも精度が高い。
コードはhttps://github.com/dylan-h-wang/dsf-wsiで入手できる。
関連論文リスト
- ViLa-MIL: Dual-scale Vision-Language Multiple Instance Learning for Whole Slide Image Classification [52.405499816861635]
多重インスタンス学習(MIL)ベースのフレームワークは、スライド画像全体(WSI)を処理する上で主流になっている。
スライド画像全体の分類のための2次元視覚言語多言語学習(ViLa-MIL)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-12T13:28:46Z) - Semi-supervised Semantic Segmentation for Remote Sensing Images via Multi-scale Uncertainty Consistency and Cross-Teacher-Student Attention [59.19580789952102]
本稿では,RS画像セマンティックセグメンテーションタスクのための,新しい半教師付きマルチスケール不確かさとクロスTeacher-Student Attention(MUCA)モデルを提案する。
MUCAは、マルチスケールの不確実性整合正則化を導入することにより、ネットワークの異なる層における特徴写像間の整合性を制限する。
MUCAは学生ネットワークの誘導にクロス教師・学生の注意機構を使用し、学生ネットワークにより差別的な特徴表現を構築するよう誘導する。
論文 参考訳(メタデータ) (2025-01-18T11:57:20Z) - DINOv2 based Self Supervised Learning For Few Shot Medical Image
Segmentation [33.471116581196796]
少数のショットセグメンテーションは、限られたラベル付き例から新しいクラスを学ぶ能力を持つモデルを提供することで、有望なソリューションを提供する。
FSSの主要な手法はALPNetで、クエリイメージと数少ないサポートセグメントイメージの機能を比較する。
本研究は, 高性能化だけでなく, より堅牢で適応可能な医用画像解析の道を開く, 少数ショットセグメンテーションへの新たなアプローチを提案する。
論文 参考訳(メタデータ) (2024-03-05T19:13:45Z) - Semi-Mamba-UNet: Pixel-Level Contrastive and Pixel-Level Cross-Supervised Visual Mamba-based UNet for Semi-Supervised Medical Image Segmentation [11.637738540262797]
本研究では,従来のCNNベースのUNetと純粋に視覚的なMambaベースのエンコーダデコーダアーキテクチャを組み込んだセミマンバUNetを,半教師付き学習フレームワークに統合する。
この革新的なSSLアプローチは、両方のネットワークを利用して擬似ラベルを生成し、ピクセルレベルで相互に相互に監督する。
本稿では,2対のプロジェクタを用いた自己教師型画素レベルのコントラスト学習戦略を導入し,特徴学習機能をさらに強化する。
論文 参考訳(メタデータ) (2024-02-11T17:09:21Z) - CMID: A Unified Self-Supervised Learning Framework for Remote Sensing
Image Understanding [20.2438336674081]
CMID(Contrastive Mask Image Distillation)は,大域的意味分離性と局所空間認識性の両方で表現を学習することができる。
CMIDは畳み込みニューラルネットワーク(CNN)と視覚変換器(ViT)の両方と互換性がある
CMIDを用いて事前訓練されたモデルは、複数のダウンストリームタスクにおける他の最先端SSLメソッドよりも優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-04-19T13:58:31Z) - Localized Region Contrast for Enhancing Self-Supervised Learning in
Medical Image Segmentation [27.82940072548603]
本稿では,地域コントラスト(LRC)を統合した新しいコントラスト学習フレームワークを提案する。
提案手法では,Felzenszwalbのアルゴリズムによるスーパーピクセルの同定と,新しいコントラッシブサンプリング損失を用いた局所コントラスト学習を行う。
論文 参考訳(メタデータ) (2023-04-06T22:43:13Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and
Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。
SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。
Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文 参考訳(メタデータ) (2022-03-19T09:19:55Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - Spatial-Temporal Multi-Cue Network for Continuous Sign Language
Recognition [141.24314054768922]
本稿では、視覚に基づくシーケンス学習問題を解決するために、時空間マルチキュー(STMC)ネットワークを提案する。
有効性を検証するため、3つの大規模CSLRベンチマークで実験を行った。
論文 参考訳(メタデータ) (2020-02-08T15:38:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。