論文の概要: SSiT: Saliency-guided Self-supervised Image Transformer for Diabetic
Retinopathy Grading
- arxiv url: http://arxiv.org/abs/2210.10969v5
- Date: Tue, 12 Mar 2024 11:59:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 02:34:36.944566
- Title: SSiT: Saliency-guided Self-supervised Image Transformer for Diabetic
Retinopathy Grading
- Title(参考訳): ssit:糖尿病網膜症格付けのための自己教師付き画像トランスフォーマ
- Authors: Yijin Huang, Junyan Lyu, Pujin Cheng, Roger Tam, Xiaoying Tang
- Abstract要約: 基礎画像から評価した糖尿病網膜症に対して, SSiT (Salliency-Guided Self-Supervised Image Transformer) が提案されている。
我々は、ドメイン固有の事前知識による自己教師付き事前学習の指導を目標として、SSLにサリエンシマップを新たに導入する。
- 参考スコア(独自算出の注目度): 2.0790896742002274
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised Learning (SSL) has been widely applied to learn image
representations through exploiting unlabeled images. However, it has not been
fully explored in the medical image analysis field. In this work,
Saliency-guided Self-Supervised image Transformer (SSiT) is proposed for
Diabetic Retinopathy (DR) grading from fundus images. We novelly introduce
saliency maps into SSL, with a goal of guiding self-supervised pre-training
with domain-specific prior knowledge. Specifically, two saliency-guided
learning tasks are employed in SSiT: (1) Saliency-guided contrastive learning
is conducted based on the momentum contrast, wherein fundus images' saliency
maps are utilized to remove trivial patches from the input sequences of the
momentum-updated key encoder. Thus, the key encoder is constrained to provide
target representations focusing on salient regions, guiding the query encoder
to capture salient features. (2) The query encoder is trained to predict the
saliency segmentation, encouraging the preservation of fine-grained information
in the learned representations. To assess our proposed method, four
publicly-accessible fundus image datasets are adopted. One dataset is employed
for pre-training, while the three others are used to evaluate the pre-trained
models' performance on downstream DR grading. The proposed SSiT significantly
outperforms other representative state-of-the-art SSL methods on all downstream
datasets and under various evaluation settings. For example, SSiT achieves a
Kappa score of 81.88% on the DDR dataset under fine-tuning evaluation,
outperforming all other ViT-based SSL methods by at least 9.48%.
- Abstract(参考訳): 自己教師付き学習(ssl)はラベルのない画像を利用して画像表現を学ぶために広く利用されている。
しかし, 医用画像解析分野では完全には研究されていない。
本研究は,糖尿病網膜症 (dr) に対するssit (saliency-guided self-supervised image transformer) の提案である。
我々は,自己教師付き事前学習をドメイン固有の事前知識で導くことを目標として,ssl にサリエンシーマップを導入する。
具体的には,(1) モーメントコントラストに基づいてサラエンシー誘導型コントラスト学習を行い, モーメント更新キーエンコーダの入力シーケンスから自明なパッチを除去するために, 眼底画像のサラエンシーマップを利用する。
したがって、キーエンコーダは、有意な領域に着目したターゲット表現を提供し、クエリエンコーダに有意な特徴を捉えるよう指示する。
2) クエリエンコーダは, 精度のセグメンテーションを予測するために訓練され, 学習した表現の微細な情報保存を促進する。
提案手法を評価するために,4つの公開アクセス可能な基礎画像データセットを採用した。
1つのデータセットが事前トレーニングに使用され、他の3つは、下流DRグレーディングでトレーニング済みモデルのパフォーマンスを評価するために使用される。
提案したSSiTは、ダウンストリームデータセットおよび様々な評価設定下で、他の最先端SSLメソッドよりも大幅に優れている。
例えば、SSiTはDDRデータセットの81.88%のKappaスコアを微調整で達成し、ViTベースのSSLメソッドを少なくとも9.48%上回る。
関連論文リスト
- Leveraging Self-Supervised Learning for Fetal Cardiac Planes Classification using Ultrasound Scan Videos [4.160910038127896]
自己教師付き学習(SSL)メソッドは、限られた注釈付きデータで状況に対処できるので人気がある。
本研究では, 再構成, コントラスト損失, 蒸留, 情報理論に基づく7つのSSL手法について検討し, 大規模な米国データセット上で広く評価する。
我々の第一の観察は、SSLトレーニングでは、データセットの分散がサイズよりも重要であることを示している。
論文 参考訳(メタデータ) (2024-07-31T16:47:21Z) - Intra-video Positive Pairs in Self-Supervised Learning for Ultrasound [65.23740556896654]
自己教師付き学習 (SSL) は, 医療画像におけるラベル付きデータの健全性に対処するための戦略である。
本研究では,同じBモード超音波映像をSSLのペアとして用いた近位画像の利用効果について検討した。
この手法は、従来の超音波特異的比較学習法の平均検査精度を新型コロナウイルスの分類で上回り、IVPP(Intra-Video Positive Pairs)と命名された。
論文 参考訳(メタデータ) (2024-03-12T14:57:57Z) - Learning Self-Supervised Representations for Label Efficient
Cross-Domain Knowledge Transfer on Diabetic Retinopathy Fundus Images [2.796274924103132]
本研究は,糖尿病網膜症 (DR) 画像をドメイン横断設定で分類するための,自己教師付き表現学習に基づく新しいアプローチを提案する。
提案手法は,クロスドメイン設定においても,DR画像の2値化と多値化の最先端化を実現する。
論文 参考訳(メタデータ) (2023-04-20T12:46:34Z) - Rethinking Self-Supervised Visual Representation Learning in
Pre-training for 3D Human Pose and Shape Estimation [57.206129938611454]
自己教師付き表現学習(SSL)法は、オブジェクト検出などの視覚タスクのためのImageNet分類前トレーニングよりも優れている。
我々は、SSLの効果を実証的に研究し分析し、3DHPSEの事前学習方法と比較した。
我々の観察では、現在のSSLの3DHPSEへの初歩的な適用に挑戦し、事前トレーニングの側面において、他のデータ型の価値を啓蒙する。
論文 参考訳(メタデータ) (2023-03-09T16:17:52Z) - Leveraging the Third Dimension in Contrastive Learning [88.17394309208925]
SSL(Self-Supervised Learning)メソッドは、ラベルのないデータでダウンストリームタスクに有用な堅牢な表現を学習する。
これらの拡張は、生物学的ビジョンが没入的な3次元、時間的に連続した環境で起こるという事実を無視している。
SSLフレームワークにディープシグナルを組み込むための2つの異なるアプローチについて検討する。
論文 参考訳(メタデータ) (2023-01-27T15:45:03Z) - Data-Limited Tissue Segmentation using Inpainting-Based Self-Supervised
Learning [3.7931881761831328]
プレテキストタスクを含む自己教師付き学習(SSL)メソッドは、ラベルなしデータを使用したモデルの最初の事前トレーニングによって、この要件を克服する可能性を示している。
ラベル限定シナリオにおけるCTとMRI画像のセグメンテーションにおける2つのSSL手法の有効性を評価する。
最適に訓練され,実装が容易なSSLセグメンテーションモデルは,ラベル制限シナリオにおけるMRIおよびCT組織セグメンテーションの古典的な手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-14T16:34:05Z) - PCA: Semi-supervised Segmentation with Patch Confidence Adversarial
Training [52.895952593202054]
医用画像セグメンテーションのためのPatch Confidence Adrial Training (PCA) と呼ばれる半教師付き対向法を提案する。
PCAは各パッチの画素構造とコンテキスト情報を学習し、十分な勾配フィードバックを得る。
本手法は, 医用画像のセグメンテーションにおいて, 最先端の半教師付き手法より優れており, その有効性を示している。
論文 参考訳(メタデータ) (2022-07-24T07:45:47Z) - Semantic-aware Dense Representation Learning for Remote Sensing Image
Change Detection [20.761672725633936]
ディープラーニングに基づく変化検出モデルのトレーニングはラベル付きデータに大きく依存する。
最近のトレンドは、リモートセンシング(RS)データを使用して、教師付きまたは自己教師型学習(SSL)を通じてドメイン内表現を取得することである。
複数のクラスバランス点をサンプリングし,RS画像CDに対する意味認識事前学習を提案する。
論文 参考訳(メタデータ) (2022-05-27T06:08:33Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z) - Deep Q-Network-Driven Catheter Segmentation in 3D US by Hybrid
Constrained Semi-Supervised Learning and Dual-UNet [74.22397862400177]
本稿では,教師付き学習手法よりも少ないアノテーションを要求できる新しいカテーテルセグメンテーション手法を提案する。
提案手法では,Voxelレベルのアノテーションを避けるために,深層Q学習を事前局所化ステップとみなす。
検出されたカテーテルでは、パッチベースのDual-UNetを使用してカテーテルを3Dボリュームデータに分割する。
論文 参考訳(メタデータ) (2020-06-25T21:10:04Z) - Contrastive learning of global and local features for medical image
segmentation with limited annotations [10.238403787504756]
教師付きディープラーニングの成功のための重要な要件は、大きなラベル付きデータセットである。
半教師付き環境での医用画像のセグメンテーションのためのコントラスト学習フレームワークの拡張戦略を提案する。
限定的なアノテーション設定では、提案手法は、他の自己超越的および半教師付き学習技術と比較して大幅に改善される。
論文 参考訳(メタデータ) (2020-06-18T13:31:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。