論文の概要: PCRLv2: A Unified Visual Information Preservation Framework for
Self-supervised Pre-training in Medical Image Analysis
- arxiv url: http://arxiv.org/abs/2301.00772v1
- Date: Mon, 2 Jan 2023 17:47:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 14:16:22.324911
- Title: PCRLv2: A Unified Visual Information Preservation Framework for
Self-supervised Pre-training in Medical Image Analysis
- Title(参考訳): PCRLv2:医用画像解析における自己教師付き事前学習のための統合視覚情報保存フレームワーク
- Authors: Hong-Yu Zhou, Chixiang Lu, Chaoqi Chen, Sibei Yang, Yizhou Yu
- Abstract要約: 本稿では,ピクセルレベルの情報を高レベルなセマンティクスに明示的にエンコードするための画素復元タスクを提案する。
また,画像理解を支援する強力なツールであるスケール情報の保存についても検討する。
提案されている統合SSLフレームワークは、さまざまなタスクで自己管理されたフレームワークを超越している。
- 参考スコア(独自算出の注目度): 56.63327669853693
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in self-supervised learning (SSL) in computer vision are
primarily comparative, whose goal is to preserve invariant and discriminative
semantics in latent representations by comparing siamese image views. However,
the preserved high-level semantics do not contain enough local information,
which is vital in medical image analysis (e.g., image-based diagnosis and tumor
segmentation). To mitigate the locality problem of comparative SSL, we propose
to incorporate the task of pixel restoration for explicitly encoding more
pixel-level information into high-level semantics. We also address the
preservation of scale information, a powerful tool in aiding image
understanding but has not drawn much attention in SSL. The resulting framework
can be formulated as a multi-task optimization problem on the feature pyramid.
Specifically, we conduct multi-scale pixel restoration and siamese feature
comparison in the pyramid. In addition, we propose non-skip U-Net to build the
feature pyramid and develop sub-crop to replace multi-crop in 3D medical
imaging. The proposed unified SSL framework (PCRLv2) surpasses its
self-supervised counterparts on various tasks, including brain tumor
segmentation (BraTS 2018), chest pathology identification (ChestX-ray,
CheXpert), pulmonary nodule detection (LUNA), and abdominal organ segmentation
(LiTS), sometimes outperforming them by large margins with limited annotations.
- Abstract(参考訳): コンピュータビジョンにおける近年の自己教師付き学習(ssl)の進歩は、siamのイメージビューを比較することによって、潜在表現における不変性と識別的意味論を保存することを目的としている。
しかし、保存された高レベルセマンティクスには十分な局所情報が含まれておらず、医療画像解析(画像に基づく診断や腫瘍の分節化など)に不可欠である。
比較SSLの局所性問題を緩和するために,よりピクセルレベルの情報を高レベルの意味論に明示的にエンコードするための画素復元タスクを提案する。
また,画像理解を支援する強力なツールであるスケール情報の保存にも取り組んでいるが,sslではそれほど注目されていない。
得られたフレームワークは、特徴ピラミッド上のマルチタスク最適化問題として定式化することができる。
具体的には,ピラミッドのマルチスケール画素復元とシアムの特徴比較を行う。
さらに,機能ピラミッドの構築と3次元医用イメージングにおけるマルチクロップに代わるサブクロップの開発のために,ノンスキップのu-netを提案する。
提案された統合SSLフレームワーク(PCRLv2)は、脳腫瘍のセグメンテーション(BraTS 2018)、胸部病理診断(ChestX-ray、CheXpert)、肺結節検出(LUNA)、腹部臓器のセグメンテーション(LiTS)など、様々なタスクにおいて自己監督されたフレームワークを超越し、時にはアノテーションを限定した大きなマージンでそれらを上回る。
関連論文リスト
- Semi-Mamba-UNet: Pixel-Level Contrastive Cross-Supervised Visual
Mamba-based UNet for Semi-Supervised Medical Image Segmentation [13.748446415530937]
本稿では,視覚的マンバベースUNetアーキテクチャを従来のUNetと統合したセミマンバUNetを,半教師付き学習(SSL)フレームワークに導入する。
一般に公開されているMRI心筋セグメンテーションデータセットの総合的評価は,Semi-Mamba-UNetの優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-11T17:09:21Z) - Disruptive Autoencoders: Leveraging Low-level features for 3D Medical
Image Pre-training [51.16994853817024]
本研究は、3Dラジオグラフィ画像のための効果的な事前学習フレームワークの設計に焦点をあてる。
ローカルマスキングと低レベルの摂動の組み合わせによって生成された破壊から、オリジナルのイメージを再構築しようとする事前トレーニングフレームワークであるDisruptive Autoencodersを紹介する。
提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-07-31T17:59:42Z) - Multi-View Vertebra Localization and Identification from CT Images [57.56509107412658]
我々は,CT画像からの多視点椎体局在と同定を提案する。
本研究では,3次元問題を異なる視点における2次元局所化および識別タスクに変換する。
本手法は,多視点グローバル情報を自然に学習することができる。
論文 参考訳(メタデータ) (2023-07-24T14:43:07Z) - M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical
Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2023-03-20T06:26:49Z) - CUTS: A Framework for Multigranular Unsupervised Medical Image
Segmentation [8.61996430447827]
医用画像セグメンテーションのための完全教師なしディープラーニングフレームワークCUTS(Contrastive and Unsupervised Training for Multi-granular Medical Image)を提案する。
まず、画像内コントラスト損失と局所パッチ再構築の目的により、画像特異的な埋め込みマップを生成する。
網膜基底画像と2種類の脳MRI画像にCUTSを適用して、異なるスケールで構造やパターンを規定する。
論文 参考訳(メタデータ) (2022-09-23T01:09:06Z) - Attentive Symmetric Autoencoder for Brain MRI Segmentation [56.02577247523737]
視覚変換器(ViT)をベースとした3次元脳MRIセグメンテーションタスクのための新しいアテンテーティブシンメトリオートエンコーダを提案する。
事前学習の段階では、提案するオートエンコーダがより注意を払って、勾配測定値に従って情報パッチを再構築する。
実験の結果,提案手法は最先端の自己教師付き学習法や医用画像分割モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T09:43:19Z) - Self-supervised 3D anatomy segmentation using self-distilled masked
image transformer (SMIT) [2.7298989068857487]
自己教師型学習は、畳み込みネットワークを用いた医用画像のセグメンテーションに成功している。
我々は、我々のアプローチがより正確で、他のプリテキストタスクよりも微調整データセットを少なくする必要があることを示した。
論文 参考訳(メタデータ) (2022-05-20T17:55:14Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Cross-level Contrastive Learning and Consistency Constraint for
Semi-supervised Medical Image Segmentation [46.678279106837294]
半教師型医用画像セグメンテーションにおける局所特徴の表現能力を高めるためのクロスレベルコンストラシティブ学習手法を提案する。
クロスレベルなコントラスト学習と一貫性制約の助けを借りて、非ラベル付きデータを効果的に探索してセグメンテーション性能を向上させることができる。
論文 参考訳(メタデータ) (2022-02-08T15:12:11Z) - SAR: Scale-Aware Restoration Learning for 3D Tumor Segmentation [23.384259038420005]
3次元腫瘍分割のためのSAR(Scale-Aware Restoration)を提案する。
新たなプロキシタスク、すなわちスケール差別は、自己回復タスクと組み合わせて3Dニューラルネットワークを事前訓練するために定式化される。
脳腫瘍セグメンテーション(Brain tumor segmentation),すなわち膵腫瘍セグメンテーション(Pancreas tumor segmentation)の2つの課題に対して,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2020-10-13T01:23:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。