Fugu-MT 論文翻訳(概要): PCRLv2: A Unified Visual Information Preservation Framework for Self-supervised Pre-training in Medical Image Analysis

論文の概要: PCRLv2: A Unified Visual Information Preservation Framework for Self-supervised Pre-training in Medical Image Analysis

arxiv url: http://arxiv.org/abs/2301.00772v1
Date: Mon, 2 Jan 2023 17:47:27 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-03 14:16:22.324911
Title: PCRLv2: A Unified Visual Information Preservation Framework for Self-supervised Pre-training in Medical Image Analysis
Title（参考訳）: PCRLv2:医用画像解析における自己教師付き事前学習のための統合視覚情報保存フレームワーク
Authors: Hong-Yu Zhou, Chixiang Lu, Chaoqi Chen, Sibei Yang, Yizhou Yu
Abstract要約: 本稿では,ピクセルレベルの情報を高レベルなセマンティクスに明示的にエンコードするための画素復元タスクを提案する。また,画像理解を支援する強力なツールであるスケール情報の保存についても検討する。提案されている統合SSLフレームワークは、さまざまなタスクで自己管理されたフレームワークを超越している。
参考スコア（独自算出の注目度）: 56.63327669853693
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent advances in self-supervised learning (SSL) in computer vision are primarily comparative, whose goal is to preserve invariant and discriminative semantics in latent representations by comparing siamese image views. However, the preserved high-level semantics do not contain enough local information, which is vital in medical image analysis (e.g., image-based diagnosis and tumor segmentation). To mitigate the locality problem of comparative SSL, we propose to incorporate the task of pixel restoration for explicitly encoding more pixel-level information into high-level semantics. We also address the preservation of scale information, a powerful tool in aiding image understanding but has not drawn much attention in SSL. The resulting framework can be formulated as a multi-task optimization problem on the feature pyramid. Specifically, we conduct multi-scale pixel restoration and siamese feature comparison in the pyramid. In addition, we propose non-skip U-Net to build the feature pyramid and develop sub-crop to replace multi-crop in 3D medical imaging. The proposed unified SSL framework (PCRLv2) surpasses its self-supervised counterparts on various tasks, including brain tumor segmentation (BraTS 2018), chest pathology identification (ChestX-ray, CheXpert), pulmonary nodule detection (LUNA), and abdominal organ segmentation (LiTS), sometimes outperforming them by large margins with limited annotations.
Abstract（参考訳）: コンピュータビジョンにおける近年の自己教師付き学習(ssl)の進歩は、siamのイメージビューを比較することによって、潜在表現における不変性と識別的意味論を保存することを目的としている。しかし、保存された高レベルセマンティクスには十分な局所情報が含まれておらず、医療画像解析(画像に基づく診断や腫瘍の分節化など)に不可欠である。比較SSLの局所性問題を緩和するために,よりピクセルレベルの情報を高レベルの意味論に明示的にエンコードするための画素復元タスクを提案する。また,画像理解を支援する強力なツールであるスケール情報の保存にも取り組んでいるが,sslではそれほど注目されていない。得られたフレームワークは、特徴ピラミッド上のマルチタスク最適化問題として定式化することができる。具体的には,ピラミッドのマルチスケール画素復元とシアムの特徴比較を行う。さらに,機能ピラミッドの構築と3次元医用イメージングにおけるマルチクロップに代わるサブクロップの開発のために,ノンスキップのu-netを提案する。提案された統合SSLフレームワーク(PCRLv2)は、脳腫瘍のセグメンテーション(BraTS 2018)、胸部病理診断(ChestX-ray、CheXpert)、肺結節検出(LUNA)、腹部臓器のセグメンテーション(LiTS)など、様々なタスクにおいて自己監督されたフレームワークを超越し、時にはアノテーションを限定した大きなマージンでそれらを上回る。

関連論文リスト

Multimodal Visual Surrogate Compression for Alzheimer's Disease Classification [69.87877580725768]
MVSC(Multimodal Visual Surrogate Compression)は、大規模な3D sMRIボリュームをコンパクトな2D機能に圧縮し、適応させることを学ぶ。 MVSCには2つの重要なコンポーネントがある: テキストガイダンスの下でグローバルなクロススライスコンテキストをキャプチャするボリュームコンテキストと、テキストエンハンスでパッチワイズな方法でスライスレベルの情報を集約するAdaptive Slice Fusionモジュール。
論文参考訳（メタデータ） (2026-01-29T13:05:46Z)
MIRAM: Masked Image Reconstruction Across Multiple Scales for Breast Lesion Risk Prediction [2.0199924721373392]
Masked Image Modeling (MIM) はより強力なSSL技術として登場した。本稿では,より困難なプリテキストタスクを中心に,スケーラブルで実用的なSSLアプローチを提案する。我々の仮説は、高解像度画像の再構成により、より微細な空間的詳細に対応することができるというものである。
論文参考訳（メタデータ） (2025-03-10T10:32:55Z)
Enhanced Self-supervised Learning for Multi-modality MRI Segmentation and Classification: A Novel Approach Avoiding Model Collapse [6.3467517115551875]
多モードMRI(Multi-modality magnetic resonance imaging)は、コンピュータ支援診断のための補完的な情報を提供する。従来のディープラーニングアルゴリズムは、病変をセグメント化し、磁気共鳴画像で疾患を分類する特定の解剖学的構造を特定するのに適している。自己教師付き学習(SSL)は、事前学習によりラベル付きデータから特徴表現を効果的に学習することができ、自然画像解析に有効であることが示されている。ほとんどのSSLメソッドはマルチモードMRIの類似性を無視し、モデルが崩壊する。ハイブリッドマスクパターン(HMP)とピラミッドバーローツイン(PBT)を組み合わせた多モードMRIマスク自動エンコーダの確立と検証を行った。
論文参考訳（メタデータ） (2024-07-15T01:11:30Z)
OPTiML: Dense Semantic Invariance Using Optimal Transport for Self-Supervised Medical Image Representation [6.4136876268620115]
自己教師付き学習(SSL)は、アノテーションなしで学習できることから、医用画像解析の有望な技術として登場した。本稿では, 最適トランスポート(OT)を用いたSSLフレームワークOPTiMLを導入し, 密接なセマンティック不変性と細粒度の詳細を捉える。実験の結果,OPTiMLはすべての評価課題において最先端の手法よりも優れていることがわかった。
論文参考訳（メタデータ） (2024-04-18T02:59:48Z)
SM2C: Boost the Semi-supervised Segmentation for Medical Image by using Meta Pseudo Labels and Mixed Images [13.971120210536995]
医用画像のセマンティックな特徴を学習する能力を向上させるために,SM2C(Scaling-up Mix with Multi-Class)を導入した。セグメンテーションオブジェクトの形状を多様化し、各サンプル内の意味情報を豊かにすることにより、SM2Cはそのポテンシャルを示す。提案したフレームワークは、最先端のフレームワークよりも大幅に改善されている。
論文参考訳（メタデータ） (2024-03-24T04:39:40Z)
Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文参考訳（メタデータ） (2023-12-26T12:56:31Z)
Disruptive Autoencoders: Leveraging Low-level features for 3D Medical Image Pre-training [51.16994853817024]
本研究は、3Dラジオグラフィ画像のための効果的な事前学習フレームワークの設計に焦点をあてる。ローカルマスキングと低レベルの摂動の組み合わせによって生成された破壊から、オリジナルのイメージを再構築しようとする事前トレーニングフレームワークであるDisruptive Autoencodersを紹介する。提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-07-31T17:59:42Z)
Multi-View Vertebra Localization and Identification from CT Images [57.56509107412658]
我々は,CT画像からの多視点椎体局在と同定を提案する。本研究では,3次元問題を異なる視点における2次元局所化および識別タスクに変換する。本手法は,多視点グローバル情報を自然に学習することができる。
論文参考訳（メタデータ） (2023-07-24T14:43:07Z)
M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文参考訳（メタデータ） (2023-03-20T06:26:49Z)
Attentive Symmetric Autoencoder for Brain MRI Segmentation [56.02577247523737]
視覚変換器(ViT)をベースとした3次元脳MRIセグメンテーションタスクのための新しいアテンテーティブシンメトリオートエンコーダを提案する。事前学習の段階では、提案するオートエンコーダがより注意を払って、勾配測定値に従って情報パッチを再構築する。実験の結果,提案手法は最先端の自己教師付き学習法や医用画像分割モデルよりも優れていた。
論文参考訳（メタデータ） (2022-09-19T09:43:19Z)
Self-supervised 3D anatomy segmentation using self-distilled masked image transformer (SMIT) [2.7298989068857487]
自己教師型学習は、畳み込みネットワークを用いた医用画像のセグメンテーションに成功している。我々は、我々のアプローチがより正確で、他のプリテキストタスクよりも微調整データセットを少なくする必要があることを示した。
論文参考訳（メタデータ） (2022-05-20T17:55:14Z)
Cross-level Contrastive Learning and Consistency Constraint for Semi-supervised Medical Image Segmentation [46.678279106837294]
半教師型医用画像セグメンテーションにおける局所特徴の表現能力を高めるためのクロスレベルコンストラシティブ学習手法を提案する。クロスレベルなコントラスト学習と一貫性制約の助けを借りて、非ラベル付きデータを効果的に探索してセグメンテーション性能を向上させることができる。
論文参考訳（メタデータ） (2022-02-08T15:12:11Z)
SAR: Scale-Aware Restoration Learning for 3D Tumor Segmentation [23.384259038420005]
3次元腫瘍分割のためのSAR(Scale-Aware Restoration)を提案する。新たなプロキシタスク、すなわちスケール差別は、自己回復タスクと組み合わせて3Dニューラルネットワークを事前訓練するために定式化される。脳腫瘍セグメンテーション(Brain tumor segmentation),すなわち膵腫瘍セグメンテーション(Pancreas tumor segmentation)の2つの課題に対して,本手法の有効性を実証した。
論文参考訳（メタデータ） (2020-10-13T01:23:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。