論文の概要: Disruptive Autoencoders: Leveraging Low-level features for 3D Medical
Image Pre-training
- arxiv url: http://arxiv.org/abs/2307.16896v1
- Date: Mon, 31 Jul 2023 17:59:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-01 13:04:07.027290
- Title: Disruptive Autoencoders: Leveraging Low-level features for 3D Medical
Image Pre-training
- Title(参考訳): ディスラプティブオートエンコーダ:3次元医用画像事前トレーニングのための低レベル機能を活用する
- Authors: Jeya Maria Jose Valanarasu, Yucheng Tang, Dong Yang, Ziyue Xu, Can
Zhao, Wenqi Li, Vishal M. Patel, Bennett Landman, Daguang Xu, Yufan He,
Vishwesh Nath
- Abstract要約: 本研究は、3Dラジオグラフィ画像のための効果的な事前学習フレームワークの設計に焦点をあてる。
ローカルマスキングと低レベルの摂動の組み合わせによって生成された破壊から、オリジナルのイメージを再構築しようとする事前トレーニングフレームワークであるDisruptive Autoencodersを紹介する。
提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 51.16994853817024
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Harnessing the power of pre-training on large-scale datasets like ImageNet
forms a fundamental building block for the progress of representation
learning-driven solutions in computer vision. Medical images are inherently
different from natural images as they are acquired in the form of many
modalities (CT, MR, PET, Ultrasound etc.) and contain granulated information
like tissue, lesion, organs etc. These characteristics of medical images
require special attention towards learning features representative of local
context. In this work, we focus on designing an effective pre-training
framework for 3D radiology images. First, we propose a new masking strategy
called local masking where the masking is performed across channel embeddings
instead of tokens to improve the learning of local feature representations. We
combine this with classical low-level perturbations like adding noise and
downsampling to further enable low-level representation learning. To this end,
we introduce Disruptive Autoencoders, a pre-training framework that attempts to
reconstruct the original image from disruptions created by a combination of
local masking and low-level perturbations. Additionally, we also devise a
cross-modal contrastive loss (CMCL) to accommodate the pre-training of multiple
modalities in a single framework. We curate a large-scale dataset to enable
pre-training of 3D medical radiology images (MRI and CT). The proposed
pre-training framework is tested across multiple downstream tasks and achieves
state-of-the-art performance. Notably, our proposed method tops the public test
leaderboard of BTCV multi-organ segmentation challenge.
- Abstract(参考訳): ImageNetのような大規模データセットでの事前トレーニングのパワーを損なうことは、コンピュータビジョンにおける表現学習駆動ソリューションの進歩のための基本的なビルディングブロックを形成する。
医用画像は、多くのモダリティ(CT、MR、PET、超音波など)の形で取得され、組織、病変、臓器などの顆粒化情報を含むため、自然画像とは本質的に異なる。
これらの医用画像の特徴は、局所的な文脈を表す学習特徴に特に注意が必要である。
本研究では,3次元放射線画像のための効果的な事前学習フレームワークの設計に着目する。
まず、局所的な特徴表現の学習を改善するために、トークンの代わりにチャネル埋め込みでマスキングを行うローカルマスキングと呼ばれる新しいマスキング戦略を提案する。
これを、ノイズやダウンサンプリングなどの古典的な低レベルの摂動と組み合わせることで、低レベルの表現学習を可能にします。
この目的のために,局所マスキングと低レベルの摂動の組み合わせによって生成された破壊からオリジナルイメージを再構築しようとする,事前学習フレームワークであるdisruptionive autoencodersを紹介する。
さらに,複数のモダリティの事前学習に対応するために,cmcl(cross-modal contrastive loss)を考案する。
我々は,3次元医用放射線画像(MRI,CT)の事前トレーニングを可能にするために,大規模データセットをキュレートする。
提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
特に,提案手法は,btcvマルチオーガンセグメンテーションチャレンジの公開テストリーダボードを上回っている。
関連論文リスト
- Discriminative Hamiltonian Variational Autoencoder for Accurate Tumor Segmentation in Data-Scarce Regimes [2.8498944632323755]
医用画像分割のためのエンドツーエンドハイブリッドアーキテクチャを提案する。
ハミルトン変分オートエンコーダ(HVAE)と識別正則化を用いて生成画像の品質を向上する。
我々のアーキテクチャはスライス・バイ・スライス・ベースで3Dボリュームを分割し、リッチな拡張データセットをカプセル化する。
論文 参考訳(メタデータ) (2024-06-17T15:42:08Z) - See Through Their Minds: Learning Transferable Neural Representation from Cross-Subject fMRI [32.40827290083577]
機能的磁気共鳴イメージング(fMRI)からの視覚内容の解読は、人間の視覚系を照らすのに役立つ。
従来のアプローチは主に、トレーニングサンプルサイズに敏感な、主題固有のモデルを採用していた。
本稿では,fMRIデータを統合表現にマッピングするための,サブジェクト固有の浅層アダプタを提案する。
トレーニング中,マルチモーダル脳復号における視覚的・テキスト的監督の両面を活用する。
論文 参考訳(メタデータ) (2024-03-11T01:18:49Z) - Enhancing Weakly Supervised 3D Medical Image Segmentation through
Probabilistic-aware Learning [52.249748801637196]
3次元医用画像のセグメンテーションは、疾患の診断と治療計画に重要な意味を持つ課題である。
近年の深層学習の進歩は、完全に教師付き医療画像のセグメンテーションを著しく強化している。
本稿では,3次元医用画像に特化して設計された,確率的適応型弱教師付き学習パイプラインを提案する。
論文 参考訳(メタデータ) (2024-03-05T00:46:53Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Forward-Forward Contrastive Learning [4.465144120325802]
医用画像分類のための新しい事前学習手法として,前向きコントラスト学習(FFCL)を提案する。
FFCLは、肺炎分類タスクにおける既存の事前訓練モデルよりも、ImageNet Pretrained ResNet-18よりも3.69%の精度で性能が向上している。
論文 参考訳(メタデータ) (2023-05-04T15:29:06Z) - HybridMIM: A Hybrid Masked Image Modeling Framework for 3D Medical Image
Segmentation [29.15746532186427]
HybridMIMは3次元医用画像セグメンテーションのためのマスク付き画像モデリングに基づく新しいハイブリッド自己教師型学習手法である。
医用画像の意味情報を3段階に分けて学習し,1)3次元画像の重要な内容を再構成する部分領域予測を行うことにより,トレーニング前の時間負担を大幅に軽減する。
提案するフレームワークは,エンコーダバックボーンとしてCNNとトランスフォーマーの両方をサポートするとともに,イメージセグメンテーションのためのデコーダの事前トレーニングも可能である。
論文 参考訳(メタデータ) (2023-03-18T04:43:12Z) - Attentive Symmetric Autoencoder for Brain MRI Segmentation [56.02577247523737]
視覚変換器(ViT)をベースとした3次元脳MRIセグメンテーションタスクのための新しいアテンテーティブシンメトリオートエンコーダを提案する。
事前学習の段階では、提案するオートエンコーダがより注意を払って、勾配測定値に従って情報パッチを再構築する。
実験の結果,提案手法は最先端の自己教師付き学習法や医用画像分割モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T09:43:19Z) - Intelligent Masking: Deep Q-Learning for Context Encoding in Medical
Image Analysis [48.02011627390706]
我々は,対象地域を排除し,事前訓練の手順を改善する,新たな自己指導型アプローチを開発した。
予測モデルに対してエージェントを訓練することで、下流の分類タスクで抽出した意味的特徴を大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-03-25T19:05:06Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。