論文の概要: 3D Self-Supervised Methods for Medical Imaging
- arxiv url: http://arxiv.org/abs/2006.03829v3
- Date: Mon, 2 Nov 2020 10:43:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 21:44:35.616684
- Title: 3D Self-Supervised Methods for Medical Imaging
- Title(参考訳): 医用画像の3次元自己監督法
- Authors: Aiham Taleb, Winfried Loetzsch, Noel Danz, Julius Severin, Thomas
Gaertner, Benjamin Bergner, and Christoph Lippert
- Abstract要約: 本稿では,プロキシタスクの形式で,5種類の自己教師型手法の3次元バージョンを提案する。
提案手法は,未ラベルの3次元画像からニューラルネットワークの特徴学習を容易にし,専門家のアノテーションに必要なコストを削減することを目的としている。
開発したアルゴリズムは、3D Contrastive Predictive Coding, 3D Rotation Prediction, 3D Jigsaw puzzles, Relative 3D patch location, 3D Exemplar Networkである。
- 参考スコア(独自算出の注目度): 7.65168530693281
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised learning methods have witnessed a recent surge of interest
after proving successful in multiple application fields. In this work, we
leverage these techniques, and we propose 3D versions for five different
self-supervised methods, in the form of proxy tasks. Our methods facilitate
neural network feature learning from unlabeled 3D images, aiming to reduce the
required cost for expert annotation. The developed algorithms are 3D
Contrastive Predictive Coding, 3D Rotation prediction, 3D Jigsaw puzzles,
Relative 3D patch location, and 3D Exemplar networks. Our experiments show that
pretraining models with our 3D tasks yields more powerful semantic
representations, and enables solving downstream tasks more accurately and
efficiently, compared to training the models from scratch and to pretraining
them on 2D slices. We demonstrate the effectiveness of our methods on three
downstream tasks from the medical imaging domain: i) Brain Tumor Segmentation
from 3D MRI, ii) Pancreas Tumor Segmentation from 3D CT, and iii) Diabetic
Retinopathy Detection from 2D Fundus images. In each task, we assess the gains
in data-efficiency, performance, and speed of convergence. Interestingly, we
also find gains when transferring the learned representations, by our methods,
from a large unlabeled 3D corpus to a small downstream-specific dataset. We
achieve results competitive to state-of-the-art solutions at a fraction of the
computational expense. We publish our implementations for the developed
algorithms (both 3D and 2D versions) as an open-source library, in an effort to
allow other researchers to apply and extend our methods on their datasets.
- Abstract(参考訳): 自己教師付き学習手法は、複数のアプリケーション分野で成功した後、近年の関心の高まりを目撃している。
本研究では,これらの手法を応用し,プロキシタスクの形式で,5種類の自己教師付き手法の3次元バージョンを提案する。
提案手法は,未ラベルの3次元画像からニューラルネットワークの特徴学習を容易にする。
開発したアルゴリズムは、3D Contrastive Predictive Coding, 3D Rotation Prediction, 3D Jigsaw puzzles, Relative 3D patch location, 3D Exemplar Networkである。
実験では,3dタスクを用いた事前トレーニングモデルにより,より強力な意味表現が得られ,スクラッチからモデルをトレーニングし2dスライスで事前トレーニングするよりも,下流タスクをより正確かつ効率的に解決できることを示した。
医用画像領域からの下流3つの課題に対する方法の有効性を実証する。
i) 3次元mriによる脳腫瘍の分画
二 膵腫瘍の3次元CTからの分離、及び
三 糖尿病網膜症の2次元眼底画像による検出
各タスクにおいて、データ効率、性能、収束速度の利得を評価する。
興味深いことに、学習した表現を大きなラベルのない3Dコーパスから小さな下流特化データセットに転送する際の利益も得られる。
計算コストのごく一部で最先端のソリューションと競合する結果を得る。
開発したアルゴリズム(3D版と2D版の両方)の実装をオープンソースライブラリとして公開し、他の研究者がデータセットにメソッドを適用して拡張できるようにしています。
関連論文リスト
- OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation [67.56268991234371]
OV-Uni3DETRは、様々なシナリオにおける最先端のパフォーマンスを達成し、既存のメソッドを平均6%以上上回っている。
コードと事前訓練されたモデルは、後にリリースされる。
論文 参考訳(メタデータ) (2024-03-28T17:05:04Z) - PonderV2: Pave the Way for 3D Foundation Model with A Universal
Pre-training Paradigm [114.47216525866435]
本稿では,効率的な3D表現の獲得を容易にするために,新しいユニバーサル3D事前学習フレームワークを提案する。
PonderV2は、11の室内および屋外ベンチマークで最先端のパフォーマンスを達成したことで、その効果が示唆された。
論文 参考訳(メタデータ) (2023-10-12T17:59:57Z) - Joint Embedding of 2D and 3D Networks for Medical Image Anomaly
Detection [0.8122270502556374]
本研究では, 接合による3次元ネットワークの強度と2次元ネットワークの強度を組み合わせる手法を開発した。
提案手法は分類タスクと分割タスクの両方において,SoTA法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2022-12-21T11:28:52Z) - Super Images -- A New 2D Perspective on 3D Medical Imaging Analysis [0.0]
トレーニング中に3次元知識を効率的に埋め込んで3次元データを扱うための,シンプルで効果的な2次元手法を提案する。
本手法は3次元画像にスライスを並べて超高分解能画像を生成する。
2次元ネットワークのみを利用した3次元ネットワークを実現する一方で、モデルの複雑さはおよそ3倍に減少する。
論文 参考訳(メタデータ) (2022-05-05T09:59:03Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - Self-Supervised Learning for 3D Medical Image Analysis using 3D SimCLR
and Monte Carlo Dropout [4.190672342471606]
コントラスト型(SimCLR)法に基づく3次元自己監督手法を提案する。
推論フェーズにおいてベイズニューラルネットワークを用いることで、下流タスクの結果をさらに高めることができることを示す。
論文 参考訳(メタデータ) (2021-09-29T09:15:41Z) - 3-Dimensional Deep Learning with Spatial Erasing for Unsupervised
Anomaly Segmentation in Brain MRI [55.97060983868787]
我々は,MRIボリュームと空間消去を組み合わせた空間文脈の増大が,教師なしの異常セグメンテーション性能の向上に繋がるかどうかを検討する。
本稿では,2次元変分オートエンコーダ(VAE)と3次元の相違点を比較し,3次元入力消去を提案し,データセットサイズが性能に与える影響を体系的に検討する。
入力消去による最高の3D VAEは、平均DICEスコアが31.40%となり、2D VAEは25.76%となった。
論文 参考訳(メタデータ) (2021-09-14T09:17:27Z) - Medical Transformer: Universal Brain Encoder for 3D MRI Analysis [1.6287500717172143]
既存の3Dベースの手法は、トレーニング済みのモデルを下流のタスクに転送している。
彼らは3D医療イメージングのためのモデルを訓練するために大量のパラメータを要求します。
本稿では,2次元画像スライス形式で3次元容積画像を効果的にモデル化する,メディカルトランスフォーマーと呼ばれる新しい伝達学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-28T08:34:21Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - Planar 3D Transfer Learning for End to End Unimodal MRI Unbalanced Data
Segmentation [0.0]
本稿では,事前学習した2次元畳み込みニューラルネットワーク重みを平面3次元カーネルにマッピングする手法を提案する。
提案手法は2次元VGG-16から転送されるエンコーダを備えた平面3Dres-u-netネットワークにより検証される。
論文 参考訳(メタデータ) (2020-11-23T17:11:50Z) - 2.75D: Boosting learning by representing 3D Medical imaging to 2D
features for small data [54.223614679807994]
3D畳み込みニューラルネットワーク(CNN)は、多くのディープラーニングタスクにおいて、2D CNNよりも優れたパフォーマンスを示し始めている。
3D CNNにトランスファー学習を適用することは、パブリックにトレーニング済みの3Dモデルがないために困難である。
本研究では,ボリュームデータの2次元戦略的表現,すなわち2.75Dを提案する。
その結果,2次元CNNネットワークをボリューム情報学習に用いることが可能となった。
論文 参考訳(メタデータ) (2020-02-11T08:24:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。