論文の概要: Advancing 3D Medical Image Analysis with Variable Dimension Transform
based Supervised 3D Pre-training
- arxiv url: http://arxiv.org/abs/2201.01426v1
- Date: Wed, 5 Jan 2022 03:11:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-06 14:38:51.949554
- Title: Advancing 3D Medical Image Analysis with Variable Dimension Transform
based Supervised 3D Pre-training
- Title(参考訳): 可変次元変換に基づく3次元事前トレーニングによる3次元医用画像解析の促進
- Authors: Shu Zhang, Zihao Li, Hong-Yu Zhou, Jiechao Ma, Yizhou Yu
- Abstract要約: 本稿では,革新的でシンプルな3Dネットワーク事前学習フレームワークを再考する。
再設計された3Dネットワークアーキテクチャにより、データ不足の問題に対処するために、修正された自然画像が使用される。
4つのベンチマークデータセットに関する総合的な実験により、提案した事前学習モデルが収束を効果的に加速できることが示されている。
- 参考スコア(独自算出の注目度): 45.90045513731704
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The difficulties in both data acquisition and annotation substantially
restrict the sample sizes of training datasets for 3D medical imaging
applications. As a result, constructing high-performance 3D convolutional
neural networks from scratch remains a difficult task in the absence of a
sufficient pre-training parameter. Previous efforts on 3D pre-training have
frequently relied on self-supervised approaches, which use either predictive or
contrastive learning on unlabeled data to build invariant 3D representations.
However, because of the unavailability of large-scale supervision information,
obtaining semantically invariant and discriminative representations from these
learning frameworks remains problematic. In this paper, we revisit an
innovative yet simple fully-supervised 3D network pre-training framework to
take advantage of semantic supervisions from large-scale 2D natural image
datasets. With a redesigned 3D network architecture, reformulated natural
images are used to address the problem of data scarcity and develop powerful 3D
representations. Comprehensive experiments on four benchmark datasets
demonstrate that the proposed pre-trained models can effectively accelerate
convergence while also improving accuracy for a variety of 3D medical imaging
tasks such as classification, segmentation and detection. In addition, as
compared to training from scratch, it can save up to 60% of annotation efforts.
On the NIH DeepLesion dataset, it likewise achieves state-of-the-art detection
performance, outperforming earlier self-supervised and fully-supervised
pre-training approaches, as well as methods that do training from scratch. To
facilitate further development of 3D medical models, our code and pre-trained
model weights are publicly available at https://github.com/urmagicsmine/CSPR.
- Abstract(参考訳): データ取得とアノテーションの両面での困難さは、3次元医用イメージングアプリケーションのためのトレーニングデータセットのサンプルサイズを著しく制限する。
その結果、十分な事前学習パラメータがない場合、スクラッチから高性能な3D畳み込みニューラルネットワークを構築することは難しい課題である。
従来の3D事前学習の取り組みは、予測的あるいはコントラスト的な学習をラベルのないデータに用い、不変な3D表現を構築する自己教師型アプローチにしばしば依存していた。
しかし、大規模な監視情報の入手が不可能なため、これらの学習フレームワークから意味的不変性と識別的表現を得ることは依然として問題である。
本稿では,大規模な2次元自然画像データセットからのセマンティックインテリジェンスを活用するために,革新的でシンプルな3Dネットワーク事前学習フレームワークを再考する。
再設計された3Dネットワークアーキテクチャにより、データ不足の問題に対処し、強力な3D表現を開発するために、修正された自然画像が使用される。
4つのベンチマークデータセットの総合的な実験により、提案した事前学習モデルが収束を効果的に加速し、分類、セグメンテーション、検出などの様々な3D医療画像タスクの精度を向上させることが示されている。
さらに、スクラッチからのトレーニングと比較して、最大60%のアノテーションの労力を節約できます。
nih deeplesionデータセット上でも同様に最先端検出性能を達成し、以前の自己教師付き、完全に教師付き事前トレーニングアプローチよりも優れており、スクラッチからトレーニングを行う方法も備えている。
3D医療モデルのさらなる開発を容易にするため,我々のコードと事前学習モデルウェイトはhttps://github.com/urmagicsmine/CSPRで公開されている。
関連論文リスト
- Cross-D Conv: Cross-Dimensional Transferable Knowledge Base via Fourier Shifting Operation [3.69758875412828]
クロスD Conv 演算はフーリエ領域における位相シフトを学習することで次元ギャップを橋渡しする。
本手法は2次元と3次元の畳み込み操作間のシームレスな重み移動を可能にする。
論文 参考訳(メタデータ) (2024-11-02T13:03:44Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with Pre-trained Vision-Language Models [59.13757801286343]
クラス増分学習(class-incremental learning)は、モデルが限られたデータで漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
本稿では,特徴空間の不整合のための冗長特徴除去器 (RFE) と,重要な雑音に対する空間ノイズ補償器 (SNC) の2つの新しいコンポーネントを備えたFILP-3Dフレームワークを紹介する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Video Pretraining Advances 3D Deep Learning on Chest CT Tasks [63.879848037679224]
大規模自然画像分類データセットの事前学習は、データスカース2D医療タスクのモデル開発に役立っている。
これらの2Dモデルは、3Dコンピュータビジョンベンチマークで3Dモデルに勝っている。
3Dモデルのためのビデオ事前トレーニングにより、より小さなデータセットでより高性能な3D医療タスクを実現することができることを示す。
論文 参考訳(メタデータ) (2023-04-02T14:46:58Z) - Super Images -- A New 2D Perspective on 3D Medical Imaging Analysis [0.0]
トレーニング中に3次元知識を効率的に埋め込んで3次元データを扱うための,シンプルで効果的な2次元手法を提案する。
本手法は3次元画像にスライスを並べて超高分解能画像を生成する。
2次元ネットワークのみを利用した3次元ネットワークを実現する一方で、モデルの複雑さはおよそ3倍に減少する。
論文 参考訳(メタデータ) (2022-05-05T09:59:03Z) - 3D Self-Supervised Methods for Medical Imaging [7.65168530693281]
本稿では,プロキシタスクの形式で,5種類の自己教師型手法の3次元バージョンを提案する。
提案手法は,未ラベルの3次元画像からニューラルネットワークの特徴学習を容易にし,専門家のアノテーションに必要なコストを削減することを目的としている。
開発したアルゴリズムは、3D Contrastive Predictive Coding, 3D Rotation Prediction, 3D Jigsaw puzzles, Relative 3D patch location, 3D Exemplar Networkである。
論文 参考訳(メタデータ) (2020-06-06T09:56:58Z) - Exemplar Fine-Tuning for 3D Human Model Fitting Towards In-the-Wild 3D
Human Pose Estimation [107.07047303858664]
3次元の地平線アノテーションを持つ大規模な人的データセットは、野生では入手が困難である。
既存の2Dデータセットを高品質な3Dポーズマッチングで拡張することで、この問題に対処する。
結果として得られるアノテーションは、3Dのプロシージャネットワークをスクラッチからトレーニングするのに十分である。
論文 参考訳(メタデータ) (2020-04-07T20:21:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。