論文の概要: Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices
- arxiv url: http://arxiv.org/abs/2012.08770v1
- Date: Wed, 16 Dec 2020 07:11:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 02:57:36.873795
- Title: Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices
- Title(参考訳): CTスライスにおけるユニバーサル病変検出のための事前トレーニングによる3次元コンテキストモデリングの再検討
- Authors: Shu Zhang, Jincheng Xu, Yu-Chun Chen, Jiechao Ma, Zihao Li, Yizhou
Wang and Yizhou Yu
- Abstract要約: CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
- 参考スコア(独自算出の注目度): 48.85784310158493
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Universal lesion detection from computed tomography (CT) slices is important
for comprehensive disease screening. Since each lesion can locate in multiple
adjacent slices, 3D context modeling is of great significance for developing
automated lesion detection algorithms. In this work, we propose a Modified
Pseudo-3D Feature Pyramid Network (MP3D FPN) that leverages depthwise separable
convolutional filters and a group transform module (GTM) to efficiently extract
3D context enhanced 2D features for universal lesion detection in CT slices. To
facilitate faster convergence, a novel 3D network pre-training method is
derived using solely large-scale 2D object detection dataset in the natural
image domain. We demonstrate that with the novel pre-training method, the
proposed MP3D FPN achieves state-of-the-art detection performance on the
DeepLesion dataset (3.48% absolute improvement in the sensitivity of FPs@0.5),
significantly surpassing the baseline method by up to 6.06% (in MAP@0.5) which
adopts 2D convolution for 3D context modeling. Moreover, the proposed 3D
pre-trained weights can potentially be used to boost the performance of other
3D medical image analysis tasks.
- Abstract(参考訳): CTスライスからのユニバーサル病変検出は,包括的疾患検診において重要である。
各病変は複数の隣接スライスに配置できるため、3次元コンテキストモデリングは自動病変検出アルゴリズムを開発する上で非常に重要である。
本研究では,深部分離可能な畳み込みフィルタとグループ変換モジュール(GTM)を利用して,CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2次元特徴を効率よく抽出する改良された擬似3D特徴ピラミッドネットワーク(MP3D FPN)を提案する。
より高速な収束を実現するため,自然画像領域における大規模2次元物体検出データセットのみを用いて,新しい3Dネットワーク事前学習手法を導出する。
本研究では,新たに開発したmp3d fpnがdeeplesionデータセット(fps@0.5の感度の絶対値が3.48%)で最先端検出性能を達成し,最大6.06% (map@0.5) の精度で3次元コンテキストモデリングに2次元畳み込みを適用した。
さらに,提案する3次元事前学習重みは,他の3次元医用画像解析タスクの性能向上に有用である可能性が示唆された。
関連論文リスト
- Persistence Image from 3D Medical Image: Superpixel and Optimized Gaussian Coefficient [3.808587330262038]
トポロジカルデータ分析(TDA)は、医用画像における物体の重要な性質を明らかにする。
これまでの研究は主に2D画像解析に焦点を合わせ、包括的な3Dコンテキストを無視していた。
医用画像の特徴を点クラウドデータに変換するために,スーパーピクセルの概念を取り入れた革新的な3D TDA手法を提案する。
論文 参考訳(メタデータ) (2024-08-15T03:24:00Z) - Diff3Dformer: Leveraging Slice Sequence Diffusion for Enhanced 3D CT Classification with Transformer Networks [5.806035963947936]
拡散型3次元視覚変換器(Diff3Dformer)を提案する。
本手法は, 肺CTの2種類の小さなデータセットに対して, 改良された性能を示す。
論文 参考訳(メタデータ) (2024-06-24T23:23:18Z) - Geometric Transformation Uncertainty for Improving 3D Fetal Brain Pose Prediction from Freehand 2D Ultrasound Videos [0.8579241568505183]
2次元胎児脳画像における3次元面の自動位置決めのための不確実性を考慮した深層学習モデルを提案する。
提案手法であるQAERTSは、現状や不確実性に基づくアプローチよりも優れたポーズ推定精度を示す。
論文 参考訳(メタデータ) (2024-05-21T22:42:08Z) - 3DiffTection: 3D Object Detection with Geometry-Aware Diffusion Features [70.50665869806188]
3DiffTectionは、単一の画像から3Dオブジェクトを検出する最先端の方法である。
拡散モデルを微調整し、単一の画像に条件付けされた新しいビュー合成を行う。
さらに、検出監視により、ターゲットデータ上でモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-07T23:46:41Z) - Complementary Pseudo Multimodal Feature for Point Cloud Anomaly
Detection [5.059800023492045]
ポイントクラウド(PCD)異常検出は、将来性のある研究領域として着実に現れる。
本研究では,局所幾何学情報を3次元モードに組み込んだ補足的擬似多重モーダル特徴 (CPMF) を提案する。
実験では、95.15%のイメージレベルのAU-ROCと92.93%のピクセルレベルのProが2Dと3Dのモダリティの特徴を補完する能力を示している。
論文 参考訳(メタデータ) (2023-03-23T11:52:17Z) - Improving 3D Imaging with Pre-Trained Perpendicular 2D Diffusion Models [52.529394863331326]
本稿では,2つの垂直2次元拡散モデルを用いて3次元逆問題の解法を提案する。
MRI Z軸超解像, 圧縮センシングMRI, スパースCTなどの3次元医用画像再構成作業に有効である。
論文 参考訳(メタデータ) (2023-03-15T08:28:06Z) - View-Disentangled Transformer for Brain Lesion Detection [50.4918615815066]
より正確な腫瘍検出のためのMRI特徴抽出のための新しいビューディペンタングル変換器を提案する。
まず, 3次元脳スキャンにおいて, 異なる位置の長距離相関を求める。
第二に、トランスフォーマーはスライス機能のスタックを複数の2Dビューとしてモデル化し、これらの機能をビュー・バイ・ビューとして拡張する。
第三に、提案したトランスモジュールをトランスのバックボーンに展開し、脳病変を取り巻く2D領域を効果的に検出する。
論文 参考訳(メタデータ) (2022-09-20T11:58:23Z) - Simultaneous Alignment and Surface Regression Using Hybrid 2D-3D
Networks for 3D Coherent Layer Segmentation of Retina OCT Images [33.99874168018807]
本研究では,ハイブリッド2D-3D畳み込みニューラルネットワーク(CNN)を用いた新しいフレームワークを提案し,OCTから連続した3次元網膜層表面を得る。
本フレームワークは, 層分割精度とクロスBスキャン3D連続性の両方の観点から, 最先端の2D手法よりも優れた結果が得られる。
論文 参考訳(メタデータ) (2022-03-04T15:55:09Z) - Automated Model Design and Benchmarking of 3D Deep Learning Models for
COVID-19 Detection with Chest CT Scans [72.04652116817238]
3D胸部CTスキャン分類のための3D DLモデルを自動的に検索するための差別化可能なニューラルネットワーク探索(DNAS)フレームワークを提案する。
また,我々のモデルのクラスアクティベーションマッピング(cam)技術を利用して,結果の解釈可能性を提供する。
論文 参考訳(メタデータ) (2021-01-14T03:45:01Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。