論文の概要: The Missing Piece: A Case for Pre-Training in 3D Medical Object Detection
- arxiv url: http://arxiv.org/abs/2509.15947v1
- Date: Fri, 19 Sep 2025 12:55:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:11.168361
- Title: The Missing Piece: A Case for Pre-Training in 3D Medical Object Detection
- Title(参考訳): 欠失点:3次元医用物体検出における事前検査の1例
- Authors: Katharina Eckstein, Constantin Ulrich, Michael Baumgartner, Jessica Kächele, Dimitrios Bounias, Tassilo Wald, Ralf Floca, Klaus H. Maier-Hein,
- Abstract要約: 大規模な事前訓練は、3D医療オブジェクト検出の進歩を約束する。
既存の3Dオブジェクト検出のための事前トレーニングアプローチは、2Dの医療データや自然画像の事前トレーニングに依存している。
本稿では,既存の事前学習手法を最先端検出アーキテクチャに組み込む方法について,最初の系統的研究を行う。
- 参考スコア(独自算出の注目度): 7.065674915708414
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Large-scale pre-training holds the promise to advance 3D medical object detection, a crucial component of accurate computer-aided diagnosis. Yet, it remains underexplored compared to segmentation, where pre-training has already demonstrated significant benefits. Existing pre-training approaches for 3D object detection rely on 2D medical data or natural image pre-training, failing to fully leverage 3D volumetric information. In this work, we present the first systematic study of how existing pre-training methods can be integrated into state-of-the-art detection architectures, covering both CNNs and Transformers. Our results show that pre-training consistently improves detection performance across various tasks and datasets. Notably, reconstruction-based self-supervised pre-training outperforms supervised pre-training, while contrastive pre-training provides no clear benefit for 3D medical object detection. Our code is publicly available at: https://github.com/MIC-DKFZ/nnDetection-finetuning.
- Abstract(参考訳): 大規模な事前訓練は、正確なコンピュータ支援診断の重要な構成要素である3D医療オブジェクトの検出を前進させるという約束を持っている。
しかし、プレトレーニングがすでに大きなメリットを示しているセグメンテーションに比べて、まだ探索が過小評価されている。
既存の3Dオブジェクト検出のための事前トレーニングアプローチは、2Dの医療データや自然画像の事前トレーニングに依存しており、3Dのボリューム情報を完全に活用できない。
そこで本研究では,既存の事前学習手法を最先端検出アーキテクチャに統合し,CNNとトランスフォーマーの両方をカバーする方式を提案する。
その結果、事前学習は様々なタスクやデータセットにおける検出性能を継続的に改善することがわかった。
特に、再構成に基づく自己指導型事前訓練は、教師付き事前訓練よりも優れているが、対照的な事前訓練は、3D医療対象の検出に明確なメリットをもたらすものではない。
私たちのコードは、https://github.com/MIC-DKFZ/nnDetection-finetuningで公開されています。
関連論文リスト
- Medical Semantic Segmentation with Diffusion Pretrain [1.9415817267757087]
近年のディープラーニングの進歩は、多くのコンピュータビジョンタスクの成功にロバストな特徴表現の学習が不可欠であることを示している。
本稿では,3次元医用画像データの複雑化に合わせて,解剖学的ガイダンスを持つ拡散モデルを用いた新しい事前学習戦略を提案する。
拡散過程において3次元の普遍的な身体部分座標を予測しガイダンスを与えるモデルを用いる。
論文 参考訳(メタデータ) (2025-01-31T16:25:49Z) - An OpenMind for 3D medical vision self-supervised learning [1.1223322894276315]
我々は114kの3D脳MRIボリュームからなる公開事前学習データセットを公表した。
我々は、最新のCNNおよびTransformerアーキテクチャのための既存の3次元自己教師型学習手法をこのデータセット上でベンチマークする。
論文 参考訳(メタデータ) (2024-12-22T14:38:28Z) - Enhancing Weakly Supervised 3D Medical Image Segmentation through Probabilistic-aware Learning [47.700298779672366]
3次元医用画像のセグメンテーションは、疾患の診断と治療計画に重要な意味を持つ課題である。
近年の深層学習の進歩は、完全に教師付き医療画像のセグメンテーションを著しく強化している。
本稿では,3次元医用画像に特化して設計された,確率的適応型弱教師付き学習パイプラインを提案する。
論文 参考訳(メタデータ) (2024-03-05T00:46:53Z) - Primitive Geometry Segment Pre-training for 3D Medical Image
Segmentation [12.251689154843342]
本稿では,PrimGeoSeg(PrimGeoSeg)法を提案する。
PrimGeoSegは手動のデータ収集やアノテーションなしでより正確で効率的な3D画像分割を行う。
論文 参考訳(メタデータ) (2024-01-08T04:37:35Z) - Video Pretraining Advances 3D Deep Learning on Chest CT Tasks [63.879848037679224]
大規模自然画像分類データセットの事前学習は、データスカース2D医療タスクのモデル開発に役立っている。
これらの2Dモデルは、3Dコンピュータビジョンベンチマークで3Dモデルに勝っている。
3Dモデルのためのビデオ事前トレーニングにより、より小さなデータセットでより高性能な3D医療タスクを実現することができることを示す。
論文 参考訳(メタデータ) (2023-04-02T14:46:58Z) - Rethinking Self-Supervised Visual Representation Learning in
Pre-training for 3D Human Pose and Shape Estimation [57.206129938611454]
自己教師付き表現学習(SSL)法は、オブジェクト検出などの視覚タスクのためのImageNet分類前トレーニングよりも優れている。
我々は、SSLの効果を実証的に研究し分析し、3DHPSEの事前学習方法と比較した。
我々の観察では、現在のSSLの3DHPSEへの初歩的な適用に挑戦し、事前トレーニングの側面において、他のデータ型の価値を啓蒙する。
論文 参考訳(メタデータ) (2023-03-09T16:17:52Z) - Advancing 3D Medical Image Analysis with Variable Dimension Transform
based Supervised 3D Pre-training [45.90045513731704]
本稿では,革新的でシンプルな3Dネットワーク事前学習フレームワークを再考する。
再設計された3Dネットワークアーキテクチャにより、データ不足の問題に対処するために、修正された自然画像が使用される。
4つのベンチマークデータセットに関する総合的な実験により、提案した事前学習モデルが収束を効果的に加速できることが示されている。
論文 参考訳(メタデータ) (2022-01-05T03:11:21Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。