論文の概要: Semi-Supervised 3D Medical Segmentation from 2D Natural Images Pretrained Model
- arxiv url: http://arxiv.org/abs/2509.15167v1
- Date: Thu, 18 Sep 2025 17:17:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 17:26:53.359789
- Title: Semi-Supervised 3D Medical Segmentation from 2D Natural Images Pretrained Model
- Title(参考訳): 2次元自然画像事前訓練モデルによる半監督型3次元医用セグメンテーション
- Authors: Pak-Hei Yeung, Jayroop Ramesh, Pengfei Lyu, Ana Namburete, Jagath Rajapakse,
- Abstract要約: 本稿では,3次元医用画像のセグメンテーションを改善するために,2次元自然画像に事前訓練された一般視覚モデルからの知識の伝達について検討する。
本稿では,2次元事前学習モデルからスクラッチから学習した3次元セグメンテーションモデルまで,段階的に知識を蒸留するモデル非依存フレームワークを提案する。
我々のアプローチであるM&Nは、互いに生成した擬似マスクを用いて2つのモデルの反復的協調学習と、提案した学習率誘導サンプリングを含む。
- 参考スコア(独自算出の注目度): 0.8758593614464055
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper explores the transfer of knowledge from general vision models pretrained on 2D natural images to improve 3D medical image segmentation. We focus on the semi-supervised setting, where only a few labeled 3D medical images are available, along with a large set of unlabeled images. To tackle this, we propose a model-agnostic framework that progressively distills knowledge from a 2D pretrained model to a 3D segmentation model trained from scratch. Our approach, M&N, involves iterative co-training of the two models using pseudo-masks generated by each other, along with our proposed learning rate guided sampling that adaptively adjusts the proportion of labeled and unlabeled data in each training batch to align with the models' prediction accuracy and stability, minimizing the adverse effect caused by inaccurate pseudo-masks. Extensive experiments on multiple publicly available datasets demonstrate that M&N achieves state-of-the-art performance, outperforming thirteen existing semi-supervised segmentation approaches under all different settings. Importantly, ablation studies show that M&N remains model-agnostic, allowing seamless integration with different architectures. This ensures its adaptability as more advanced models emerge. The code is available at https://github.com/pakheiyeung/M-N.
- Abstract(参考訳): 本稿では,3次元医用画像のセグメンテーションを改善するために,2次元自然画像に事前訓練された一般視覚モデルからの知識の伝達について検討する。
私たちは、ラベル付き3D医療画像と、ラベルなし画像の大規模なセットが利用可能な、半教師付き設定に焦点を合わせます。
そこで本研究では,2次元事前学習モデルからスクラッチから学習した3次元セグメンテーションモデルまで,段階的に知識を蒸留するモデル非依存フレームワークを提案する。
提案手法は,各学習バッチにおけるラベル付きおよびラベルなしデータの比率を適応的に調整し,モデルの予測精度と安定性に適合させ,不正確な擬似マスクによる悪影響を最小限に抑える学習率誘導サンプリングとともに,互いに生成した擬似マスクを用いて2つのモデルの反復的協調学習を行う。
複数の公開データセットに対する大規模な実験は、M&Nが最先端のパフォーマンスを達成し、すべての異なる設定下で既存の13の半教師付きセグメンテーションアプローチより優れていることを示している。
アブレーション研究は、M&Nがモデルに依存しないことを示し、異なるアーキテクチャとのシームレスな統合を可能にする。
これにより、より高度なモデルが出現するにつれて、適応性が保証される。
コードはhttps://github.com/pakheiyeung/M-N.comで公開されている。
関連論文リスト
- A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.33043028101471]
本稿では,2次元監視のみを用いた3次元画像調和拡散モデルの学習フレームワークを提案する。
既存の3D生成モデルは、大規模な3Dデータセットが不足しているため、完全に3Dの監視に依存している。
論文 参考訳(メタデータ) (2024-12-01T00:29:57Z) - Deep Convolutional Neural Networks on Multiclass Classification of Three-Dimensional Brain Images for Parkinson's Disease Stage Prediction [2.931680194227131]
パーキンソン病の病期を正確に予測できるモデルを開発した。
我々は3次元脳画像全体を入力として使用した。
予測過程において,異なるスライスの重要性を考慮に入れた注意機構を組み込んだ。
論文 参考訳(メタデータ) (2024-10-31T05:40:08Z) - Leveraging Large-Scale Pretrained Vision Foundation Models for
Label-Efficient 3D Point Cloud Segmentation [67.07112533415116]
本稿では3Dポイントクラウドセグメンテーションタスクに様々な基礎モデルを適用する新しいフレームワークを提案する。
我々のアプローチでは、異なる大きな視覚モデルを用いて2次元セマンティックマスクの初期予測を行う。
本研究では,ロバストな3Dセマンティックな擬似ラベルを生成するために,投票による全ての結果を効果的に組み合わせたセマンティックなラベル融合戦略を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:41:15Z) - Promise:Prompt-driven 3D Medical Image Segmentation Using Pretrained
Image Foundation Models [13.08275555017179]
単点プロンプトのみを用いたプロンプト駆動型3次元医用画像分割モデルProMISeを提案する。
今回,大腸癌と膵腫瘍の2つの領域に分布する2つのパブリックデータセットについて検討した。
論文 参考訳(メタデータ) (2023-10-30T16:49:03Z) - Interpretable 2D Vision Models for 3D Medical Images [47.75089895500738]
本研究では,3次元画像処理における中間特徴表現を用いた2次元ネットワークの適応手法を提案する。
我々は、ベンチマークとして3D MedMNISTデータセットと、既存の手法に匹敵する数百の高分解能CTまたはMRIスキャンからなる2つの実世界のデータセットを示す。
論文 参考訳(メタデータ) (2023-07-13T08:27:09Z) - Advancing 3D Medical Image Analysis with Variable Dimension Transform
based Supervised 3D Pre-training [45.90045513731704]
本稿では,革新的でシンプルな3Dネットワーク事前学習フレームワークを再考する。
再設計された3Dネットワークアーキテクチャにより、データ不足の問題に対処するために、修正された自然画像が使用される。
4つのベンチマークデータセットに関する総合的な実験により、提案した事前学習モデルが収束を効果的に加速できることが示されている。
論文 参考訳(メタデータ) (2022-01-05T03:11:21Z) - Modelling the Distribution of 3D Brain MRI using a 2D Slice VAE [66.63629641650572]
本研究では,2次元スライスVAEとガウスモデルを組み合わせた3次元MR脳の体積分布をモデル化する手法を提案する。
また,本研究では,脳解剖学に適合するセグメンテーションの精度を定量的に評価する新たなボリューム評価手法を提案する。
論文 参考訳(メタデータ) (2020-07-09T13:23:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。