論文の概要: Dynamic Prompt Generation for Interactive 3D Medical Image Segmentation Training
- arxiv url: http://arxiv.org/abs/2510.03189v1
- Date: Fri, 03 Oct 2025 17:16:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 16:35:52.505225
- Title: Dynamic Prompt Generation for Interactive 3D Medical Image Segmentation Training
- Title(参考訳): インタラクティブな3次元医用画像分割訓練のためのダイナミックプロンプト生成
- Authors: Tidiane Camaret Ndir, Alexander Pfefferle, Robin Tibor Schirrmeister,
- Abstract要約: 3Dバイオメディカルイメージセグメンテーションは、ユーザのプロンプトに基づいて予測を反復的に洗練する効率的なモデルを必要とする。
画像エンコーダの使用を最適化するために,動的ボリュームプロンプト生成とコンテンツ認識適応作付けを組み合わせたトレーニング戦略を提案する。
本手法は,1つのGPU上の逐次改善フィードバックから学習する際の計算課題に対処しながら,トレーニング中の現実的なユーザインタラクションパターンをシミュレートする。
- 参考スコア(独自算出の注目度): 43.10284826769465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interactive 3D biomedical image segmentation requires efficient models that can iteratively refine predictions based on user prompts. Current foundation models either lack volumetric awareness or suffer from limited interactive capabilities. We propose a training strategy that combines dynamic volumetric prompt generation with content-aware adaptive cropping to optimize the use of the image encoder. Our method simulates realistic user interaction patterns during training while addressing the computational challenges of learning from sequential refinement feedback on a single GPU. For efficient training, we initialize our network using the publicly available weights from the nnInteractive segmentation model. Evaluation on the \textbf{Foundation Models for Interactive 3D Biomedical Image Segmentation} competition demonstrates strong performance with an average final Dice score of 0.6385, normalized surface distance of 0.6614, and area-under-the-curve metrics of 2.4799 (Dice) and 2.5671 (NSD).
- Abstract(参考訳): インタラクティブな3Dバイオメディカルイメージセグメンテーションは、ユーザのプロンプトに基づいて予測を反復的に洗練する効率的なモデルを必要とする。
現在の基礎モデルは、量的認識が欠けているか、限られた対話能力に悩まされているかのいずれかである。
画像エンコーダの使用を最適化するために,動的ボリュームプロンプト生成とコンテンツ認識適応作付けを組み合わせたトレーニング戦略を提案する。
本手法は,1つのGPU上の逐次改善フィードバックから学習する際の計算課題に対処しながら,トレーニング中の現実的なユーザインタラクションパターンをシミュレートする。
効率的なトレーニングのために, nnInteractiveセグメンテーションモデルから利用可能なウェイトを用いてネットワークを初期化する。
The \textbf{Foundation Models for Interactive 3D Biomedical Image Segmentation} competition showed a strong performance with a average final Dice score of 0.6385, normalized surface distance of 0.6614, and the area-under-the-curve metrics of 2.4799 (Dice) and 2.5671 (NSD)。
関連論文リスト
- EM-Net: Efficient Channel and Frequency Learning with Mamba for 3D Medical Image Segmentation [3.6813810514531085]
我々は,EM-Netと呼ばれる新しい3次元医用画像セグメンテーションモデルを紹介し,その成功に触発されて,新しいマンバベースの3次元医用画像セグメンテーションモデルであるEM-Netを紹介した。
提案手法は,SOTAモデルのパラメータサイズをほぼ半分にし,訓練速度を2倍に向上させながら,より高精度なセグメンテーション精度を示すことを示す。
論文 参考訳(メタデータ) (2024-09-26T09:34:33Z) - PRISM Lite: A lightweight model for interactive 3D placenta segmentation in ultrasound [6.249772260759159]
3次元超音波(3DUS)画像から測定した胎盤体積は成長軌跡を追跡する重要なツールであり、妊娠の結果と関連している。
手動セグメンテーションは金の標準であるが、時間がかかり主観的である。
本稿では,3DUS画像から胎盤をリアルタイムでインタラクティブに分割するための,臨床利用を目的とした軽量なインタラクティブセグメンテーションモデルを提案する。
論文 参考訳(メタデータ) (2024-08-09T22:49:19Z) - Promise:Prompt-driven 3D Medical Image Segmentation Using Pretrained
Image Foundation Models [13.08275555017179]
単点プロンプトのみを用いたプロンプト駆動型3次元医用画像分割モデルProMISeを提案する。
今回,大腸癌と膵腫瘍の2つの領域に分布する2つのパブリックデータセットについて検討した。
論文 参考訳(メタデータ) (2023-10-30T16:49:03Z) - Brain MRI Segmentation using Template-Based Training and Visual
Perception Augmentation [0.0]
我々は,1つの脳MRIテンプレートとその関連セグメンテーションラベルを用いて,スクラッチから3次元U-Netモデルをトレーニングするためのテンプレートベースのトレーニング手法を提案する。
我々は,マウス,ラット,マーモセット,リース,ヒト脳MRIの3次元U-Netモデルを訓練し,頭蓋切除,脳分節,組織確率マッピングなどのセグメンテーションタスクを達成した。
論文 参考訳(メタデータ) (2023-08-04T14:53:20Z) - Disruptive Autoencoders: Leveraging Low-level features for 3D Medical
Image Pre-training [51.16994853817024]
本研究は、3Dラジオグラフィ画像のための効果的な事前学習フレームワークの設計に焦点をあてる。
ローカルマスキングと低レベルの摂動の組み合わせによって生成された破壊から、オリジナルのイメージを再構築しようとする事前トレーニングフレームワークであるDisruptive Autoencodersを紹介する。
提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-07-31T17:59:42Z) - GLEAM: Greedy Learning for Large-Scale Accelerated MRI Reconstruction [50.248694764703714]
アンロールされたニューラルネットワークは、最近最先端の加速MRI再構成を達成した。
これらのネットワークは、物理ベースの一貫性とニューラルネットワークベースの正規化を交互に組み合わせることで、反復最適化アルゴリズムをアンロールする。
我々は,高次元画像設定のための効率的なトレーニング戦略である加速度MRI再構成のためのグレディ・ラーニングを提案する。
論文 参考訳(メタデータ) (2022-07-18T06:01:29Z) - LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human
Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。
完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。
我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文 参考訳(メタデータ) (2021-11-30T04:10:57Z) - Weakly-supervised Learning For Catheter Segmentation in 3D Frustum
Ultrasound [74.22397862400177]
超音波を用いた新しいカテーテルセグメンテーション法を提案する。
提案手法は,1ボリュームあたり0.25秒の効率で最先端の性能を実現した。
論文 参考訳(メタデータ) (2020-10-19T13:56:22Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。