論文の概要: MedSegFactory: Text-Guided Generation of Medical Image-Mask Pairs
- arxiv url: http://arxiv.org/abs/2504.06897v1
- Date: Wed, 09 Apr 2025 13:56:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-10 13:33:16.792665
- Title: MedSegFactory: Text-Guided Generation of Medical Image-Mask Pairs
- Title(参考訳): MedSegFactory:医療用マスクペアのテキストガイド生成
- Authors: Jiawei Mao, Yuhan Wang, Yucheng Tang, Daguang Xu, Kang Wang, Yang Yang, Zongwei Zhou, Yuyin Zhou,
- Abstract要約: MedSegFactoryは、モダリティとタスクをまたいだペア化された医療画像とセグメンテーションマスクを生成する汎用的なフレームワークである。
既存のセグメンテーションツールを強化するためにイメージマスクペアを提供する、無制限のデータリポジトリとして機能することを目指している。
- 参考スコア(独自算出の注目度): 29.350200296504696
- License:
- Abstract: This paper presents MedSegFactory, a versatile medical synthesis framework that generates high-quality paired medical images and segmentation masks across modalities and tasks. It aims to serve as an unlimited data repository, supplying image-mask pairs to enhance existing segmentation tools. The core of MedSegFactory is a dual-stream diffusion model, where one stream synthesizes medical images and the other generates corresponding segmentation masks. To ensure precise alignment between image-mask pairs, we introduce Joint Cross-Attention (JCA), enabling a collaborative denoising paradigm by dynamic cross-conditioning between streams. This bidirectional interaction allows both representations to guide each other's generation, enhancing consistency between generated pairs. MedSegFactory unlocks on-demand generation of paired medical images and segmentation masks through user-defined prompts that specify the target labels, imaging modalities, anatomical regions, and pathological conditions, facilitating scalable and high-quality data generation. This new paradigm of medical image synthesis enables seamless integration into diverse medical imaging workflows, enhancing both efficiency and accuracy. Extensive experiments show that MedSegFactory generates data of superior quality and usability, achieving competitive or state-of-the-art performance in 2D and 3D segmentation tasks while addressing data scarcity and regulatory constraints.
- Abstract(参考訳): 本稿では,高品質な医用画像とセグメンテーションマスクを生成する多目的医用合成フレームワークであるMedSegFactoryについて述べる。
既存のセグメンテーションツールを強化するためにイメージマスクペアを提供する、無制限のデータリポジトリとして機能することを目指している。
MedSegFactoryの中核は二重ストリーム拡散モデルであり、1つのストリームが医療画像を合成し、もう1つのストリームが対応するセグメンテーションマスクを生成する。
画像とマスクのペア間の正確なアライメントを確保するために,ストリーム間の動的クロスコンディショニングにより協調的な認知パラダイムを実現するJCA(Joint Cross-Attention)を導入する。
この双方向の相互作用により、両方の表現が互いに生成を導くことができ、生成したペア間の一貫性が向上する。
MedSegFactoryは、ターゲットラベル、画像のモダリティ、解剖学的領域、病理状態を指定するユーザー定義のプロンプトを通じて、ペア化された医療画像とセグメンテーションマスクのオンデマンド生成をアンロックし、スケーラブルで高品質なデータ生成を容易にする。
この新しい医用画像合成のパラダイムにより、多様な医用画像ワークフローへのシームレスな統合が可能になり、効率性と精度が向上する。
大規模な実験により、MedSegFactoryは、データ不足と規制制約に対処しながら、2Dおよび3Dセグメンテーションタスクにおける競争力または最先端のパフォーマンスを達成する、優れた品質とユーザビリティのデータを生成することが示された。
関連論文リスト
- MRGen: Segmentation Data Engine For Underrepresented MRI Modalities [59.61465292965639]
稀ながら臨床的に重要な画像モダリティのための医用画像分割モデルの訓練は、注釈付きデータの不足により困難である。
本稿では、生成モデルを利用してトレーニングデータを合成し、未表現のモダリティに対するセグメンテーションモデルを訓練する。
論文 参考訳(メタデータ) (2024-12-04T16:34:22Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - Comprehensive Generative Replay for Task-Incremental Segmentation with Concurrent Appearance and Semantic Forgetting [49.87694319431288]
一般的なセグメンテーションモデルは、異なる画像ソースからの様々なオブジェクトを含む様々なタスクに対して、ますます好まれている。
画像とマスクのペアを合成することで外観と意味の知識を復元する包括的生成(CGR)フレームワークを提案する。
漸進的タスク(心身、基礎、前立腺のセグメンテーション)の実験は、同時出現と意味的忘れを緩和する上で、明らかな優位性を示している。
論文 参考訳(メタデータ) (2024-06-28T10:05:58Z) - Medical Vision Generalist: Unifying Medical Imaging Tasks in Context [30.300087629262666]
本研究は,様々な医用画像タスクを処理可能な基礎モデルとして,MVG(Messical Vision Generalist)を提案する。
MVGは、入力と出力の処理をイメージとして標準化する、コンテキスト内生成戦略を採用している。
我々の結果はMVGの優れた性能を一貫して確立し、PainterやLVMといった既存のビジョンジェネラリストよりも優れています。
論文 参考訳(メタデータ) (2024-06-08T20:07:39Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - End-to-end autoencoding architecture for the simultaneous generation of
medical images and corresponding segmentation masks [3.1133049660590615]
ハミルトン変分オートエンコーダ(HVAE)に基づくエンドツーエンドアーキテクチャを提案する。
従来の変分オートエンコーダ(VAE)と比較して後部分布近似が向上する。
本手法は, 生成的逆境条件より優れ, 画像品質の向上を示す。
論文 参考訳(メタデータ) (2023-11-17T11:56:53Z) - Multi-Level Global Context Cross Consistency Model for Semi-Supervised
Ultrasound Image Segmentation with Diffusion Model [0.0]
本研究では,Latent Diffusion Model (LDM) によって生成された画像を,半教師付き学習のためのラベル付き画像として利用するフレームワークを提案する。
提案手法により,確率分布の知識をセグメント化ネットワークに効果的に伝達することが可能となり,セグメント化精度が向上する。
論文 参考訳(メタデータ) (2023-05-16T14:08:24Z) - Less is More: Unsupervised Mask-guided Annotated CT Image Synthesis with
Minimum Manual Segmentations [2.1785903900600316]
医用画像合成のための新しい手法,すなわちunsupervised Mask (UM)-guided synthesisを提案する。
UM誘導合成は、忠実度、多様性、有用性が著しく高い高品質な合成画像を提供する。
論文 参考訳(メタデータ) (2023-03-19T20:30:35Z) - MedSegDiff-V2: Diffusion based Medical Image Segmentation with
Transformer [53.575573940055335]
我々は、MedSegDiff-V2と呼ばれるトランスフォーマーベースの拡散フレームワークを提案する。
画像の異なる20種類の画像分割作業において,その有効性を検証する。
論文 参考訳(メタデータ) (2023-01-19T03:42:36Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。