論文の概要: Adaptively Distilled ControlNet: Accelerated Training and Superior Sampling for Medical Image Synthesis
- arxiv url: http://arxiv.org/abs/2507.23652v1
- Date: Thu, 31 Jul 2025 15:32:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:10.033491
- Title: Adaptively Distilled ControlNet: Accelerated Training and Superior Sampling for Medical Image Synthesis
- Title(参考訳): Adaptively Distilled ControlNet:Accelerated Training and Superior Smpling for Medical Image Synthesis
- Authors: Kunpeng Qiu, Zhiying Zhou, Yongxin Guo,
- Abstract要約: 両モデル蒸留によるトレーニングと最適化を高速化するタスク非依存のフレームワークである textbfAdaptively Distilled ControlNet を提案する。
トレーニング中、マスクとイメージのペアに条件付けされた教師モデルは、パラメータ空間における予測ノイズアライメントによってマスクのみの学生モデルを正規化する。
サンプリング中は、学生モデルのみを使用し、プライバシを保存する医療画像生成を可能にする。
- 参考スコア(独自算出の注目度): 0.5243460995467893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical image annotation is constrained by privacy concerns and labor-intensive labeling, significantly limiting the performance and generalization of segmentation models. While mask-controllable diffusion models excel in synthesis, they struggle with precise lesion-mask alignment. We propose \textbf{Adaptively Distilled ControlNet}, a task-agnostic framework that accelerates training and optimization through dual-model distillation. Specifically, during training, a teacher model, conditioned on mask-image pairs, regularizes a mask-only student model via predicted noise alignment in parameter space, further enhanced by adaptive regularization based on lesion-background ratios. During sampling, only the student model is used, enabling privacy-preserving medical image generation. Comprehensive evaluations on two distinct medical datasets demonstrate state-of-the-art performance: TransUNet improves mDice/mIoU by 2.4%/4.2% on KiTS19, while SANet achieves 2.6%/3.5% gains on Polyps, highlighting its effectiveness and superiority. Code is available at GitHub.
- Abstract(参考訳): 医用画像アノテーションは、プライバシの懸念と労働集約的なラベル付けによって制約されており、セグメンテーションモデルの性能と一般化を著しく制限している。
マスク制御可能な拡散モデルは合成において優れているが、それらは正確な病変とマスクのアライメントに苦しむ。
本稿では,二モデル蒸留によるトレーニングと最適化を高速化するタスク非依存のフレームワークである‘textbf{Adaptively Distilled ControlNet} を提案する。
具体的には、トレーニング中、マスクとイメージのペアに条件付けされた教師モデルは、パラメータ空間における予測ノイズアライメントを通じてマスクのみの学生モデルを正規化し、病変と背景の比率に基づいて適応的な正規化によってさらに強化する。
サンプリング中は、学生モデルのみを使用し、プライバシを保存する医療画像生成を可能にする。
TransUNetは、KiTS19でmDice/mIoUを2.4%/4.2%改善し、SANetはPolypsで2.6%/3.5%向上した。
コードはGitHubで入手できる。
関連論文リスト
- SkinDualGen: Prompt-Driven Diffusion for Simultaneous Image-Mask Generation in Skin Lesions [0.0]
本稿では, トレーニング済み安定拡散2.0モデルを用いて, 高品質な合成皮膚病変画像を生成する手法を提案する。
実データと合成データを組み合わせたハイブリッドデータセットは、分類とセグメンテーションモデルの性能を著しく向上させる。
論文 参考訳(メタデータ) (2025-07-26T15:00:37Z) - Noise-Consistent Siamese-Diffusion for Medical Image Synthesis and Segmentation [9.795456238314825]
本稿では,Mask-Diffusion と Image-Diffusion を組み合わせた新しい2成分モデルであるSiamese-Diffusionを紹介する。
トレーニング中、これらのコンポーネント間でノイズ一貫性損失を導入し、マスク拡散の形態的忠実度を高める。
論文 参考訳(メタデータ) (2025-05-09T14:07:27Z) - Semi-Supervised Biomedical Image Segmentation via Diffusion Models and Teacher-Student Co-Training [7.915123555266876]
セマンティックセグメンテーションの深層学習は, 医用画像の解剖学的, 病理学的構造を正確に同定する上で, 優れた成果を上げている。
多くの場合、大きなアノテートされたトレーニングデータセットを必要とするため、臨床環境でのスケーラビリティが制限される。
本稿では, バイオメディカルイメージセグメンテーションのための半教師型教員学生フレームワークについて紹介する。
論文 参考訳(メタデータ) (2025-04-02T09:41:43Z) - Frequency-Guided Masking for Enhanced Vision Self-Supervised Learning [49.275450836604726]
本稿では、事前学習の有効性を大幅に向上させる、新しい周波数ベースの自己監視学習(SSL)手法を提案する。
我々は、知識蒸留によって強化された2ブランチのフレームワークを使用し、モデルがフィルタされた画像と原画像の両方を入力として取り込むことを可能にする。
論文 参考訳(メタデータ) (2024-09-16T15:10:07Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - Dual-Decoder Consistency via Pseudo-Labels Guided Data Augmentation for
Semi-Supervised Medical Image Segmentation [13.707121013895929]
本稿では, Pseudo-Labels Guided Data Augmentation を用いた新しい半教師付き学習手法である Dual-Decoder Consistency を提案する。
我々は、同じエンコーダを維持しながら、生徒と教師のネットワークに異なるデコーダを使用します。
ラベルのないデータから学習するために、教師ネットワークによって生成された擬似ラベルを作成し、擬似ラベルでトレーニングデータを増強する。
論文 参考訳(メタデータ) (2023-08-31T09:13:34Z) - CS$^2$: A Controllable and Simultaneous Synthesizer of Images and
Annotations with Minimal Human Intervention [3.465671939864428]
実写画像と対応するアノテーションを同時に生成する新しい制御可能同時合成器(CS$2$)を提案する。
提案するコントリビューションには,1)参照CT画像からスタイル情報と教師なしセグメンテーションマスクから構造情報の両方を受信する条件付き画像合成ネットワーク,2)これらの合成画像を自動的にセグメンテーションする対応するセグメンテーションマスクネットワークがある。
論文 参考訳(メタデータ) (2022-06-20T15:09:10Z) - ATSO: Asynchronous Teacher-Student Optimization for Semi-Supervised
Medical Image Segmentation [99.90263375737362]
教師-学生最適化の非同期版であるATSOを提案する。
ATSOはラベルのないデータを2つのサブセットに分割し、モデルの微調整に1つのサブセットを交互に使用し、他のサブセットのラベルを更新する。
医用画像のセグメンテーションデータセットを2つ評価し,様々な半教師付き環境において優れた性能を示す。
論文 参考訳(メタデータ) (2020-06-24T04:05:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。