論文の概要: LEAF: Latent Diffusion with Efficient Encoder Distillation for Aligned Features in Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2507.18214v1
- Date: Thu, 24 Jul 2025 09:08:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-25 15:10:43.319292
- Title: LEAF: Latent Diffusion with Efficient Encoder Distillation for Aligned Features in Medical Image Segmentation
- Title(参考訳): LEAF : 医用画像分割における高効率エンコーダ蒸留による潜時拡散
- Authors: Qilin Huang, Tianyu Lin, Zhiguang Chen, Fudan Zheng,
- Abstract要約: 本稿では,潜伏拡散モデルに基づく医療画像分割モデルLEAFを提案する。
微調整の過程では,元のノイズ予測パターンをセグメントマップの直接予測に置き換える。
また, コンボリューション層の隠れ状態と, 変圧器を用いた視覚エンコーダの特徴とを一致させるために, 特徴蒸留法を用いる。
- 参考スコア(独自算出の注目度): 2.529281336118734
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Leveraging the powerful capabilities of diffusion models has yielded quite effective results in medical image segmentation tasks. However, existing methods typically transfer the original training process directly without specific adjustments for segmentation tasks. Furthermore, the commonly used pre-trained diffusion models still have deficiencies in feature extraction. Based on these considerations, we propose LEAF, a medical image segmentation model grounded in latent diffusion models. During the fine-tuning process, we replace the original noise prediction pattern with a direct prediction of the segmentation map, thereby reducing the variance of segmentation results. We also employ a feature distillation method to align the hidden states of the convolutional layers with the features from a transformer-based vision encoder. Experimental results demonstrate that our method enhances the performance of the original diffusion model across multiple segmentation datasets for different disease types. Notably, our approach does not alter the model architecture, nor does it increase the number of parameters or computation during the inference phase, making it highly efficient.
- Abstract(参考訳): 拡散モデルの強力な能力を活用すれば、医用画像分割タスクにおいて非常に効果的な結果が得られる。
しかし、既存の手法は通常、セグメンテーションタスクの特定の調整なしに、元のトレーニングプロセスを直接転送する。
さらに、一般的な事前学習拡散モデルでは、特徴抽出に不足がある。
これらの考察に基づき,潜伏拡散モデルに基づく医療画像分割モデルLEAFを提案する。
微調整過程において、元のノイズ予測パターンをセグメント化マップの直接予測に置き換え、セグメント化結果のばらつきを低減する。
また, コンボリューション層の隠れ状態と, 変圧器を用いた視覚エンコーダの特徴とを一致させるために, 特徴蒸留法を用いる。
実験により,本手法は病型別複数のセグメンテーションデータセットにまたがる拡散モデルの性能を向上することを示した。
特に、我々の手法はモデルアーキテクチャを変更したり、推論フェーズのパラメータや計算量を増やしたりしないため、非常に効率的です。
関連論文リスト
- UniSegDiff: Boosting Unified Lesion Segmentation via a Staged Diffusion Model [53.34835793648352]
病変分割のための新しい拡散モデルフレームワークUniSegDiffを提案する。
UniSegDiffは、複数のモダリティと臓器にまたがる統一された方法で病変のセグメンテーションに対処する。
総合的な実験結果から、UniSegDiffは従来のSOTA(State-of-the-art)アプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-07-24T12:33:10Z) - DIVE: Inverting Conditional Diffusion Models for Discriminative Tasks [79.50756148780928]
本稿では,事前学習した拡散モデルを用いて識別課題を遂行する問題について検討する。
我々は、事前学習されたレイアウト・ツー・イメージ拡散モデルの「反転」により、事前学習した凍結生成拡散モデルの識別能力を分類タスクからより複雑なオブジェクト検出タスクに拡張する。
論文 参考訳(メタデータ) (2025-04-24T05:13:27Z) - PathSegDiff: Pathology Segmentation using Diffusion model representations [63.20694440934692]
そこで我々は,Latent Diffusion Models (LDMs) を事前学習した特徴抽出器として活用する,病理組織像分割の新しい手法であるPathSegDiffを提案する。
本手法は,H&E染色組織像から多彩な意味情報を抽出するために,自己教師型エンコーダによって誘導される病理特異的LCMを用いる。
本実験は,BCSSおよびGlaSデータセットにおける従来の手法よりも大幅に改善されたことを示す。
論文 参考訳(メタデータ) (2025-04-09T14:58:21Z) - Diffusion Based Ambiguous Image Segmentation [4.847141930102934]
生成セグメンテーションのための拡散モデルの設計空間について検討する。
入力スケーリングによるノイズスケジュールの厳格化は,性能を著しく向上させる。
我々はLIDC-IDRI肺病変データセットに基づく実験を行い,SOTA(State-of-the-art)の性能を得た。
論文 参考訳(メタデータ) (2025-04-08T12:33:26Z) - Hiding Images in Diffusion Models by Editing Learned Score Functions [27.130542925771692]
現在の手法は、高い抽出精度、モデル忠実度、隠れ効率の限界を示す。
本稿では,学習したスコア関数を編集することによって,画像の逆拡散過程に特定のタイミングで埋め込む,シンプルで効果的なアプローチについて述べる。
また、勾配に基づくパラメータ選択と低ランク適応を組み合わせたパラメータ効率の微調整手法を導入し、モデル忠実度と隠蔽効率を向上する。
論文 参考訳(メタデータ) (2025-03-24T09:04:25Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - ExposureDiffusion: Learning to Expose for Low-light Image Enhancement [87.08496758469835]
この研究は、拡散モデルと物理ベースの露光モデルとをシームレスに統合することで、この問題に対処する。
提案手法は,バニラ拡散モデルと比較して性能が大幅に向上し,推論時間を短縮する。
提案するフレームワークは、実際のペア付きデータセット、SOTAノイズモデル、および異なるバックボーンネットワークの両方で動作する。
論文 参考訳(メタデータ) (2023-07-15T04:48:35Z) - Conditional Diffusion Models for Weakly Supervised Medical Image
Segmentation [18.956306942099097]
条件拡散モデル(CDM)は、特定の分布の対象となる画像を生成することができる。
我々は,対象対象物の予測マスクを取得するために,CDMに隠されたカテゴリ認識意味情報を利用する。
本手法は,2つの医用画像セグメンテーションデータセット上で,最先端のCAMおよび拡散モデル法より優れる。
論文 参考訳(メタデータ) (2023-06-06T17:29:26Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - Diff-UNet: A Diffusion Embedded Network for Volumetric Segmentation [41.608617301275935]
医療用ボリュームセグメンテーションのための新しいエンドツーエンドフレームワークDiff-UNetを提案する。
提案手法では,拡散モデルを標準U字型アーキテクチャに統合し,入力ボリュームから意味情報を効率的に抽出する。
われわれは,MRI,肝腫瘍,多臓器CTの3種類の脳腫瘍について検討した。
論文 参考訳(メタデータ) (2023-03-18T04:06:18Z) - Label-Efficient Semantic Segmentation with Diffusion Models [27.01899943738203]
拡散モデルは意味的セグメンテーションの道具としても機能することを示した。
特に、いくつかの事前訓練拡散モデルに対して、逆拡散過程のマルコフステップを実行するネットワークからの中間活性化について検討する。
これらのアクティベーションは、入力画像から意味情報を効果的にキャプチャし、セグメンテーション問題に対して優れたピクセルレベルの表現であることを示す。
論文 参考訳(メタデータ) (2021-12-06T15:55:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。