論文の概要: DiNO-Diffusion. Scaling Medical Diffusion via Self-Supervised Pre-Training
- arxiv url: http://arxiv.org/abs/2407.11594v1
- Date: Tue, 16 Jul 2024 10:51:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 15:23:07.493810
- Title: DiNO-Diffusion. Scaling Medical Diffusion via Self-Supervised Pre-Training
- Title(参考訳): 自己監督型プレトレーニングによる医療拡散のスケーリング
- Authors: Guillermo Jimenez-Perez, Pedro Osorio, Josef Cersovsky, Javier Montalt-Tordera, Jens Hooge, Steffen Vogler, Sadegh Mohammadi,
- Abstract要約: Dino-Diffusionは潜在拡散モデル(LDM)の自己教師型手法である
アノテーションへの依存をなくすことで、私たちのトレーニングは、公開胸部X線データセットから868万以上の未ラベル画像を活用する。
小さなデータプールからでも意味的に多様な合成データセットを生成するために使用できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Diffusion models (DMs) have emerged as powerful foundation models for a variety of tasks, with a large focus in synthetic image generation. However, their requirement of large annotated datasets for training limits their applicability in medical imaging, where datasets are typically smaller and sparsely annotated. We introduce DiNO-Diffusion, a self-supervised method for training latent diffusion models (LDMs) that conditions the generation process on image embeddings extracted from DiNO. By eliminating the reliance on annotations, our training leverages over 868k unlabelled images from public chest X-Ray (CXR) datasets. Despite being self-supervised, DiNO-Diffusion shows comprehensive manifold coverage, with FID scores as low as 4.7, and emerging properties when evaluated in downstream tasks. It can be used to generate semantically-diverse synthetic datasets even from small data pools, demonstrating up to 20% AUC increase in classification performance when used for data augmentation. Images were generated with different sampling strategies over the DiNO embedding manifold and using real images as a starting point. Results suggest, DiNO-Diffusion could facilitate the creation of large datasets for flexible training of downstream AI models from limited amount of real data, while also holding potential for privacy preservation. Additionally, DiNO-Diffusion demonstrates zero-shot segmentation performance of up to 84.4% Dice score when evaluating lung lobe segmentation. This evidences good CXR image-anatomy alignment, akin to segmenting using textual descriptors on vanilla DMs. Finally, DiNO-Diffusion can be easily adapted to other medical imaging modalities or state-of-the-art diffusion models, opening the door for large-scale, multi-domain image generation pipelines for medical imaging.
- Abstract(参考訳): 拡散モデル(DM)は様々なタスクのための強力な基礎モデルとして登場し、合成画像生成に大きな焦点をあてている。
しかし、トレーニングのための大きなアノテートデータセットの要求は、通常、データセットが小さく、わずかにアノテートされている医療画像における適用性を制限している。
本稿では,Dinoから抽出した画像埋め込みの生成過程を条件としたLDMの自己教師付き手法であるDino-Diffusionを紹介する。
アノテーションへの依存をなくすことで、我々のトレーニングは、公開胸部X線(CXR)データセットから868万以上の未ラベル画像を活用する。
自己監督されているにもかかわらず、Dino-Diffusionは、FIDスコアが4.7以下で、下流タスクで評価されたときに出現する特性を持つ包括的な多様体のカバレッジを示している。
これは、小さなデータプールからでも意味的に異なる合成データセットを生成するために使用することができ、データ拡張に使用する場合、最大20%のAUCの分類性能が向上することを示す。
画像は、Dino埋め込み多様体上で異なるサンプリング戦略で生成され、実際のイメージを出発点として使用した。
結果として、DiNO-Diffusionは、限られた量の実際のデータから下流AIモデルの柔軟なトレーニングのための大規模なデータセットの作成を促進すると同時に、プライバシ保護の可能性を秘めている可能性が示唆されている。
さらに、Dino-Diffusionは、肺葉のセグメンテーションを評価する際に、最大84.4%のDiceスコアのゼロショットセグメンテーション性能を示す。
これは、バニラDM上のテキスト記述子を用いたセグメント化に似た、優れたCXR画像-解剖学的アライメントを示す。
最後に、Dino-Diffusionは、他の医療画像モダリティや最先端拡散モデルに容易に適応でき、医療画像のための大規模マルチドメイン画像生成パイプラインの扉を開くことができる。
関連論文リスト
- SAR Image Synthesis with Diffusion Models [0.0]
拡散モデル(DM)は、合成データを生成する一般的な方法となっている。
本研究では,拡散確率モデル (DDPM) をSAR領域に適応させる特定の種類のDMについて述べる。
DDPMは,SAR画像生成のための最先端のGAN法よりも質的に,定量的に優れていることを示す。
論文 参考訳(メタデータ) (2024-05-13T14:21:18Z) - MEDDAP: Medical Dataset Enhancement via Diversified Augmentation Pipeline [1.4910709350090976]
我々はMEDDAPと呼ばれる新しいパイプラインを導入し、新しい情報付きラベル付きサンプルを自動生成することで、既存の小さなデータセットを拡張する。
USLoRAはSD内の重量を選択的に微調整することができ、SDのUNet部分のみを完全微調整するのに対し、パラメータは0.1%未満である。
このアプローチは、乳がんに関する臨床医の意思決定プロセスに触発され、腫瘍の形状が強度よりも重要な役割を担っていることが多い。
論文 参考訳(メタデータ) (2024-03-25T00:17:43Z) - Training Class-Imbalanced Diffusion Model Via Overlap Optimization [55.96820607533968]
実世界のデータセットで訓練された拡散モデルは、尾クラスの忠実度が劣ることが多い。
拡散モデルを含む深い生成モデルは、豊富な訓練画像を持つクラスに偏りがある。
本研究では,異なるクラスに対する合成画像の分布の重複を最小限に抑えるために,コントラスト学習に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-02-16T16:47:21Z) - Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation [59.184980778643464]
ファインチューニング拡散モデル : 生成人工知能(GenAI)の最前線
本稿では,拡散モデル(SPIN-Diffusion)のための自己演奏ファインチューニングという革新的な手法を紹介する。
提案手法は従来の教師付き微調整とRL戦略の代替として,モデル性能とアライメントの両方を大幅に改善する。
論文 参考訳(メタデータ) (2024-02-15T18:59:18Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion
Models [61.906934570771256]
多様な合成画像や知覚アノテーションを生成できる汎用データセット生成モデルを提案する。
本手法は,事前学習した拡散モデルに基づいて,テキスト誘導画像合成を知覚データ生成に拡張する。
拡散モデルのリッチ潜時コードはデコーダモジュールを用いて正確な認識アノテーションとして効果的に復号できることを示す。
論文 参考訳(メタデータ) (2023-08-11T14:38:11Z) - Your Diffusion Model is Secretly a Zero-Shot Classifier [90.40799216880342]
大規模テキスト・画像拡散モデルからの密度推定をゼロショット分類に活用できることを示す。
分類に対する我々の生成的アプローチは、様々なベンチマークで強い結果が得られる。
我々の結果は、下流タスクにおける差別的モデルよりも生成的な利用に向けての一歩である。
論文 参考訳(メタデータ) (2023-03-28T17:59:56Z) - Diff-UNet: A Diffusion Embedded Network for Volumetric Segmentation [41.608617301275935]
医療用ボリュームセグメンテーションのための新しいエンドツーエンドフレームワークDiff-UNetを提案する。
提案手法では,拡散モデルを標準U字型アーキテクチャに統合し,入力ボリュームから意味情報を効率的に抽出する。
われわれは,MRI,肝腫瘍,多臓器CTの3種類の脳腫瘍について検討した。
論文 参考訳(メタデータ) (2023-03-18T04:06:18Z) - Analysing the effectiveness of a generative model for semi-supervised
medical image segmentation [23.898954721893855]
自動セグメンテーションにおける最先端技術は、U-Netのような差別モデルを用いて、教師付き学習のままである。
半教師付き学習(SSL)は、より堅牢で信頼性の高いモデルを得るために、重複のないデータの豊富さを活用する。
セマンティックGANのような深層生成モデルは、医療画像分割問題に取り組むための真に実行可能な代替手段である。
論文 参考訳(メタデータ) (2022-11-03T15:19:59Z) - Fast Unsupervised Brain Anomaly Detection and Segmentation with
Diffusion Models [1.6352599467675781]
脳画像における異常検出とセグメント分割のための拡散モデルに基づく手法を提案する。
拡散モデルは,2次元CTおよびMRIデータを用いた一連の実験において,自己回帰的アプローチと比較して競争性能が向上する。
論文 参考訳(メタデータ) (2022-06-07T17:30:43Z) - Multifold Acceleration of Diffusion MRI via Slice-Interleaved Diffusion
Encoding (SIDE) [50.65891535040752]
本稿では,Slice-Interleaved Diffusionと呼ばれる拡散符号化方式を提案する。
SIDEは、拡散重み付き(DW)画像ボリュームを異なる拡散勾配で符号化したスライスでインターリーブする。
また,高いスライスアンサンプデータからDW画像を効果的に再構成するためのディープラーニングに基づく手法を提案する。
論文 参考訳(メタデータ) (2020-02-25T14:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。