論文の概要: Importance of Aligning Training Strategy with Evaluation for Diffusion
Models in 3D Multiclass Segmentation
- arxiv url: http://arxiv.org/abs/2303.06040v1
- Date: Fri, 10 Mar 2023 16:30:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-13 14:26:24.602306
- Title: Importance of Aligning Training Strategy with Evaluation for Diffusion
Models in 3D Multiclass Segmentation
- Title(参考訳): 3次元マルチクラスセグメンテーションにおける拡散モデル評価のための調整訓練戦略の重要性
- Authors: Yunguan Fu and Yiwen Li and Shaheer U. Saeed and Matthew J. Clarkson
and Yipeng Hu
- Abstract要約: DDPMは初めて3Dのマルチクラス画像セグメンテーションに使用される。
トレーニング戦略と評価方法論の整合性を重視した3つの重要なコントリビューションを行います。
トレーニング中の拡散過程は, 評価と同じ5段階に短縮された。
- 参考スコア(独自算出の注目度): 5.345256600895173
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, denoising diffusion probabilistic models (DDPM) have been applied
to image segmentation by generating segmentation masks conditioned on images,
while the applications were mainly limited to 2D networks without exploiting
potential benefits from the 3D formulation. In this work, for the first time,
DDPMs are used for 3D multiclass image segmentation. We make three key
contributions that all focus on aligning the training strategy with the
evaluation methodology, and improving efficiency. Firstly, the model predicts
segmentation masks instead of sampled noise and is optimised directly via Dice
loss. Secondly, the predicted mask in the previous time step is recycled to
generate noise-corrupted masks to reduce information leakage. Finally, the
diffusion process during training was reduced to five steps, the same as the
evaluation. Through studies on two large multiclass data sets (prostate MR and
abdominal CT), we demonstrated significantly improved performance compared to
existing DDPMs, and reached competitive performance with non-diffusion
segmentation models, based on U-net, within the same compute budget. The
JAX-based diffusion framework has been released on
https://github.com/mathpluscode/ImgX-DiffSeg.
- Abstract(参考訳): 近年,画像に条件づけられたセグメンテーションマスクを生成させることにより,画像セグメンテーションに分散拡散確率モデル(ddpm)が適用されている。
本研究では,ddpmを3次元マルチクラス画像セグメンテーションに初めて使用する。
トレーニング戦略と評価方法論の整合と効率向上に重点を置いた3つの重要な貢献を行いました。
まず、サンプルノイズの代わりにセグメンテーションマスクを予測し、Dice損失を直接最適化する。
第2に、前段の予測マスクをリサイクルしてノイズ崩壊マスクを生成し、情報漏洩を低減する。
最後に, トレーニング中の拡散過程を5段階に短縮し, 評価を行った。
2つの大規模マルチクラスデータセット(前立腺MRIと腹部CT)の研究を通じて,既存のDDPMと比較して性能が有意に向上し,U-netに基づく非拡散セグメンテーションモデルとの競合性能を同じ計算予算で達成した。
JAXベースの拡散フレームワークがhttps://github.com/mathpluscode/ImgX-DiffSegでリリースされた。
関連論文リスト
- Mitigating Embedding Collapse in Diffusion Models for Categorical Data [52.90687881724333]
我々は,学習を安定させる埋め込み空間内の連続拡散フレームワークであるCATDMを紹介する。
ベンチマーク実験により、CATDMは埋没崩壊を緩和し、FFHQ、LSUN教会、LSUNベッドルームにおいて優れた結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-10-18T09:12:33Z) - Amortizing intractable inference in diffusion models for vision, language, and control [89.65631572949702]
本稿では,p(mathbfx)$以前の拡散生成モデルとブラックボックス制約,あるいは関数$r(mathbfx)$からなるモデルにおいて,データ上の後部サンプルである $mathbfxsim prm post(mathbfx)propto p(mathbfx)r(mathbfx)$について検討する。
我々は,データフリー学習目標である相対軌道バランスの正しさを,サンプルから抽出した拡散モデルの訓練のために証明する。
論文 参考訳(メタデータ) (2024-05-31T16:18:46Z) - Adaptive Training Meets Progressive Scaling: Elevating Efficiency in Diffusion Models [52.1809084559048]
TDCトレーニングと呼ばれる新しい2段階分割型トレーニング戦略を提案する。
タスクの類似性と難易度に基づいてタイムステップをグループ化し、高度にカスタマイズされた復調モデルを各グループに割り当て、拡散モデルの性能を向上させる。
2段階のトレーニングでは、各モデルを個別にトレーニングする必要がなくなるが、総トレーニングコストは、単一の統合されたデノナイジングモデルをトレーニングするよりもさらに低い。
論文 参考訳(メタデータ) (2023-12-20T03:32:58Z) - Diffusion-based 3D Object Detection with Random Boxes [58.43022365393569]
既存のアンカーベースの3D検出方法は、アンカーの実証的な設定に依存しており、アルゴリズムはエレガンスを欠いている。
提案するDiff3Detは,検出ボックスを生成対象として考慮し,拡散モデルから3次元オブジェクト検出のための提案生成へ移行する。
推論段階では、モデルは予測結果にランダムボックスのセットを徐々に洗練する。
論文 参考訳(メタデータ) (2023-09-05T08:49:53Z) - A Recycling Training Strategy for Medical Image Segmentation with
Diffusion Denoising Models [8.649603931882227]
拡散モデルのデノイングは、画像上に条件付きセグメンテーションマスクを生成することにより、画像セグメンテーションに応用されている。
本研究では, トレーニング戦略の改善に焦点をあて, 新たなリサイクル手法を提案する。
提案手法は,同一のネットワークアーキテクチャと計算予算とを公正に比較し,非拡散型教師付きトレーニングによるリサイクルベース拡散モデルの性能向上を図っている。
論文 参考訳(メタデータ) (2023-08-30T23:03:49Z) - CamoDiffusion: Camouflaged Object Detection via Conditional Diffusion
Models [72.93652777646233]
カモフラーゲ型物体検出(COD)は、カモフラーゲ型物体とその周囲の類似性が高いため、コンピュータビジョンにおいて難しい課題である。
本研究では,CODを拡散モデルを利用した条件付きマスク生成タスクとして扱う新しいパラダイムを提案する。
カモ拡散(CamoDiffusion)と呼ばれる本手法では,拡散モデルのデノナイズプロセスを用いてマスクの雑音を反復的に低減する。
論文 参考訳(メタデータ) (2023-05-29T07:49:44Z) - Score Jacobian Chaining: Lifting Pretrained 2D Diffusion Models for 3D
Generation [28.25023686484727]
拡散モデルは勾配のベクトル場を予測することを学習する。
学習した勾配の連鎖則を提案し、微分可能場のヤコビアンを通して拡散モデルのスコアをバックプロパゲートする。
大規模なLAIONデータセットでトレーニングされたStable Diffusionを含む,市販の拡散画像生成モデル上で,アルゴリズムを実行する。
論文 参考訳(メタデータ) (2022-12-01T18:56:37Z) - Diffusion Models for Adversarial Purification [69.1882221038846]
対人浄化(Adrial purification)とは、生成モデルを用いて敵の摂動を除去する防衛方法の分類である。
そこで我々は,拡散モデルを用いたDiffPureを提案する。
提案手法は,現在の対人訓練および対人浄化方法よりも優れ,最先端の成果を達成する。
論文 参考訳(メタデータ) (2022-05-16T06:03:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。