論文の概要: On the Noise Scheduling for Generating Plausible Designs with Diffusion
Models
- arxiv url: http://arxiv.org/abs/2311.11207v1
- Date: Sun, 19 Nov 2023 03:17:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 06:58:14.494066
- Title: On the Noise Scheduling for Generating Plausible Designs with Diffusion
Models
- Title(参考訳): 拡散モデルを用いた有理設計生成のための雑音スケジューリングについて
- Authors: Jiajie Fan, Laure Vuaille, Thomas B\"ack, Hao Wang
- Abstract要約: 拡散モデルのノイズスケジュールが結果の妥当性に及ぼす影響について検討する。
そこで本稿では,所定の画像集合に対してそのような範囲を決定するための2つの手法を提案する。
我々のスケジュールは、83.4%から93.5%に、Fr'echet Inception Distance (FID)は7.84から4.87に大幅に改善されている。
- 参考スコア(独自算出の注目度): 5.845803891419152
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep Generative Models (DGMs) are widely used to create innovative designs
across multiple industries, ranging from fashion to the automotive sector. In
addition to generating images of high visual quality, the task of structural
design generation imposes more stringent constrains on the semantic expression,
e.g., no floating material or missing part, which we refer to as plausibility
in this work. We delve into the impact of noise schedules of diffusion models
on the plausibility of the outcome: there exists a range of noise levels at
which the model's performance decides the result plausibility. Also, we propose
two techniques to determine such a range for a given image set and devise a
novel parametric noise schedule for better plausibility. We apply this noise
schedule to the training and sampling of the well-known diffusion model EDM and
compare it to its default noise schedule. Compared to EDM, our schedule
significantly improves the rate of plausible designs from 83.4% to 93.5% and
Fr\'echet Inception Distance (FID) from 7.84 to 4.87. Further applications of
advanced image editing tools demonstrate the model's solid understanding of
structure.
- Abstract(参考訳): ディープジェネレーティブモデル(dgms)はファッションから自動車部門まで、複数の業界にまたがる革新的なデザインを生み出すために広く使われている。
視覚的品質の高い画像を生成することに加え、構造設計のタスクは、例えば浮動小数点や欠落部分などの意味表現により厳密な制約を課す。
拡散モデルのノイズスケジュールが結果の妥当性に与える影響を探索し、モデルの性能が結果の可否を決定する様々なノイズレベルが存在することを示す。
また,与えられた画像集合に対して,そのような範囲を決定するための2つの手法を提案し,新しいパラメトリックノイズスケジュールを考案し,信頼性を向上させる。
このノイズスケジュールをよく知られた拡散モデルEDMのトレーニングとサンプリングに適用し、デフォルトのノイズスケジュールと比較する。
edmと比較すると, 設計精度は83.4%から93.5%, fr\'echetインセプション距離 (fid) が7.84から4.87に大幅に向上した。
高度な画像編集ツールのさらなる応用は、モデルの構造に対するしっかりとした理解を示している。
関連論文リスト
- Enhancing Diffusion Models for High-Quality Image Generation [0.0]
本稿では,拡散確率モデル(DDPM)と拡散確率モデル(DDIM)の総合的な実装,評価,最適化について述べる。
推論中、これらのモデルはランダムノイズを入力とし、高画質な画像を出力として繰り返し生成する。
この研究の背景にあるのは、さまざまなデータセットをまたいだリアルなイメージを生成可能な、効率的でスケーラブルな生成AIモデルの需要が高まっていることだ。
論文 参考訳(メタデータ) (2024-12-19T00:23:15Z) - Meta-DiffuB: A Contextualized Sequence-to-Sequence Text Diffusion Model with Meta-Exploration [53.63593099509471]
本稿では,既存のS2S-拡散モデルの限界を克服するために,スケジューラ・エクスロイタS2S-拡散パラダイムを提案する。
我々はメタ探索を用いて、各文の文脈化ノイズをスケジューリングするための追加スケジューラモデルを訓練する。
我々のエクスプローラーモデルであるS2S-拡散モデルでは、スケジューラモデルによってスケジュールされたノイズを利用して更新と生成を行う。
論文 参考訳(メタデータ) (2024-10-17T04:06:02Z) - Fine Tuning Text-to-Image Diffusion Models for Correcting Anomalous Images [0.0]
本研究では,DreamBooth法を用いて安定拡散3モデルを微調整することにより,このような問題を緩和する手法を提案する。
SSIM(Structure similarity Index)、Pak Signal-to-Noise Ratio(PSNR)、Frechet Inception Distance(FID)など、視覚的評価の精度向上を示す。
論文 参考訳(メタデータ) (2024-09-23T00:51:47Z) - Improved Noise Schedule for Diffusion Training [51.849746576387375]
本稿では,拡散モデルのトレーニングを強化するため,ノイズスケジュールを設計するための新しい手法を提案する。
我々は,標準のコサインスケジュールよりもノイズスケジュールの方が優れていることを実証的に示す。
論文 参考訳(メタデータ) (2024-07-03T17:34:55Z) - Blue noise for diffusion models [50.99852321110366]
本稿では,画像内および画像間の相関雑音を考慮した拡散モデルを提案する。
我々のフレームワークは、勾配流を改善するために、1つのミニバッチ内に画像間の相関を導入することができる。
本手法を用いて,各種データセットの質的,定量的な評価を行う。
論文 参考訳(メタデータ) (2024-02-07T14:59:25Z) - Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.91471250967703]
我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。
このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。
様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文 参考訳(メタデータ) (2023-08-28T08:47:06Z) - Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - A Study on Speech Enhancement Based on Diffusion Probabilistic Model [63.38586161802788]
雑音信号からクリーンな音声信号を復元することを目的とした拡散確率モデルに基づく音声強調モデル(DiffuSE)を提案する。
実験結果から、DiffuSEは、標準化されたVoice Bankコーパスタスクにおいて、関連する音声生成モデルに匹敵する性能が得られることがわかった。
論文 参考訳(メタデータ) (2021-07-25T19:23:18Z) - Variational Diffusion Models [33.0719137062396]
本稿では,画像密度推定ベンチマークの最先端可能性を求める拡散モデルについて紹介する。
差分下界 (VLB) は, 拡散したデータの信号対雑音比において, 著しく短い表現に単純化されることを示す。
論文 参考訳(メタデータ) (2021-07-01T17:43:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。