Fugu-MT 論文翻訳(概要): On the Noise Scheduling for Generating Plausible Designs with Diffusion Models

論文の概要: On the Noise Scheduling for Generating Plausible Designs with Diffusion Models

arxiv url: http://arxiv.org/abs/2311.11207v1
Date: Sun, 19 Nov 2023 03:17:54 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-22 06:58:14.494066
Title: On the Noise Scheduling for Generating Plausible Designs with Diffusion Models
Title（参考訳）: 拡散モデルを用いた有理設計生成のための雑音スケジューリングについて
Authors: Jiajie Fan, Laure Vuaille, Thomas B\"ack, Hao Wang
Abstract要約: 拡散モデルのノイズスケジュールが結果の妥当性に及ぼす影響について検討する。そこで本稿では,所定の画像集合に対してそのような範囲を決定するための2つの手法を提案する。我々のスケジュールは、83.4%から93.5%に、Fr'echet Inception Distance (FID)は7.84から4.87に大幅に改善されている。
参考スコア（独自算出の注目度）: 5.845803891419152
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep Generative Models (DGMs) are widely used to create innovative designs across multiple industries, ranging from fashion to the automotive sector. In addition to generating images of high visual quality, the task of structural design generation imposes more stringent constrains on the semantic expression, e.g., no floating material or missing part, which we refer to as plausibility in this work. We delve into the impact of noise schedules of diffusion models on the plausibility of the outcome: there exists a range of noise levels at which the model's performance decides the result plausibility. Also, we propose two techniques to determine such a range for a given image set and devise a novel parametric noise schedule for better plausibility. We apply this noise schedule to the training and sampling of the well-known diffusion model EDM and compare it to its default noise schedule. Compared to EDM, our schedule significantly improves the rate of plausible designs from 83.4% to 93.5% and Fr\'echet Inception Distance (FID) from 7.84 to 4.87. Further applications of advanced image editing tools demonstrate the model's solid understanding of structure.
Abstract（参考訳）: ディープジェネレーティブモデル(dgms)はファッションから自動車部門まで、複数の業界にまたがる革新的なデザインを生み出すために広く使われている。視覚的品質の高い画像を生成することに加え、構造設計のタスクは、例えば浮動小数点や欠落部分などの意味表現により厳密な制約を課す。拡散モデルのノイズスケジュールが結果の妥当性に与える影響を探索し、モデルの性能が結果の可否を決定する様々なノイズレベルが存在することを示す。また,与えられた画像集合に対して,そのような範囲を決定するための2つの手法を提案し,新しいパラメトリックノイズスケジュールを考案し,信頼性を向上させる。このノイズスケジュールをよく知られた拡散モデルEDMのトレーニングとサンプリングに適用し、デフォルトのノイズスケジュールと比較する。 edmと比較すると, 設計精度は83.4%から93.5%, fr\'echetインセプション距離 (fid) が7.84から4.87に大幅に向上した。高度な画像編集ツールのさらなる応用は、モデルの構造に対するしっかりとした理解を示している。

関連論文リスト

Revealing the Implicit Noise-based Imprint of Generative Models [71.94916898756684]
本稿では,検出タスクにノイズに基づくモデル固有インプリントを利用する新しいフレームワークを提案する。様々な生成モデルからのインプリントを集約することにより、将来のモデルのインプリントを外挿してトレーニングデータを拡張することができる。提案手法は,GenImage,Synthbuster,Chameleonの3つの公開ベンチマークにおいて,最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2025-03-12T12:04:53Z)
Meta-DiffuB: A Contextualized Sequence-to-Sequence Text Diffusion Model with Meta-Exploration [53.63593099509471]
本稿では,既存のS2S-拡散モデルの限界を克服するために,スケジューラ・エクスロイタS2S-拡散パラダイムを提案する。我々はメタ探索を用いて、各文の文脈化ノイズをスケジューリングするための追加スケジューラモデルを訓練する。我々のエクスプローラーモデルであるS2S-拡散モデルでは、スケジューラモデルによってスケジュールされたノイズを利用して更新と生成を行う。
論文参考訳（メタデータ） (2024-10-17T04:06:02Z)
Fine Tuning Text-to-Image Diffusion Models for Correcting Anomalous Images [0.0]
本研究では,DreamBooth法を用いて安定拡散3モデルを微調整することにより,このような問題を緩和する手法を提案する。 SSIM(Structure similarity Index)、Pak Signal-to-Noise Ratio(PSNR)、Frechet Inception Distance(FID)など、視覚的評価の精度向上を示す。
論文参考訳（メタデータ） (2024-09-23T00:51:47Z)
Improved Noise Schedule for Diffusion Training [7.201977155496932]
拡散モデルは視覚信号を生成するデファクト選択として現れている。本稿では,拡散モデルのトレーニングを強化するため,ノイズスケジュールを設計するための新しい手法を提案する。
論文参考訳（メタデータ） (2024-07-03T17:34:55Z)
Blue noise for diffusion models [50.99852321110366]
本稿では,画像内および画像間の相関雑音を考慮した拡散モデルを提案する。我々のフレームワークは、勾配流を改善するために、1つのミニバッチ内に画像間の相関を導入することができる。本手法を用いて,各種データセットの質的,定量的な評価を行う。
論文参考訳（メタデータ） (2024-02-07T14:59:25Z)
Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.91471250967703]
我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文参考訳（メタデータ） (2023-08-28T08:47:06Z)
Noise-aware Speech Enhancement using Diffusion Probabilistic Model [35.17225451626734]
拡散モデルにおける逆過程を導出する雑音固有情報を抽出する雑音認識音声強調(NASE)手法を提案する。 NASEは任意の拡散SEモデルに一般化できるプラグイン・アンド・プレイモジュールであることが示されている。
論文参考訳（メタデータ） (2023-07-16T12:46:11Z)
An Efficient Membership Inference Attack for the Diffusion Model by Proximal Initialization [58.88327181933151]
本稿では,効率的なクエリベースのメンバシップ推論攻撃(MIA)を提案する。実験結果から,提案手法は離散時間と連続時間の両方の拡散モデル上で,2つのクエリで競合性能を達成できることが示唆された。我々の知る限り、本研究はテキスト音声タスクにおけるMIAへの拡散モデルのロバスト性について初めて研究するものである。
論文参考訳（メタデータ） (2023-05-26T16:38:48Z)
Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文参考訳（メタデータ） (2022-06-30T18:31:51Z)
A Study on Speech Enhancement Based on Diffusion Probabilistic Model [63.38586161802788]
雑音信号からクリーンな音声信号を復元することを目的とした拡散確率モデルに基づく音声強調モデル(DiffuSE)を提案する。実験結果から、DiffuSEは、標準化されたVoice Bankコーパスタスクにおいて、関連する音声生成モデルに匹敵する性能が得られることがわかった。
論文参考訳（メタデータ） (2021-07-25T19:23:18Z)
Variational Diffusion Models [33.0719137062396]
本稿では,画像密度推定ベンチマークの最先端可能性を求める拡散モデルについて紹介する。差分下界 (VLB) は, 拡散したデータの信号対雑音比において, 著しく短い表現に単純化されることを示す。
論文参考訳（メタデータ） (2021-07-01T17:43:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。