論文の概要: Noise Estimation for Generative Diffusion Models
- arxiv url: http://arxiv.org/abs/2104.02600v1
- Date: Tue, 6 Apr 2021 15:46:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 16:39:27.994966
- Title: Noise Estimation for Generative Diffusion Models
- Title(参考訳): 生成拡散モデルのノイズ推定
- Authors: Robin San-Roman, Eliya Nachmani, Lior Wolf
- Abstract要約: そこで本研究では,任意のステップの雑音パラメータを調整可能な,単純で汎用的な学習手法を提案する。
私たちのアプローチは計算コストが無視できるものです。
- 参考スコア(独自算出の注目度): 91.22679787578438
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative diffusion models have emerged as leading models in speech and
image generation. However, in order to perform well with a small number of
denoising steps, a costly tuning of the set of noise parameters is needed. In
this work, we present a simple and versatile learning scheme that can
step-by-step adjust those noise parameters, for any given number of steps,
while the previous work needs to retune for each number separately.
Furthermore, without modifying the weights of the diffusion model, we are able
to significantly improve the synthesis results, for a small number of steps.
Our approach comes at a negligible computation cost.
- Abstract(参考訳): 生成拡散モデルは、音声および画像生成の主要なモデルとして現れている。
しかし,少数のデノゲーションステップで良好に動作するためには,ノイズパラメータのセットの調整に費用がかかる必要がある。
本研究では,任意のステップ数に対して,これらのノイズパラメータをステップバイステップで調整可能な,単純で汎用的な学習手法を提案する。
さらに,拡散モデルの重みを変更することなく,少数のステップにおいて,合成結果を大幅に改善することができる。
私たちのアプローチは計算コストが無視できるものです。
関連論文リスト
- Blue noise for diffusion models [48.274015390665205]
本稿では,画像内および画像間の相関雑音を考慮した拡散モデルを提案する。
我々のフレームワークは、勾配流を改善するために、1つのミニバッチ内に画像間の相関を導入することができる。
本手法を用いて,各種データセットの質的,定量的な評価を行う。
論文 参考訳(メタデータ) (2024-02-07T14:59:25Z) - Not All Steps are Equal: Efficient Generation with Progressive Diffusion
Models [62.155612146799314]
ステップ適応トレーニングと呼ばれる新しい2段階のトレーニング戦略を提案する。
初期段階では、ベース・デノナイジング・モデルはすべてのタイムステップを包含するように訓練される。
タイムステップを別々のグループに分割し、各グループ内でモデルを微調整して、特殊な認知機能を実現します。
論文 参考訳(メタデータ) (2023-12-20T03:32:58Z) - One More Step: A Versatile Plug-and-Play Module for Rectifying Diffusion
Schedule Flaws and Enhancing Low-Frequency Controls [77.42510898755037]
One More Step (OMS) は、推論中に単純だが効果的なステップを付加したコンパクトネットワークである。
OMSは画像の忠実度を高め、トレーニングと推論の二分法を調和させ、元のモデルパラメータを保存する。
トレーニングが完了すると、同じ潜在ドメインを持つ様々な事前訓練された拡散モデルが同じOMSモジュールを共有することができる。
論文 参考訳(メタデータ) (2023-11-27T12:02:42Z) - Resfusion: Prior Residual Noise embedded Denoising Diffusion
Probabilistic Models [3.0731937470362376]
Denoising Diffusion Probabilistic Modelsは、入力画像に条件付きセグメンテーションマスクを生成することにより、画像セグメンテーションに広く利用されている。
従来の作業は、既存のエンドツーエンドモデルとデノナイズ拡散モデルとをシームレスに統合することはできません。
本稿では,セグメント化マスクやターゲット画像の種類を段階的に生成する新しいResnoise-Diffusion法を提案する。
論文 参考訳(メタデータ) (2023-11-25T02:09:38Z) - Boosting Fast and High-Quality Speech Synthesis with Linear Diffusion [85.54515118077825]
本稿では, 常微分方程式に基づく線形拡散モデル(LinDiff)を提案する。
計算複雑性を低減するため、LinDiffでは、入力信号を小さなパッチに分割するパッチベースの処理アプローチを採用している。
我々のモデルは、より高速な合成速度で自己回帰モデルに匹敵する品質の音声を合成することができる。
論文 参考訳(メタデータ) (2023-06-09T07:02:43Z) - Realistic Noise Synthesis with Diffusion Models [68.48859665320828]
Deep Image Denoisingモデルは、しばしば高品質なパフォーマンスのために大量のトレーニングデータに依存します。
本稿では,拡散モデル,すなわちRealistic Noise Synthesize Diffusor(RNSD)を用いて現実的な雑音を合成する新しい手法を提案する。
RNSDは、より現実的なノイズや空間的相関を複数の周波数で生成できるような、ガイド付きマルチスケールコンテンツを組み込むことができる。
論文 参考訳(メタデータ) (2023-05-23T12:56:01Z) - PTQD: Accurate Post-Training Quantization for Diffusion Models [22.567863065523902]
拡散モデルの学習後の量子化は、モデルのサイズを著しく減らし、再学習することなくサンプリングプロセスを加速することができる。
既存のPTQ法を直接低ビット拡散モデルに適用することは、生成されたサンプルの品質を著しく損なう可能性がある。
本稿では,量子化復調過程における量子化雑音と拡散摂動雑音の統一的な定式化を提案する。
論文 参考訳(メタデータ) (2023-05-18T02:28:42Z) - On tuning consistent annealed sampling for denoising score matching [17.10144603522758]
Scoreベースの生成モデルは、画像とオーディオ合成に最先端の品質を提供します。
本稿では,まず,スコアマッチングを訓練したモデルの3つの一般的なサンプリングスキームについて概説する。
論文 参考訳(メタデータ) (2021-04-08T12:19:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。