Fugu-MT 論文翻訳(概要): Noise Estimation for Generative Diffusion Models

論文の概要: Noise Estimation for Generative Diffusion Models

arxiv url: http://arxiv.org/abs/2104.02600v1
Date: Tue, 6 Apr 2021 15:46:16 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-07 16:39:27.994966
Title: Noise Estimation for Generative Diffusion Models
Title（参考訳）: 生成拡散モデルのノイズ推定
Authors: Robin San-Roman, Eliya Nachmani, Lior Wolf
Abstract要約: そこで本研究では,任意のステップの雑音パラメータを調整可能な,単純で汎用的な学習手法を提案する。私たちのアプローチは計算コストが無視できるものです。
参考スコア（独自算出の注目度）: 91.22679787578438
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Generative diffusion models have emerged as leading models in speech and image generation. However, in order to perform well with a small number of denoising steps, a costly tuning of the set of noise parameters is needed. In this work, we present a simple and versatile learning scheme that can step-by-step adjust those noise parameters, for any given number of steps, while the previous work needs to retune for each number separately. Furthermore, without modifying the weights of the diffusion model, we are able to significantly improve the synthesis results, for a small number of steps. Our approach comes at a negligible computation cost.
Abstract（参考訳）: 生成拡散モデルは、音声および画像生成の主要なモデルとして現れている。しかし,少数のデノゲーションステップで良好に動作するためには,ノイズパラメータのセットの調整に費用がかかる必要がある。本研究では,任意のステップ数に対して,これらのノイズパラメータをステップバイステップで調整可能な,単純で汎用的な学習手法を提案する。さらに,拡散モデルの重みを変更することなく,少数のステップにおいて,合成結果を大幅に改善することができる。私たちのアプローチは計算コストが無視できるものです。

関連論文リスト

One Step Diffusion via Shortcut Models [109.72495454280627]
単一ネットワークとトレーニングフェーズを用いて高品質なサンプルを生成する,生成モデルのファミリであるショートカットモデルを導入する。ショートカットモデルは、現在のノイズレベルと所望のステップサイズにネットワークを条件付け、生成プロセスでモデルをスキップすることができる。蒸留と比較して、ショートカットモデルは複雑性を1つのネットワークとトレーニングフェーズに減らし、推論時に様々なステップ予算を許容する。
論文参考訳（メタデータ） (2024-10-16T13:34:40Z)
Discrete Copula Diffusion [44.96934660818884]
離散拡散モデルがより少ないステップで強い性能を達成するのを防ぐ基本的な制限を同定する。我々は,コプラモデルと呼ばれる別の深層生成モデルを導入することで,欠落した依存情報を補うための一般的なアプローチを提案する。本手法は拡散モデルとコプラモデルの両方を微調整する必要はないが, 高い品質のサンプル生成が可能であり, 分解ステップが著しく少ない。
論文参考訳（メタデータ） (2024-10-02T18:51:38Z)
Bayesian Inference of General Noise Model Parameters from Surface Code's Syndrome Statistics [0.0]
表面符号のテンソルネットワークシミュレータを統合する一般雑音モデルベイズ推論法を提案する。雑音パラメータが一定であり変化しない定常雑音に対しては,マルコフ連鎖モンテカルロに基づく手法を提案する。より現実的な状況である時間変化ノイズに対しては、シーケンシャルなモンテカルロに基づく別の手法を導入する。
論文参考訳（メタデータ） (2024-06-13T10:26:04Z)
One Noise to Rule Them All: Learning a Unified Model of Spatially-Varying Noise Patterns [33.293193191683145]
本稿では,複数種類のノイズを生成できる単一生成モデルを提案する。また, 逆手続き材料設計の改善に本モデルを適用した。
論文参考訳（メタデータ） (2024-04-25T02:23:11Z)
Blue noise for diffusion models [50.99852321110366]
本稿では,画像内および画像間の相関雑音を考慮した拡散モデルを提案する。我々のフレームワークは、勾配流を改善するために、1つのミニバッチ内に画像間の相関を導入することができる。本手法を用いて,各種データセットの質的,定量的な評価を行う。
論文参考訳（メタデータ） (2024-02-07T14:59:25Z)
Not All Steps are Equal: Efficient Generation with Progressive Diffusion Models [62.155612146799314]
ステップ適応トレーニングと呼ばれる新しい2段階のトレーニング戦略を提案する。初期段階では、ベース・デノナイジング・モデルはすべてのタイムステップを包含するように訓練される。タイムステップを別々のグループに分割し、各グループ内でモデルを微調整して、特殊な認知機能を実現します。
論文参考訳（メタデータ） (2023-12-20T03:32:58Z)
One More Step: A Versatile Plug-and-Play Module for Rectifying Diffusion Schedule Flaws and Enhancing Low-Frequency Controls [77.42510898755037]
One More Step (OMS) は、推論中に単純だが効果的なステップを付加したコンパクトネットワークである。 OMSは画像の忠実度を高め、トレーニングと推論の二分法を調和させ、元のモデルパラメータを保存する。トレーニングが完了すると、同じ潜在ドメインを持つ様々な事前訓練された拡散モデルが同じOMSモジュールを共有することができる。
論文参考訳（メタデータ） (2023-11-27T12:02:42Z)
AdaDiff: Adaptive Step Selection for Fast Diffusion Models [82.78899138400435]
我々は、インスタンス固有のステップ利用ポリシーを学ぶために設計された軽量フレームワークであるAdaDiffを紹介します。 AdaDiffはポリシーメソッドを使用して最適化され、慎重に設計された報酬関数を最大化する。我々は3つの画像生成と2つのビデオ生成ベンチマークの実験を行い、本手法がベースラインと同じような視覚的品質を実現することを示す。
論文参考訳（メタデータ） (2023-11-24T11:20:38Z)
Boosting Fast and High-Quality Speech Synthesis with Linear Diffusion [85.54515118077825]
本稿では, 常微分方程式に基づく線形拡散モデル(LinDiff)を提案する。計算複雑性を低減するため、LinDiffでは、入力信号を小さなパッチに分割するパッチベースの処理アプローチを採用している。我々のモデルは、より高速な合成速度で自己回帰モデルに匹敵する品質の音声を合成することができる。
論文参考訳（メタデータ） (2023-06-09T07:02:43Z)
On tuning consistent annealed sampling for denoising score matching [17.10144603522758]
Scoreベースの生成モデルは、画像とオーディオ合成に最先端の品質を提供します。本稿では,まず,スコアマッチングを訓練したモデルの3つの一般的なサンプリングスキームについて概説する。
論文参考訳（メタデータ） (2021-04-08T12:19:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。