論文の概要: Understanding Diffusion Models: A Unified Perspective
- arxiv url: http://arxiv.org/abs/2208.11970v1
- Date: Thu, 25 Aug 2022 09:55:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-26 13:13:33.997396
- Title: Understanding Diffusion Models: A Unified Perspective
- Title(参考訳): 拡散モデルを理解する:統一的な視点
- Authors: Calvin Luo
- Abstract要約: 拡散モデルは生成モデルとして素晴らしい能力を示している。
変動的視点と得点的視点の両方にわたる拡散モデルの理解をレビューし、デミスティフィケートし、統一する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models have shown incredible capabilities as generative models;
indeed, they power the current state-of-the-art models on text-conditioned
image generation such as Imagen and DALL-E 2. In this work we review,
demystify, and unify the understanding of diffusion models across both
variational and score-based perspectives. We first derive Variational Diffusion
Models (VDM) as a special case of a Markovian Hierarchical Variational
Autoencoder, where three key assumptions enable tractable computation and
scalable optimization of the ELBO. We then prove that optimizing a VDM boils
down to learning a neural network to predict one of three potential objectives:
the original source input from any arbitrary noisification of it, the original
source noise from any arbitrarily noisified input, or the score function of a
noisified input at any arbitrary noise level. We then dive deeper into what it
means to learn the score function, and connect the variational perspective of a
diffusion model explicitly with the Score-based Generative Modeling perspective
through Tweedie's Formula. Lastly, we cover how to learn a conditional
distribution using diffusion models via guidance.
- Abstract(参考訳): 拡散モデルは生成モデルとして素晴らしい能力を示しており、実際、ImagenやDALL-E 2.0のようなテキスト条件の画像生成において現在の最先端モデルに電力を供給している。
本稿では,変動モデルとスコアモデルの両方の観点から,拡散モデルの理解をレビュー,デミスタライズし,統一する。
まず,可変拡散モデル(vdm)をマルコフ階層型変分オートエンコーダの特殊な場合として導出する。
次に、VDMの最適化はニューラルネットワークを学習して、任意の雑音化からの原音源入力、任意の雑音レベルからの原音源ノイズ、任意の雑音レベルにおける雑音化入力のスコア関数の3つの潜在的目標のうちの1つを予測することを証明した。
次に、スコア関数の学習の意味を深く掘り下げ、拡散モデルの変分的視点を、ツイーディのフォーミュラを通してスコアベースの生成モデリングの視点と明示的に結びつける。
最後に,拡散モデルを用いた条件分布の学習法を指導により紹介する。
関連論文リスト
- GUD: Generation with Unified Diffusion [40.64742332352373]
拡散生成モデルは、データサンプルにノイズを徐々に付加するプロセスを反転させることで、ノイズをデータに変換する。
設計自由度を大幅に向上した拡散生成モデル統合フレームワークを開発した。
論文 参考訳(メタデータ) (2024-10-03T16:51:14Z) - Sub-graph Based Diffusion Model for Link Prediction [43.15741675617231]
拡散確率モデル(Denoising Diffusion Probabilistic Models, DDPM)は、例外的な品質を持つ同時代の生成モデルである。
本研究では,ベイズ式による確率推定過程を分解するために,専用設計を用いたリンク予測のための新しい生成モデルを構築した。
提案手法は,(1)再トレーニングを伴わないデータセット間の転送可能性,(2)限られたトレーニングデータに対する有望な一般化,(3)グラフ敵攻撃に対する堅牢性など,多くの利点を示す。
論文 参考訳(メタデータ) (2024-09-13T02:23:55Z) - Controlling the Fidelity and Diversity of Deep Generative Models via Pseudo Density [70.14884528360199]
本稿では, GAN や拡散モデルなどのバイアス深層生成モデルへのアプローチを導入し, 忠実度の向上や多様性の向上を図ったデータ生成手法を提案する。
提案手法では, 擬似密度という, 個人サンプルの新たな測定基準を用いて, トレーニングとデータ生成の分布を操作する。
論文 参考訳(メタデータ) (2024-07-11T16:46:04Z) - Diffusion-based 3D Object Detection with Random Boxes [58.43022365393569]
既存のアンカーベースの3D検出方法は、アンカーの実証的な設定に依存しており、アルゴリズムはエレガンスを欠いている。
提案するDiff3Detは,検出ボックスを生成対象として考慮し,拡散モデルから3次元オブジェクト検出のための提案生成へ移行する。
推論段階では、モデルは予測結果にランダムボックスのセットを徐々に洗練する。
論文 参考訳(メタデータ) (2023-09-05T08:49:53Z) - Diff-Instruct: A Universal Approach for Transferring Knowledge From
Pre-trained Diffusion Models [77.83923746319498]
本稿では,任意の生成モデルの学習を指導するDiff-Instructというフレームワークを提案する。
Diff-Instructは、最先端の単一ステップ拡散モデルであることを示す。
GANモデルの精製実験により、Diff-InstructはGANモデルの事前訓練されたジェネレータを一貫して改善できることが示されている。
論文 参考訳(メタデータ) (2023-05-29T04:22:57Z) - SinDiffusion: Learning a Diffusion Model from a Single Natural Image [159.4285444680301]
SinDiffusionは1つの自然な画像からパッチの内部分布を捉えるためにデノナイズ拡散モデルを利用する。
SinDiffusionは、2つのコア設計に基づいている。まず、SinDiffusionは、段階的にスケールが成長する複数のモデルではなく、1つのスケールで1つのモデルで訓練されている。
第2に,拡散ネットワークのパッチレベルの受容領域は,画像のパッチ統計を捉える上で重要かつ効果的であることを示す。
論文 参考訳(メタデータ) (2022-11-22T18:00:03Z) - OCD: Learning to Overfit with Conditional Diffusion Models [95.1828574518325]
入力サンプルxに重みを条件付けした動的モデルを提案する。
基本モデルを x とそのラベル y 上で微調整することで得られる重みに一致することを学習する。
論文 参考訳(メタデータ) (2022-10-02T09:42:47Z) - Diffusion Models in Vision: A Survey [80.82832715884597]
拡散モデルは、前方拡散段階と逆拡散段階の2つの段階に基づく深層生成モデルである。
拡散モデルは、既知の計算負荷にもかかわらず、生成したサンプルの品質と多様性に対して広く評価されている。
論文 参考訳(メタデータ) (2022-09-10T22:00:30Z) - Diffusion Models: A Comprehensive Survey of Methods and Applications [10.557289965753437]
拡散モデル(英: Diffusion model)は、密度理論の確立を伴う様々なタスクにおいて印象的な結果を示す深層生成モデルのクラスである。
近年,拡散モデルの性能向上への熱意が高まっている。
論文 参考訳(メタデータ) (2022-09-02T02:59:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。