論文の概要: Diffusion Models: A Comprehensive Survey of Methods and Applications
- arxiv url: http://arxiv.org/abs/2209.00796v1
- Date: Fri, 2 Sep 2022 02:59:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-05 12:38:35.784268
- Title: Diffusion Models: A Comprehensive Survey of Methods and Applications
- Title(参考訳): 拡散モデル:方法と応用に関する総合的な調査
- Authors: Ling Yang, Zhilong Zhang, Shenda Hong
- Abstract要約: 拡散モデル(英: Diffusion model)は、密度理論の確立を伴う様々なタスクにおいて印象的な結果を示す深層生成モデルのクラスである。
近年,拡散モデルの性能向上への熱意が高まっている。
- 参考スコア(独自算出の注目度): 5.96105931794036
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models are a class of deep generative models that have shown
impressive results on various tasks with dense theoretical founding. Although
diffusion models have achieved impressive quality and diversity of sample
synthesis than other state-of-the-art models, they still suffer from costly
sampling procedure and sub-optimal likelihood estimation. Recent studies have
shown great enthusiasm on improving the performance of diffusion model. In this
article, we present a first comprehensive review of existing variants of the
diffusion models. Specifically, we provide a first taxonomy of diffusion models
and categorize them variants to three types, namely sampling-acceleration
enhancement, likelihood-maximization enhancement and data-generalization
enhancement. We also introduce in detail other five generative models (i.e.,
variational autoencoders, generative adversarial networks, normalizing flow,
autoregressive models, and energy-based models), and clarify the connections
between diffusion models and these generative models. Then we make a thorough
investigation into the applications of diffusion models, including computer
vision, natural language processing, waveform signal processing, multi-modal
modeling, molecular graph generation, time series modeling, and adversarial
purification. Furthermore, we propose new perspectives pertaining to the
development of this generative model.
- Abstract(参考訳): 拡散モデルは、密集した理論的基礎を持つ様々なタスクで印象的な結果を示す、深い生成モデルのクラスである。
拡散モデルは、他の最先端モデルよりも優れた品質と多彩なサンプル合成を達成したが、それでもコストのかかるサンプリング手順と最適度推定に苦しむ。
近年の研究では拡散モデルの性能向上に大きな関心が寄せられている。
本稿では, 拡散モデルの既存変種について, 初めて包括的レビューを行う。
具体的には,拡散モデルの最初の分類法を提供し,サンプリング・アクセラレーション・エンハンスメント,可能性最大化・データ一般化エンハンスメントという3つのタイプに分類する。
また、他の5つの生成モデル(変分オートエンコーダ、生成逆ネットワーク、正規化フロー、自己回帰モデル、エネルギーベースモデル)を詳細に紹介し、拡散モデルとそれらの生成モデルとの関係を明らかにする。
次に,コンピュータビジョン,自然言語処理,波形信号処理,マルチモーダルモデリング,分子グラフ生成,時系列モデリング,対向的浄化などの拡散モデルの適用について,徹底的に検討する。
さらに,この生成モデルの開発に関する新たな視点を提案する。
関連論文リスト
- Hierarchically branched diffusion models for efficient and interpretable
multi-class conditional generation [0.8602553195689513]
分岐拡散モデルは、クラス間の固有の関係に従って階層的に分岐される。
分岐拡散モデルが複数のクラスから効率的にサンプルを生成できることを実証する。
論文 参考訳(メタデータ) (2022-12-21T05:27:23Z) - DiffusionBERT: Improving Generative Masked Language Models with
Diffusion Models [81.84866217721361]
DiffusionBERTは離散拡散モデルに基づく新しい生成マスク付き言語モデルである。
本稿では,各ステップに付加される雑音の度合いを制御する前方拡散プロセスのための新しいノイズスケジュールを提案する。
非条件テキスト生成の実験では、DiffusionBERTは既存のテキスト拡散モデルよりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-11-28T03:25:49Z) - SinDiffusion: Learning a Diffusion Model from a Single Natural Image [159.4285444680301]
SinDiffusionは1つの自然な画像からパッチの内部分布を捉えるためにデノナイズ拡散モデルを利用する。
SinDiffusionは、2つのコア設計に基づいている。まず、SinDiffusionは、段階的にスケールが成長する複数のモデルではなく、1つのスケールで1つのモデルで訓練されている。
第2に,拡散ネットワークのパッチレベルの受容領域は,画像のパッチ統計を捉える上で重要かつ効果的であることを示す。
論文 参考訳(メタデータ) (2022-11-22T18:00:03Z) - Diffusion Models for Medical Image Analysis: A Comprehensive Survey [7.272308924113656]
生成モデルのクラスである拡散モデルのデノイングは、近年、様々なディープラーニング問題に多大な関心を集めている。
拡散モデルは、その強いモードカバレッジと、生成されたサンプルの品質で広く評価されている。
本調査では,医療画像解析の分野における拡散モデルの概要について概観する。
論文 参考訳(メタデータ) (2022-11-14T23:50:52Z) - Unifying Diffusion Models' Latent Space, with Applications to
CycleDiffusion and Guidance [95.12230117950232]
関係領域で独立に訓練された2つの拡散モデルから共通潜時空間が現れることを示す。
テキスト・画像拡散モデルにCycleDiffusionを適用することで、大規模なテキスト・画像拡散モデルがゼロショット画像・画像拡散エディタとして使用できることを示す。
論文 参考訳(メタデータ) (2022-10-11T15:53:52Z) - On Distillation of Guided Diffusion Models [94.25159023822297]
そこで本研究では,分類器を含まない誘導拡散モデルから抽出し易いモデルへ抽出する手法を提案する。
ImageNet 64x64 と CIFAR-10 では、4つのサンプリングステップで元のモデルに匹敵する画像を生成することができる。
論文 参考訳(メタデータ) (2022-10-06T18:03:56Z) - Diffusion Models in Vision: A Survey [80.82832715884597]
拡散モデルは、前方拡散段階と逆拡散段階の2つの段階に基づく深層生成モデルである。
拡散モデルは、既知の計算負荷にもかかわらず、生成したサンプルの品質と多様性に対して広く評価されている。
論文 参考訳(メタデータ) (2022-09-10T22:00:30Z) - A Survey on Generative Diffusion Model [75.51029309815213]
拡散モデルには、遅い生成過程の自然な欠点があり、多くの強化された研究につながっている。
本稿では,学習スケジュール,トレーニング不要サンプリング,混合モデリング,スコア・アンド・拡散統一といった,拡散モデルを高速化する高度な手法を提案する。
拡散モデルを持つアプリケーションは、コンピュータビジョン、シーケンスモデリング、オーディオ、科学のためのAIを含む。
論文 参考訳(メタデータ) (2022-09-06T16:56:21Z) - Understanding Diffusion Models: A Unified Perspective [0.0]
拡散モデルは生成モデルとして素晴らしい能力を示している。
変動的視点と得点的視点の両方にわたる拡散モデルの理解をレビューし、デミスティフィケートし、統一する。
論文 参考訳(メタデータ) (2022-08-25T09:55:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。