論文の概要: Diffusion Models: A Comprehensive Survey of Methods and Applications
- arxiv url: http://arxiv.org/abs/2209.00796v2
- Date: Tue, 6 Sep 2022 02:20:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 10:43:02.325027
- Title: Diffusion Models: A Comprehensive Survey of Methods and Applications
- Title(参考訳): 拡散モデル:方法と応用に関する総合的な調査
- Authors: Ling Yang, Zhilong Zhang, Shenda Hong, Wentao Zhang
- Abstract要約: 拡散モデル(英: Diffusion model)は、密度理論の確立を伴う様々なタスクにおいて印象的な結果を示す深層生成モデルのクラスである。
近年,拡散モデルの性能向上への熱意が高まっている。
- 参考スコア(独自算出の注目度): 10.557289965753437
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models are a class of deep generative models that have shown
impressive results on various tasks with dense theoretical founding. Although
diffusion models have achieved impressive quality and diversity of sample
synthesis than other state-of-the-art models, they still suffer from costly
sampling procedure and sub-optimal likelihood estimation. Recent studies have
shown great enthusiasm on improving the performance of diffusion model. In this
article, we present a first comprehensive review of existing variants of the
diffusion models. Specifically, we provide a first taxonomy of diffusion models
and categorize them variants to three types, namely sampling-acceleration
enhancement, likelihood-maximization enhancement and data-generalization
enhancement. We also introduce in detail other five generative models (i.e.,
variational autoencoders, generative adversarial networks, normalizing flow,
autoregressive models, and energy-based models), and clarify the connections
between diffusion models and these generative models. Then we make a thorough
investigation into the applications of diffusion models, including computer
vision, natural language processing, waveform signal processing, multi-modal
modeling, molecular graph generation, time series modeling, and adversarial
purification. Furthermore, we propose new perspectives pertaining to the
development of this generative model.
- Abstract(参考訳): 拡散モデルは、密集した理論的基礎を持つ様々なタスクで印象的な結果を示す、深い生成モデルのクラスである。
拡散モデルは、他の最先端モデルよりも優れた品質と多彩なサンプル合成を達成したが、それでもコストのかかるサンプリング手順と最適度推定に苦しむ。
近年の研究では拡散モデルの性能向上に大きな関心が寄せられている。
本稿では, 拡散モデルの既存変種について, 初めて包括的レビューを行う。
具体的には,拡散モデルの最初の分類法を提供し,サンプリング・アクセラレーション・エンハンスメント,可能性最大化・データ一般化エンハンスメントという3つのタイプに分類する。
また、他の5つの生成モデル(変分オートエンコーダ、生成逆ネットワーク、正規化フロー、自己回帰モデル、エネルギーベースモデル)を詳細に紹介し、拡散モデルとそれらの生成モデルとの関係を明らかにする。
次に,コンピュータビジョン,自然言語処理,波形信号処理,マルチモーダルモデリング,分子グラフ生成,時系列モデリング,対向的浄化などの拡散モデルの適用について,徹底的に検討する。
さらに,この生成モデルの開発に関する新たな視点を提案する。
関連論文リスト
- Guided Diffusion from Self-Supervised Diffusion Features [49.78673164423208]
ガイダンスは拡散モデルにおいて重要な概念として機能するが、その効果は追加のデータアノテーションや事前学習の必要性によって制限されることが多い。
本稿では,拡散モデルからガイダンスを抽出するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-14T11:19:11Z) - A Survey on Video Diffusion Models [107.4734254941333]
AI生成コンテンツ(AIGC)の最近の波は、コンピュータビジョンでかなりの成功を収めている。
その印象的な生成能力のため、拡散モデルは徐々にGANと自動回帰変換器に基づく手法に取って代わられている。
本稿では,AIGC時代の映像拡散モデルについて概観する。
論文 参考訳(メタデータ) (2023-10-16T17:59:28Z) - The Emergence of Reproducibility and Consistency in Diffusion Models [10.699652598371213]
同じスタートノイズ入力と決定論的サンプリングが与えられた場合、異なる拡散モデルはしばしば驚くほど類似した出力が得られる。
拡散モデルはトレーニングデータサイズの影響を受けやすい分布を学習していることを示す。
この価値ある性質は、条件付き使用、逆問題解決、モデル微調整など、拡散モデルの多くの変種に一般化される。
論文 参考訳(メタデータ) (2023-10-08T19:02:46Z) - A Survey of Diffusion Models in Natural Language Processing [11.233768932957771]
拡散モデルは、ネットワークや多様体にまたがる情報や信号の拡散を捉える。
本稿は,NLPで使用される拡散モデルの異なる定式化,その強度と限界,それらの応用について論じる。
論文 参考訳(メタデータ) (2023-05-24T03:25:32Z) - Analyzing Bias in Diffusion-based Face Generation Models [75.80072686374564]
拡散モデルは、合成データ生成と画像編集アプリケーションでますます人気がある。
本研究では, 性別, 人種, 年齢などの属性に関して, 拡散型顔生成モデルにおけるバイアスの存在について検討する。
本研究は,GAN(Generative Adversarial Network)とGAN(Generative Adversarial Network)をベースとした顔生成モデルにおいて,データセットサイズが属性組成および知覚品質に与える影響について検討する。
論文 参考訳(メタデータ) (2023-05-10T18:22:31Z) - Diffusion Models for Time Series Applications: A Survey [23.003273147019446]
拡散モデルは現在、画像、ビデオ、テキスト合成に使われている。
我々は,時系列予測,計算,生成のための拡散に基づく手法に着目する。
拡散型手法の共通限界を結論し,今後の研究の方向性を明らかにする。
論文 参考訳(メタデータ) (2023-05-01T02:06:46Z) - Reduce, Reuse, Recycle: Compositional Generation with Energy-Based
Diffusion Models and MCMC [106.06185677214353]
拡散モデルは、多くの領域において、生成モデリングの一般的なアプローチとなっている。
本稿では,新しい構成演算子の利用を可能にする拡散モデルのエネルギーベースパラメータ化を提案する。
これらのサンプルは、幅広い問題にまたがって構成生成の顕著な改善につながっている。
論文 参考訳(メタデータ) (2023-02-22T18:48:46Z) - Diffusion Models in Vision: A Survey [80.82832715884597]
拡散モデルは、前方拡散段階と逆拡散段階の2つの段階に基づく深層生成モデルである。
拡散モデルは、既知の計算負荷にもかかわらず、生成したサンプルの品質と多様性に対して広く評価されている。
論文 参考訳(メタデータ) (2022-09-10T22:00:30Z) - A Survey on Generative Diffusion Model [75.93774014861978]
拡散モデルは、深層生成モデルの新たなクラスである。
時間を要する反復生成過程や高次元ユークリッド空間への閉じ込めなど、いくつかの制限がある。
本調査では,拡散モデルの向上を目的とした高度な手法を多数提示する。
論文 参考訳(メタデータ) (2022-09-06T16:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。