論文の概要: Efficient Diffusion Models: A Survey
- arxiv url: http://arxiv.org/abs/2502.06805v1
- Date: Mon, 03 Feb 2025 10:15:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-16 04:07:10.665578
- Title: Efficient Diffusion Models: A Survey
- Title(参考訳): 効率的な拡散モデル:サーベイ
- Authors: Hui Shen, Jingxuan Zhang, Boning Xiong, Rui Hu, Shoufa Chen, Zhongwei Wan, Xin Wang, Yu Zhang, Zixuan Gong, Guangyin Bao, Chaofan Tao, Yongfeng Huang, Ye Yuan, Mi Zhang,
- Abstract要約: 拡散モデルは高品質なコンテンツを生成できる強力な生成モデルとして登場してきた。
これらの能力は、重要な計算資源と長い生成時間のコストがかかる。
本稿では,効率的な拡散モデルの研究を体系的かつ包括的にレビューする。
- 参考スコア(独自算出の注目度): 33.6141754415072
- License:
- Abstract: Diffusion models have emerged as powerful generative models capable of producing high-quality contents such as images, videos, and audio, demonstrating their potential to revolutionize digital content creation. However, these capabilities come at the cost of their significant computational resources and lengthy generation time, underscoring the critical need to develop efficient techniques for practical deployment. In this survey, we provide a systematic and comprehensive review of research on efficient diffusion models. We organize the literature in a taxonomy consisting of three main categories, covering distinct yet interconnected efficient diffusion model topics from algorithm-level, system-level, and framework perspective, respectively. We have also created a GitHub repository where we organize the papers featured in this survey at https://github.com/AIoT-MLSys-Lab/Efficient-Diffusion-Model-Survey. We hope our survey can serve as a valuable resource to help researchers and practitioners gain a systematic understanding of efficient diffusion model research and inspire them to contribute to this important and exciting field.
- Abstract(参考訳): 拡散モデルは、画像、ビデオ、オーディオなどの高品質なコンテンツを生成できる強力な生成モデルとして登場し、デジタルコンテンツの創造に革命をもたらす可能性を示している。
しかし、これらの能力は重要な計算資源と長い生成時間のコストを伴い、実用的な展開のための効率的な技術を開発するための重要な必要性を浮き彫りにしている。
本研究では,効率的な拡散モデルに関する研究の体系的,包括的レビューを行う。
本論文は,アルゴリズムレベル,システムレベル,フレームワークの観点から,相互に相互に相互に連携する効率的な拡散モデルトピックを網羅した,3つの主要なカテゴリからなる分類学の文献を整理する。
GitHubリポジトリも作成しました。この調査で取り上げられた論文はhttps://github.com/AIoT-MLSys-Lab/Efficient-Diffusion-Model-Survey.comでまとめています。
我々の調査は、研究者や実践者が効率的な拡散モデル研究の体系的な理解を得て、この重要でエキサイティングな分野に貢献するための貴重な情報源となることを願っています。
関連論文リスト
- Diffusion Models in Recommendation Systems: A Survey [8.741075482543991]
推薦システムにおける拡散モデルは、複雑なユーザとアイテムの分布を管理するのに優れている。
本稿では,拡散モデルを用いたレコメンデータシステムにおける過去の研究論文の分類法を提案する。
拡散モデルにおける基礎アルゴリズムとそのレコメンデーションシステムへの応用について述べる。
論文 参考訳(メタデータ) (2025-01-17T20:43:47Z) - A Survey on Diffusion Models for Recommender Systems [36.543994040915926]
本稿では,拡散モデルに関する最初の総合的な調査について紹介する。
DMは、堅牢な生成能力のため、レコメンデーターシステムのための有望なソリューションとして現れてきた。
我々の分類学は、複雑なデータ分布を捉える際の拡散モデルのユニークな強みを強調している。
論文 参考訳(メタデータ) (2024-09-08T08:57:12Z) - Diffusion Models in Low-Level Vision: A Survey [82.77962165415153]
拡散モデルに基づくソリューションは、優れた品質と多様性のサンプルを作成する能力で広く称賛されている。
本稿では,3つの一般化拡散モデリングフレームワークを提案し,それらと他の深層生成モデルとの相関関係について検討する。
医療、リモートセンシング、ビデオシナリオなど、他のタスクに適用された拡張拡散モデルについて要約する。
論文 参考訳(メタデータ) (2024-06-17T01:49:27Z) - YaART: Yet Another ART Rendering Technology [119.09155882164573]
そこで本研究では,ヒトの嗜好に適合する新しい生産段階のテキスト・ツー・イメージ拡散モデルYaARTを紹介した。
これらの選択がトレーニングプロセスの効率と生成された画像の品質にどのように影響するかを分析する。
高品質な画像の小さなデータセットでトレーニングされたモデルが、より大きなデータセットでトレーニングされたモデルとうまく競合できることを実証する。
論文 参考訳(メタデータ) (2024-04-08T16:51:19Z) - Generative AI in Vision: A Survey on Models, Metrics and Applications [0.0]
生成AIモデルは、現実的で多様なデータサンプルの作成を可能にすることで、さまざまな分野に革命をもたらした。
これらのモデルの中で、拡散モデルは高品質な画像、テキスト、オーディオを生成するための強力なアプローチとして現れている。
本稿では,AI拡散モデルとレガシモデルについて概観し,その基礎となる技術,異なる領域にわたる応用,課題について概説する。
論文 参考訳(メタデータ) (2024-02-26T07:47:12Z) - Efficient Large Language Models: A Survey [45.39970635367852]
この調査は、効率的な大規模言語モデル研究の体系的で包括的なレビューを提供する。
文献を3つの主要なカテゴリからなる分類学で整理し、異なるが相互に相互に繋がる効率的なLLMのトピックを網羅する。
この調査で特集された論文を整理するGitHubリポジトリも作成しました。
論文 参考訳(メタデータ) (2023-12-06T19:18:42Z) - A Survey on Video Diffusion Models [103.03565844371711]
AI生成コンテンツ(AIGC)の最近の波は、コンピュータビジョンでかなりの成功を収めている。
その印象的な生成能力のため、拡散モデルは徐々にGANと自動回帰変換器に基づく手法に取って代わられている。
本稿では,AIGC時代の映像拡散モデルについて概観する。
論文 参考訳(メタデータ) (2023-10-16T17:59:28Z) - Learning from models beyond fine-tuning [78.20895343699658]
Learn From Model (LFM) は、モデルインターフェースに基づいた基礎モデル(FM)の研究、修正、設計に焦点を当てている。
LFM技術の研究は、モデルチューニング、モデル蒸留、モデル再利用、メタラーニング、モデル編集の5つの分野に大別できる。
本稿では, LFM の観点から, FM に基づく現在の手法を概観する。
論文 参考訳(メタデータ) (2023-10-12T10:20:36Z) - Diffusion Model is an Effective Planner and Data Synthesizer for
Multi-Task Reinforcement Learning [101.66860222415512]
Multi-Task Diffusion Model (textscMTDiff) は、トランスフォーマーのバックボーンを組み込んだ拡散に基づく手法であり、生成計画とデータ合成のための素早い学習を行う。
生成計画において、textscMTDiffはMeta-World上の50のタスクとMaze2D上の8のマップで最先端のアルゴリズムより優れています。
論文 参考訳(メタデータ) (2023-05-29T05:20:38Z) - A Survey on Generative Diffusion Model [75.93774014861978]
拡散モデルは、深層生成モデルの新たなクラスである。
時間を要する反復生成過程や高次元ユークリッド空間への閉じ込めなど、いくつかの制限がある。
本調査では,拡散モデルの向上を目的とした高度な手法を多数提示する。
論文 参考訳(メタデータ) (2022-09-06T16:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。