論文の概要: DogLayout: Denoising Diffusion GAN for Discrete and Continuous Layout Generation
- arxiv url: http://arxiv.org/abs/2412.00381v1
- Date: Sat, 30 Nov 2024 07:12:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:46:00.309766
- Title: DogLayout: Denoising Diffusion GAN for Discrete and Continuous Layout Generation
- Title(参考訳): DogLayout: 離散および連続レイアウト生成のための拡散GANのノイズ化
- Authors: Zhaoxing Gan, Guangnan Ye,
- Abstract要約: 我々は,テキストbfDog(textbfDentextbfoising textbfGAN textbf textbf model)を提案する。
実験の結果、ドッグはサンプリングコストを最大175倍に削減し、既存の拡散モデルと比較して16.43から9.59に削減した。
- 参考スコア(独自算出の注目度): 0.6138671548064356
- License:
- Abstract: Layout Generation aims to synthesize plausible arrangements from given elements. Currently, the predominant methods in layout generation are Generative Adversarial Networks (GANs) and diffusion models, each presenting its own set of challenges. GANs typically struggle with handling discrete data due to their requirement for differentiable generated samples and have historically circumvented the direct generation of discrete labels by treating them as fixed conditions. Conversely, diffusion-based models, despite achieving state-of-the-art performance across several metrics, require extensive sampling steps which lead to significant time costs. To address these limitations, we propose \textbf{DogLayout} (\textbf{D}en\textbf{o}ising Diffusion \textbf{G}AN \textbf{Layout} model), which integrates a diffusion process into GANs to enable the generation of discrete label data and significantly reduce diffusion's sampling time. Experiments demonstrate that DogLayout considerably reduces sampling costs by up to 175 times and cuts overlap from 16.43 to 9.59 compared to existing diffusion models, while also surpassing GAN based and other layout methods. Code is available at https://github.com/deadsmither5/DogLayout.
- Abstract(参考訳): レイアウト生成は、与えられた要素からもっともらしい配列を合成することを目的としている。
現在、レイアウト生成の主要な手法は、GAN(Generative Adversarial Networks)と拡散モデルである。
GANは通常、異なる生成サンプルを必要とするため、離散データを扱うのに苦労し、それらを固定条件として扱うことで、歴史的に離散ラベルの直接生成を回避してきた。
逆に拡散に基づくモデルは、いくつかの指標で最先端のパフォーマンスを達成しているにもかかわらず、広範囲なサンプリングステップを必要とし、かなりの時間的コストをもたらす。
これらの制約に対処するため, 拡散処理をGANに統合し, 離散ラベルデータの生成を可能にし, 拡散のサンプリング時間を著しく短縮する, \textbf{D}en\textbf{o}ising Diffusion \textbf{G}AN \textbf{Layout} modelを提案する。
実験の結果、DogLayoutはサンプリングコストを最大175倍に削減し、既存の拡散モデルに比べて16.43から9.59に削減し、GANベースや他のレイアウト手法を抜いた。
コードはhttps://github.com/deadsmither5/DogLayout.comで入手できる。
関連論文リスト
- Towards Aligned Layout Generation via Diffusion Model with Aesthetic Constraints [53.66698106829144]
広い範囲のレイアウト生成タスクを処理する統一モデルを提案する。
このモデルは連続拡散モデルに基づいている。
実験結果から,LACEは高品質なレイアウトを生成することがわかった。
論文 参考訳(メタデータ) (2024-02-07T11:12:41Z) - Semi-Implicit Denoising Diffusion Models (SIDDMs) [50.30163684539586]
Denoising Diffusion Probabilistic Models (DDPM)のような既存のモデルは、高品質で多様なサンプルを提供するが、本質的に多くの反復的なステップによって遅くなる。
暗黙的要因と明示的要因を一致させることにより、この問題に対処する新しいアプローチを導入する。
提案手法は拡散モデルに匹敵する生成性能と,少数のサンプリングステップを持つモデルに比較して非常に優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2023-06-21T18:49:22Z) - A Cheaper and Better Diffusion Language Model with Soft-Masked Noise [62.719656543880596]
Masked-Diffuse LMは言語モデリングのための新しい拡散モデルであり、言語の言語的特徴に触発されている。
具体的には,テキストデータのノイズを改善するために,戦略的ソフトマスキングによってテキストに劣化を加える言語情報処理を設計する。
我々は,我々のMasked-Diffuse LMが,高効率の最先端拡散モデルよりも優れた生成品質を達成できることを実証した。
論文 参考訳(メタデータ) (2023-04-10T17:58:42Z) - LayoutDiffusion: Improving Graphic Layout Generation by Discrete
Diffusion Probabilistic Models [50.73105631853759]
レイアウト自動生成のための新しい生成モデルLayoutDiffusionを提案する。
このプロセスでは,前方ステップの成長に伴うレイアウトの混乱が増している。
これにより、プラグアンドプレイ方式で2つの条件付きレイアウト生成タスクを再トレーニングすることなく実現し、既存の方法よりも優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-03-21T04:41:02Z) - Unite and Conquer: Plug & Play Multi-Modal Synthesis using Diffusion
Models [54.1843419649895]
拡散確率モデル(DDPM)に基づく解を提案する。
他の生成モデルよりも拡散モデルを選択する動機は、拡散モデルの柔軟な内部構造に由来する。
提案手法は,複数のサブタスクで訓練された複数の拡散モデルを統一し,組み合わせたタスクを克服する。
論文 参考訳(メタデータ) (2022-12-01T18:59:55Z) - Diffusion-GAN: Training GANs with Diffusion [135.24433011977874]
GAN(Generative Adversarial Network)は、安定してトレーニングすることが難しい。
フォワード拡散チェーンを利用してインスタンスノイズを生成する新しいGANフレームワークであるDiffusion-GANを提案する。
我々は,Diffusion-GANにより,最先端のGANよりも高い安定性とデータ効率で,よりリアルな画像を生成することができることを示す。
論文 参考訳(メタデータ) (2022-06-05T20:45:01Z) - Subspace Diffusion Generative Models [4.310834990284412]
スコアベースモデルは、高次元拡散過程を通じて、ノイズをデータにマッピングすることでサンプルを生成する。
データ分布がノイズに向かって進化するにつれて、射影による部分空間への拡散を制限する。
私たちのフレームワークは継続的拡散と完全に互換性があり、柔軟性を維持しています。
論文 参考訳(メタデータ) (2022-05-03T13:43:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。