論文の概要: Image Generation Method Based on Heat Diffusion Models
- arxiv url: http://arxiv.org/abs/2504.19600v1
- Date: Mon, 28 Apr 2025 09:03:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.374676
- Title: Image Generation Method Based on Heat Diffusion Models
- Title(参考訳): 熱拡散モデルに基づく画像生成法
- Authors: Pengfei Zhang, Shouqing Jia,
- Abstract要約: 熱拡散モデル (HDM) は、DDPMと同じトレーニングプロセスを維持しながらピクセルレベルの演算を組み込んだモデルである。
実験により, DDPM, Diffusion Consistency Models (CDM), Latent Diffusion Models (LDM), Vector Quantized Generative Adversarial Networks (VQGAN) などのモデルと比較して, HDMは高品質なサンプルを生成することができた。
- 参考スコア(独自算出の注目度): 4.923287660970805
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Denoising Diffusion Probabilistic Models (DDPMs) achieve high-quality image generation without adversarial training, but they process images as a whole. Since adjacent pixels are highly likely to belong to the same object, we propose the Heat Diffusion Model (HDM) to further preserve image details and generate more realistic images. HDM is a model that incorporates pixel-level operations while maintaining the same training process as DDPM. In HDM, the discrete form of the two-dimensional heat equation is integrated into the diffusion and generation formulas of DDPM, enabling the model to compute relationships between neighboring pixels during image processing. Our experiments demonstrate that HDM can generate higher-quality samples compared to models such as DDPM, Consistency Diffusion Models (CDM), Latent Diffusion Models (LDM), and Vector Quantized Generative Adversarial Networks (VQGAN).
- Abstract(参考訳): Denoising Diffusion Probabilistic Models (DDPM) は、敵対的訓練を伴わずに高品質な画像生成を実現するが、全体としては処理する。
隣接画素は同じ物体に属する可能性が高いため,画像の詳細をさらに保存し,よりリアルな画像を生成するための熱拡散モデル(HDM)を提案する。
HDMは、DDPMと同じトレーニングプロセスを維持しながらピクセルレベルの操作を組み込んだモデルである。
HDMでは、2次元熱方程式の離散形式をDDPMの拡散および生成公式に統合し、画像処理中に隣接する画素間の関係を計算する。
実験により, DDPM, Consistency Diffusion Models (CDM), Latent Diffusion Models (LDM), Vector Quantized Generative Adversarial Networks (VQGAN) などのモデルと比較して, HDMは高品質なサンプルを生成することができた。
関連論文リスト
- EM Distillation for One-step Diffusion Models [65.57766773137068]
最小品質の損失を最小限に抑えた1ステップ生成モデルに拡散モデルを蒸留する最大可能性に基づく手法を提案する。
本研究では, 蒸留プロセスの安定化を図るため, 再パラメータ化サンプリング手法とノイズキャンセリング手法を開発した。
論文 参考訳(メタデータ) (2024-05-27T05:55:22Z) - Latent Consistency Models: Synthesizing High-Resolution Images with
Few-Step Inference [60.32804641276217]
本稿では,LCM(Latent Consistency Models)を提案する。
高品質の768 x 768 24-step LCMは、トレーニングに32A100 GPU時間しかかからない。
また,画像データセットの微調整に適した新しいLCM法であるLCF(Latent Consistency Fine-tuning)についても紹介する。
論文 参考訳(メタデータ) (2023-10-06T17:11:58Z) - PartDiff: Image Super-resolution with Partial Diffusion Models [3.8435187580887717]
拡散確率モデル(DDPM)は,様々な画像生成タスクにおいて顕著な性能を達成している。
DDPMは、ランダムノイズから反復的にデノイングすることで、新しいデータを生成する。
しかし、拡散に基づく生成モデルは、多くのデノナイジングステップのために高い計算コストに悩まされる。
本稿では,部分拡散モデル (PartDiff) を提案する。
論文 参考訳(メタデータ) (2023-07-21T22:11:23Z) - Simultaneous Image-to-Zero and Zero-to-Noise: Diffusion Models with Analytical Image Attenuation [53.04220377034574]
高品質(未条件)な画像生成のための前方拡散プロセスに解析的画像減衰プロセスを導入することを提案する。
本手法は,フォワード画像からノイズへのマッピングを,テクスチメジからゼロへのマッピングとテクスティケロ・ツー・ノイズマッピングの同時マッピングとして表現する。
我々は,CIFAR-10やCelebA-HQ-256などの無条件画像生成や,超解像,サリエンシ検出,エッジ検出,画像インペインティングなどの画像条件下での下流処理について実験を行った。
論文 参考訳(メタデータ) (2023-06-23T18:08:00Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - DDFM: Denoising Diffusion Model for Multi-Modality Image Fusion [144.9653045465908]
拡散確率モデル(DDPM)に基づく新しい融合アルゴリズムを提案する。
近赤外可視画像融合と医用画像融合で有望な融合が得られた。
論文 参考訳(メタデータ) (2023-03-13T04:06:42Z) - Unifying Diffusion Models' Latent Space, with Applications to
CycleDiffusion and Guidance [95.12230117950232]
関係領域で独立に訓練された2つの拡散モデルから共通潜時空間が現れることを示す。
テキスト・画像拡散モデルにCycleDiffusionを適用することで、大規模なテキスト・画像拡散モデルがゼロショット画像・画像拡散エディタとして使用できることを示す。
論文 参考訳(メタデータ) (2022-10-11T15:53:52Z) - Generative Modelling With Inverse Heat Dissipation [21.738877553160304]
本研究では,熱方程式を逆転させて画像を生成する拡散様モデルを提案する。PDEは,画像の2次元平面上での走行時に,微細な情報を消去する。
我々の新しいモデルでは、標準拡散モデルでは見られない創発的特性が示され、例えば画像の全体色と形状が乱れている。
論文 参考訳(メタデータ) (2022-06-21T13:40:38Z) - ILVR: Conditioning Method for Denoising Diffusion Probabilistic Models [22.84873720309945]
DDPMにおける生成過程を誘導し,高品質な画像を生成するために,反復潜時可変リファインメント(ILVR)を提案する。
提案手法は,生成を制御しながら高品質な画像を生成する。
論文 参考訳(メタデータ) (2021-08-06T04:43:13Z) - Denoising Diffusion Implicit Models [117.03720513930335]
DDPMと同様の訓練手順を施した反復的暗黙的確率モデルに対して,拡散暗黙モデル(DDIM)を提案する。
DDIMsは、DDPMsと比較して、壁面時間で10倍から50倍高速な高品質のサンプルを作成できる。
論文 参考訳(メタデータ) (2020-10-06T06:15:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。