論文の概要: Improving Denoising Diffusion Probabilistic Models via Exploiting Shared
Representations
- arxiv url: http://arxiv.org/abs/2311.16353v1
- Date: Mon, 27 Nov 2023 22:30:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-29 20:49:09.411920
- Title: Improving Denoising Diffusion Probabilistic Models via Exploiting Shared
Representations
- Title(参考訳): 共有表現の爆発による拡散確率モデルの改善
- Authors: Delaram Pirhayatifard, Mohammad Taha Toghani, Guha Balakrishnan,
C\'esar A. Uribe
- Abstract要約: SR-DDPMはノイズ拡散過程を逆転することで高品質な画像を生成する生成モデルのクラスである。
多様なデータ分布の類似性を利用して、画像の品質を損なうことなく、複数のタスクにスケールできる。
提案手法を標準画像データセット上で評価し、FIDとSSIMの指標で条件付きDDPMと条件付きDDPMの両方より優れていることを示す。
- 参考スコア(独自算出の注目度): 5.517338199249029
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In this work, we address the challenge of multi-task image generation with
limited data for denoising diffusion probabilistic models (DDPM), a class of
generative models that produce high-quality images by reversing a noisy
diffusion process. We propose a novel method, SR-DDPM, that leverages
representation-based techniques from few-shot learning to effectively learn
from fewer samples across different tasks. Our method consists of a core meta
architecture with shared parameters, i.e., task-specific layers with exclusive
parameters. By exploiting the similarity between diverse data distributions,
our method can scale to multiple tasks without compromising the image quality.
We evaluate our method on standard image datasets and show that it outperforms
both unconditional and conditional DDPM in terms of FID and SSIM metrics.
- Abstract(参考訳): 本研究では,ノイズ拡散過程を逆転させて高品質な画像を生成する生成モデルのクラスである拡散確率モデル (DDPM) について,限られたデータを用いたマルチタスク画像生成の課題に対処する。
本稿では,少数ショット学習から表現に基づく手法を活用して,タスクの異なるサンプルを効果的に学習するSR-DDPMを提案する。
提案手法は,共有パラメータを持つコアメタアーキテクチャ,すなわち排他パラメータを持つタスク固有層から構成される。
多様なデータ分布間の類似性を利用することで,画像品質を損なうことなく複数のタスクにスケールできる。
本手法を標準画像データセットで評価し,fid と ssim の指標で非条件ddpm および条件ddpm を上回っていることを示す。
関連論文リスト
- A Simple Approach to Unifying Diffusion-based Conditional Generation [63.389616350290595]
多様な条件生成タスクを処理するための、シンプルで統一されたフレームワークを導入します。
提案手法は,異なる推論時間サンプリング方式による多目的化を実現する。
我々のモデルは、非親密なアライメントや粗い条件付けのような追加機能をサポートしています。
論文 参考訳(メタデータ) (2024-10-15T09:41:43Z) - MMAR: Towards Lossless Multi-Modal Auto-Regressive Probabilistic Modeling [64.09238330331195]
本稿では,MMAR(Multi-Modal Auto-Regressive)確率モデルフレームワークを提案する。
離散化の手法とは異なり、MMARは情報損失を避けるために連続的に評価された画像トークンを取り入れる。
MMARは他のジョイントマルチモーダルモデルよりもはるかに優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-14T17:57:18Z) - SeNM-VAE: Semi-Supervised Noise Modeling with Hierarchical Variational Autoencoder [13.453138169497903]
SeNM-VAEは、ペアとアンペアの両方のデータセットを利用して、現実的な劣化データを生成する半教師付きノイズモデリング手法である。
実世界の画像認識と超分解能タスクのためのペアトレーニングサンプルを生成するために,本手法を用いた。
提案手法は, 合成劣化画像の品質を, 他の不対とペアのノイズモデリング法と比較して向上させる。
論文 参考訳(メタデータ) (2024-03-26T09:03:40Z) - Generalized Consistency Trajectory Models for Image Manipulation [59.576781858809355]
拡散モデル(DM)は、画像編集や復元などの応用と同様に、無条件生成において優れている。
本研究の目的は、一般化されたCTM(GCTM)を提案することによって、整合性軌道モデル(CTM)の完全なポテンシャルを解放することである。
本稿では,GCTMの設計空間について論じ,画像から画像への変換,復元,編集など,様々な画像操作タスクにおいて有効性を示す。
論文 参考訳(メタデータ) (2024-03-19T07:24:54Z) - Denoising Diffusion Bridge Models [54.87947768074036]
拡散モデルは、プロセスを使用してデータにノイズをマッピングする強力な生成モデルである。
画像編集のような多くのアプリケーションでは、モデル入力はランダムノイズではない分布から来る。
本研究では, DDBM(Denoising Diffusion Bridge Models)を提案する。
論文 参考訳(メタデータ) (2023-09-29T03:24:24Z) - Efficient Transfer Learning in Diffusion Models via Adversarial Noise [21.609168219488982]
拡散確率モデル (DPM) は画像生成タスクにおいて大きな可能性を証明している。
GANのような以前の研究は、十分なデータで学習したトレーニング済みモデルを転送することで、限られたデータ問題に対処してきた。
限られたデータ問題に対処するために,新しいDPMに基づくトランスファー学習手法であるTANを提案する。
論文 参考訳(メタデータ) (2023-08-23T06:44:44Z) - Markup-to-Image Diffusion Models with Scheduled Sampling [111.30188533324954]
画像生成の最近の進歩に基づき,画像にマークアップを描画するためのデータ駆動型アプローチを提案する。
このアプローチは拡散モデルに基づいており、デノナイジング操作のシーケンスを用いてデータの分布をパラメータ化する。
数式(La)、テーブルレイアウト(HTML)、シート音楽(LilyPond)、分子画像(SMILES)の4つのマークアップデータセットの実験を行った。
論文 参考訳(メタデータ) (2022-10-11T04:56:12Z) - Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - ILVR: Conditioning Method for Denoising Diffusion Probabilistic Models [22.84873720309945]
DDPMにおける生成過程を誘導し,高品質な画像を生成するために,反復潜時可変リファインメント(ILVR)を提案する。
提案手法は,生成を制御しながら高品質な画像を生成する。
論文 参考訳(メタデータ) (2021-08-06T04:43:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。