Fugu-MT 論文翻訳(概要): SinDDM: A Single Image Denoising Diffusion Model

論文の概要: SinDDM: A Single Image Denoising Diffusion Model

arxiv url: http://arxiv.org/abs/2211.16582v1
Date: Tue, 29 Nov 2022 20:44:25 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-01 16:30:12.769756
Title: SinDDM: A Single Image Denoising Diffusion Model
Title（参考訳）: sinddm:単一画像の雑音拡散モデル
Authors: Vladimir Kulikov, Shahar Yadin, Matan Kleiner, Tomer Michaeli
Abstract要約: 単一画像上でのデノナイズ拡散モデルをトレーニングするためのフレームワークを提案する。 SinDDMを作成した本手法では,マルチスケール拡散プロセスを用いてトレーニング画像の内部統計を学習する。これは、スタイル転送や調和など、幅広いタスクに適用できる。
参考スコア（独自算出の注目度）: 28.51951207066209
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Denoising diffusion models (DDMs) have led to staggering performance leaps in image generation, editing and restoration. However, existing DDMs use very large datasets for training. Here, we introduce a framework for training a DDM on a single image. Our method, which we coin SinDDM, learns the internal statistics of the training image by using a multi-scale diffusion process. To drive the reverse diffusion process, we use a fully-convolutional light-weight denoiser, which is conditioned on both the noise level and the scale. This architecture allows generating samples of arbitrary dimensions, in a coarse-to-fine manner. As we illustrate, SinDDM generates diverse high-quality samples, and is applicable in a wide array of tasks, including style transfer and harmonization. Furthermore, it can be easily guided by external supervision. Particularly, we demonstrate text-guided generation from a single image using a pre-trained CLIP model.
Abstract（参考訳）: ノイズ拡散モデル(ddms)は画像生成、編集、復元において驚くべき性能向上をもたらした。しかし、既存のDDMはトレーニングに非常に大きなデータセットを使用している。本稿では,単一画像上でDDMをトレーニングするためのフレームワークを提案する。 SinDDMを作成した本手法では,マルチスケール拡散プロセスを用いてトレーニング画像の内部統計を学習する。逆拡散過程を駆動するために, 全畳み込み型軽量デノイザーを用い, 騒音レベルとスケールの両方を条件とする。このアーキテクチャは任意の次元のサンプルを粗い方法で生成することができる。以下に示すように、SinDDMは様々な高品質なサンプルを生成し、スタイル転送や調和を含む幅広いタスクに適用できる。さらに、外部監視によって容易にガイドすることができる。特に,事前学習したCLIPモデルを用いて,単一画像からのテキスト誘導生成を示す。

関連論文リスト

Prototype-Guided Diffusion: Visual Conditioning without External Memory [2.1155908599769764]
プロトタイプ拡散モデルでは、外部メモリなしで効率的な視覚条件付けを行うために、プロトタイプ学習を直接拡散プロセスに統合する。 PDMは、計算とストレージのオーバーヘッドを低減しつつ、高速な品質を維持し、拡散モデルにおける検索ベースの条件付けに代わるスケーラブルな代替手段を提供する。
論文参考訳（メタデータ） (2025-08-13T16:18:35Z)
Consistent Diffusion: Denoising Diffusion Model with Data-Consistent Training for Image Restoration [9.745025353708865]
本稿では,画像復元作業における拡散モデル(DDM)の限界に対処する。本稿では,DDMがトレーニング中に蓄積した誤りの画像にアクセスできるようにする,データ一貫性トレーニングという新しいトレーニング手法を提案する。本手法は、歪みを効果的に最小化し、画像の忠実さを保ちながら、最先端の手法よりも大幅に改善されている。
論文参考訳（メタデータ） (2024-12-17T05:21:16Z)
MMAR: Towards Lossless Multi-Modal Auto-Regressive Probabilistic Modeling [64.09238330331195]
本稿では,MMAR(Multi-Modal Auto-Regressive)確率モデルフレームワークを提案する。離散化の手法とは異なり、MMARは情報損失を避けるために連続的に評価された画像トークンを取り入れる。 MMARは他のジョイントマルチモーダルモデルよりもはるかに優れた性能を示す。
論文参考訳（メタデータ） (2024-10-14T17:57:18Z)
Harnessing the Latent Diffusion Model for Training-Free Image Style Transfer [24.46409405016844]
スタイル転送タスクは、スタイルイメージの視覚的属性を他のコンテンツイメージに転送する課題の1つである。我々は、事前訓練された潜在拡散モデル(LDM)のための学習不要なスタイル伝達アルゴリズム、スタイルトラッキング逆拡散プロセス(STRDP)を提案する。本アルゴリズムは, LDMの逆拡散過程において, 適応インスタンス正規化(AdaIN)関数を異なる方法で適用する。
論文参考訳（メタデータ） (2024-10-02T09:28:21Z)
Contrastive Denoising Score for Text-guided Latent Diffusion Image Editing [58.48890547818074]
潜在拡散モデル(LDM)に対するコントラストデノナイジングスコア(CUT)の強力な修正を提案する。提案手法により,ゼロショット画像から画像への変換とニューラルフィールド(NeRF)の編集が可能となり,入力と出力の間の構造的対応が達成される。
論文参考訳（メタデータ） (2023-11-30T15:06:10Z)
Improving Denoising Diffusion Probabilistic Models via Exploiting Shared Representations [5.517338199249029]
SR-DDPMはノイズ拡散過程を逆転することで高品質な画像を生成する生成モデルのクラスである。多様なデータ分布の類似性を利用して、画像の品質を損なうことなく、複数のタスクにスケールできる。提案手法を標準画像データセット上で評価し、FIDとSSIMの指標で条件付きDDPMと条件付きDDPMの両方より優れていることを示す。
論文参考訳（メタデータ） (2023-11-27T22:30:26Z)
Denoising Diffusion Bridge Models [54.87947768074036]
拡散モデルは、プロセスを使用してデータにノイズをマッピングする強力な生成モデルである。画像編集のような多くのアプリケーションでは、モデル入力はランダムノイズではない分布から来る。本研究では, DDBM(Denoising Diffusion Bridge Models)を提案する。
論文参考訳（メタデータ） (2023-09-29T03:24:24Z)
Stimulating Diffusion Model for Image Denoising via Adaptive Embedding and Ensembling [56.506240377714754]
DMID(Diffusion Model for Image Denoising)と呼ばれる新しい手法を提案する。我々の戦略は、雑音のある画像を事前訓練された非条件拡散モデルに埋め込む適応的な埋め込み法を含む。我々のDMID戦略は、歪みベースと知覚ベースの両方で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2023-07-08T14:59:41Z)
Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。本稿では,階層型統合拡散モデル(HI-Diff)を提案する。人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文参考訳（メタデータ） (2023-05-22T12:18:20Z)
Representation Learning with Diffusion Models [0.0]
拡散モデル (DM) は画像合成タスクや密度推定において最先端の結果を得た。拡散モデル(LRDM)を用いてそのような表現を学習するためのフレームワークを提案する。特に、DMと表現エンコーダは、生成的認知過程に特有の豊かな表現を学習するために、共同で訓練される。
論文参考訳（メタデータ） (2022-10-20T07:26:47Z)
f-DM: A Multi-stage Diffusion Model via Progressive Signal Transformation [56.04628143914542]
拡散モデル(DM)は、最近、様々な領域で生成モデリングを行うためのSoTAツールとして登場した。本稿では、プログレッシブ信号変換が可能なDMの一般化されたファミリであるf-DMを提案する。我々は、ダウンサンプリング、ぼやけ、学習された変換を含む様々な機能を持つ画像生成タスクにf-DMを適用した。
論文参考訳（メタデータ） (2022-10-10T18:49:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。