Fugu-MT 論文翻訳(概要): Blue noise for diffusion models

論文の概要: Blue noise for diffusion models

arxiv url: http://arxiv.org/abs/2402.04930v1
Date: Wed, 7 Feb 2024 14:59:25 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-08 14:50:24.552938
Title: Blue noise for diffusion models
Title（参考訳）: 拡散モデルのためのブルーノイズ
Authors: Xingchang Huang, Corentin Sala\"un, Cristina Vasconcelos, Christian Theobalt, Cengiz \"Oztireli, Gurprit Singh
Abstract要約: 本稿では,画像内および画像間の相関雑音を考慮した拡散モデルを提案する。我々のフレームワークは、勾配流を改善するために、1つのミニバッチ内に画像間の相関を導入することができる。本手法を用いて,各種データセットの質的,定量的な評価を行う。
参考スコア（独自算出の注目度）: 48.274015390665205
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Most of the existing diffusion models use Gaussian noise for training and sampling across all time steps, which may not optimally account for the frequency contents reconstructed by the denoising network. Despite the diverse applications of correlated noise in computer graphics, its potential for improving the training process has been underexplored. In this paper, we introduce a novel and general class of diffusion models taking correlated noise within and across images into account. More specifically, we propose a time-varying noise model to incorporate correlated noise into the training process, as well as a method for fast generation of correlated noise mask. Our model is built upon deterministic diffusion models and utilizes blue noise to help improve the generation quality compared to using Gaussian white (random) noise only. Further, our framework allows introducing correlation across images within a single mini-batch to improve gradient flow. We perform both qualitative and quantitative evaluations on a variety of datasets using our method, achieving improvements on different tasks over existing deterministic diffusion models in terms of FID metric.
Abstract（参考訳）: 既存の拡散モデルのほとんどは、全ての時間ステップのトレーニングとサンプリングにガウスノイズを使用するが、ノイズネットワークによって再構成された周波数コンテンツは最適ではない。コンピュータグラフィックスにおける相関ノイズの多様な応用にもかかわらず、トレーニングプロセスを改善する可能性は過小評価されている。本稿では,画像内および画像間の相関ノイズを考慮した拡散モデルについて紹介する。より具体的には、相関雑音を訓練プロセスに組み込むための時間変動雑音モデルと、相関雑音マスクの高速生成法を提案する。本モデルは決定論的拡散モデルに基づいて構築され,ガウス白色(ランダム)ノイズのみを用いた場合と比較して,青雑音を用いて生成品質を向上させる。さらに,1つのミニバッチ内に画像間の相関を導入し,勾配流を改善する。提案手法を用いて,様々なデータセットについて定性的および定量的評価を行い,既存の決定論的拡散モデルよりもfidメトリックを用いて異なるタスクの改善を実現する。

関連論文リスト

GuidNoise: Single-Pair Guided Diffusion for Generalized Noise Synthesis [9.253859022117306]
一般化雑音合成のための単対誘導拡散 GuidNoiseは単一のノイズ/クリーンペアをガイダンスとして使用しており、トレーニングセット内で簡単に手に入ることが多い。誘導型アフィン特徴量修正(GAFM)とノイズ対応精細損失を用いて拡散モデルの本質的なポテンシャルを利用する。
論文参考訳（メタデータ） (2025-12-04T05:00:00Z)
Warm Diffusion: Recipe for Blur-Noise Mixture Diffusion Models [14.963168108932761]
熱拡散は、高周波画像の細部と低周波構造との強い相関をうまく利用できないと我々は主張する。本稿では,Blur-Noise Mixture Diffusion Model(BNMD)を提案する。
論文参考訳（メタデータ） (2025-11-21T02:37:09Z)
Noise Conditional Variational Score Distillation [60.38982038894823]
騒音条件変化スコア蒸留(NCVSD)は, 予混合拡散モデルから生成消音剤を蒸留する新しい方法である。この知見を変分スコア蒸留フレームワークに組み込むことで、生成的デノイザのスケーラブルな学習を可能にする。
論文参考訳（メタデータ） (2025-06-11T06:01:39Z)
Noise Synthesis for Low-Light Image Denoising with Diffusion Models [22.897202020483576]
低照度写真は、限られた光子による信号対雑音比の低い画像を生成する。ディープラーニングの手法はうまく機能するが、取得には実用的でないペア画像の大規模なデータセットが必要である。本稿では,低照度雑音の複雑な分布を捉える拡散モデルについて検討する。
論文参考訳（メタデータ） (2025-03-14T10:16:54Z)
Edge-preserving noise for diffusion models [4.435514696080208]
既存の等方性モデルに対して一般化した新しいエッジ保存拡散モデルを提案する。モデルの生成過程はより高速に収束し, 対象の分布とより密に一致していることを示す。我々のエッジ保存拡散プロセスは、非条件画像生成における最先端のベースラインを一貫して上回る。
論文参考訳（メタデータ） (2024-10-02T13:29:52Z)
One Noise to Rule Them All: Learning a Unified Model of Spatially-Varying Noise Patterns [33.293193191683145]
本稿では,複数種類のノイズを生成できる単一生成モデルを提案する。また, 逆手続き材料設計の改善に本モデルを適用した。
論文参考訳（メタデータ） (2024-04-25T02:23:11Z)
Diffusion Models With Learned Adaptive Noise [12.530583016267768]
本稿では,拡散過程がデータから学べるかどうかを考察する。広く信じられている仮定は、ELBOはノイズプロセスに不変であるということである。画像間で異なる速度でノイズを印加する学習拡散過程であるMULANを提案する。
論文参考訳（メタデータ） (2023-12-20T18:00:16Z)
NM-FlowGAN: Modeling sRGB Noise without Paired Images using a Hybrid Approach of Normalizing Flows and GAN [9.81778202920426]
NM-FlowGANは、GANと正規化フローの両方の長所を利用するハイブリッドアプローチである。本手法は, カメラタイプやISO設定などの手軽に取得可能なパラメータなど, クリーンな画像とノイズ特性に影響を与える要因を用いてノイズを合成する。我々のNM-FlowGANは、sRGBノイズ合成タスクにおいて、他のベースラインよりも優れています。
論文参考訳（メタデータ） (2023-12-15T09:09:25Z)
One More Step: A Versatile Plug-and-Play Module for Rectifying Diffusion Schedule Flaws and Enhancing Low-Frequency Controls [77.42510898755037]
One More Step (OMS) は、推論中に単純だが効果的なステップを付加したコンパクトネットワークである。 OMSは画像の忠実度を高め、トレーニングと推論の二分法を調和させ、元のモデルパラメータを保存する。トレーニングが完了すると、同じ潜在ドメインを持つ様々な事前訓練された拡散モデルが同じOMSモジュールを共有することができる。
論文参考訳（メタデータ） (2023-11-27T12:02:42Z)
Denoising Diffusion Bridge Models [54.87947768074036]
拡散モデルは、プロセスを使用してデータにノイズをマッピングする強力な生成モデルである。画像編集のような多くのアプリケーションでは、モデル入力はランダムノイズではない分布から来る。本研究では, DDBM(Denoising Diffusion Bridge Models)を提案する。
論文参考訳（メタデータ） (2023-09-29T03:24:24Z)
Gradpaint: Gradient-Guided Inpainting with Diffusion Models [71.47496445507862]
Denoising Diffusion Probabilistic Models (DDPM) は近年,条件付きおよび非条件付き画像生成において顕著な成果を上げている。我々はGradPaintを紹介し、グローバルな一貫性のあるイメージに向けて世代を操る。我々は、様々なデータセットで訓練された拡散モデルによく適応し、現在最先端の教師付きおよび教師なしの手法を改善している。
論文参考訳（メタデータ） (2023-09-18T09:36:24Z)
ExposureDiffusion: Learning to Expose for Low-light Image Enhancement [87.08496758469835]
この研究は、拡散モデルと物理ベースの露光モデルとをシームレスに統合することで、この問題に対処する。提案手法は,バニラ拡散モデルと比較して性能が大幅に向上し,推論時間を短縮する。提案するフレームワークは、実際のペア付きデータセット、SOTAノイズモデル、および異なるバックボーンネットワークの両方で動作する。
論文参考訳（メタデータ） (2023-07-15T04:48:35Z)
SVNR: Spatially-variant Noise Removal with Denoising Diffusion [43.2405873681083]
本稿では,より現実的で空間的変動のある雑音モデルを想定した,微分拡散の新たな定式化について述べる。実験では,強い拡散モデルベースラインに対するアプローチの利点と,最先端の単一画像復号法に対するアプローチの利点を実証する。
論文参考訳（メタデータ） (2023-06-28T09:32:00Z)
Simultaneous Image-to-Zero and Zero-to-Noise: Diffusion Models with Analytical Image Attenuation [53.04220377034574]
高品質(未条件)な画像生成のための前方拡散プロセスに解析的画像減衰プロセスを導入することを提案する。本手法は,フォワード画像からノイズへのマッピングを,テクスチメジからゼロへのマッピングとテクスティケロ・ツー・ノイズマッピングの同時マッピングとして表現する。我々は,CIFAR-10やCelebA-HQ-256などの無条件画像生成や,超解像,サリエンシ検出,エッジ検出,画像インペインティングなどの画像条件下での下流処理について実験を行った。
論文参考訳（メタデータ） (2023-06-23T18:08:00Z)
Real-World Denoising via Diffusion Model [14.722529440511446]
実世界のイメージデノイングは、自然の環境で撮影されたノイズの多い画像からクリーンなイメージを復元することを目的としている。拡散モデルは画像生成の分野で非常に有望な結果を得た。本稿では,実世界の画像のデノナイズに使用可能な,新しい一般デノナイズ拡散モデルを提案する。
論文参考訳（メタデータ） (2023-05-08T04:48:03Z)
Q-Diffusion: Quantizing Diffusion Models [52.978047249670276]
ポストトレーニング量子化(PTQ)は、他のタスクに対するゴーツー圧縮法であると考えられている。本稿では,一意なマルチステップパイプラインとモデルアーキテクチャに適した新しいPTQ手法を提案する。提案手法は,完全精度の非条件拡散モデルを同等の性能を維持しつつ4ビットに定量化できることを示す。
論文参考訳（メタデータ） (2023-02-08T19:38:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。