Fugu-MT 論文翻訳(概要): On the Importance of Noise Scheduling for Diffusion Models

論文の概要: On the Importance of Noise Scheduling for Diffusion Models

arxiv url: http://arxiv.org/abs/2301.10972v4
Date: Sun, 21 May 2023 07:07:55 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-24 04:29:23.618663
Title: On the Importance of Noise Scheduling for Diffusion Models
Title（参考訳）: 拡散モデルにおけるノイズスケジューリングの重要性について
Authors: Ting Chen
Abstract要約: 拡散生成モデルにおけるノイズスケジューリング手法の効果について検討する。この簡単なレシピは、ImageNet上の高解像度画像に対して、最先端のピクセルベースの拡散モデルを生成する。
参考スコア（独自算出の注目度）: 8.360383061862844
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We empirically study the effect of noise scheduling strategies for denoising diffusion generative models. There are three findings: (1) the noise scheduling is crucial for the performance, and the optimal one depends on the task (e.g., image sizes), (2) when increasing the image size, the optimal noise scheduling shifts towards a noisier one (due to increased redundancy in pixels), and (3) simply scaling the input data by a factor of $b$ while keeping the noise schedule function fixed (equivalent to shifting the logSNR by $\log b$) is a good strategy across image sizes. This simple recipe, when combined with recently proposed Recurrent Interface Network (RIN), yields state-of-the-art pixel-based diffusion models for high-resolution images on ImageNet, enabling single-stage, end-to-end generation of diverse and high-fidelity images at 1024$\times$1024 resolution (without upsampling/cascades).
Abstract（参考訳）: 拡散生成モデルに対するノイズスケジューリング手法の効果を実験的に検討する。 1) ノイズスケジューリングは性能に不可欠であり,(2) 最適なノイズスケジューリングはタスク(画像サイズなど)に依存する,(2) 画像サイズを増加させると,よりノイズの少ないものにシフトする,(3) ノイズスケジュール関数を固定する(lognrを$\log b$にシフトするのと同値) 入力データをb$でスケールする,という3つの知見がある。この簡単なレシピは、最近提案されたRecurrent Interface Network (RIN)と組み合わせて、ImageNet上の高解像度画像のための最先端のピクセルベースの拡散モデルを生成し、1024$\times$1024で多彩かつ高忠実な画像を単一のステージからエンドツーエンドに生成することを可能にする。

関連論文リスト

Learning High-Quality Initial Noise for Single-View Synthesis with Diffusion Models [10.275373477634217]
拡散モデルでは、ある種の高品質な初期ノイズパターンは、他のものよりも優れた生成結果をもたらす。本稿では,ランダムノイズを直接高品質な雑音に変換するエンコーダ・デコーダネットワーク(EDN)に基づく学習フレームワークを提案する。
論文参考訳（メタデータ） (2025-12-18T06:08:21Z)
Performance Plateaus in Inference-Time Scaling for Text-to-Image Diffusion Without External Models [31.873727540047156]
テキストから画像への拡散モデルの初期ノイズを最適化するアルゴリズムにベスト・オブ・Nの推論時間スケーリングを適用する。本研究では,テキストから画像への拡散モデルに対する推論時間スケーリングが急速に性能高原に達することを実証する。
論文参考訳（メタデータ） (2025-06-14T21:25:08Z)
Noise Synthesis for Low-Light Image Denoising with Diffusion Models [22.897202020483576]
低照度写真は、限られた光子による信号対雑音比の低い画像を生成する。ディープラーニングの手法はうまく機能するが、取得には実用的でないペア画像の大規模なデータセットが必要である。本稿では,低照度雑音の複雑な分布を捉える拡散モデルについて検討する。
論文参考訳（メタデータ） (2025-03-14T10:16:54Z)
FreCaS: Efficient Higher-Resolution Image Generation via Frequency-aware Cascaded Sampling [13.275724439963188]
FreCaSはサンプリングプロセスをカスケードステージに分解し、徐々に分解能が向上する。 FreCaSは、画像の品質と生成速度において最先端の手法を大幅に上回っている。
論文参考訳（メタデータ） (2024-10-24T03:56:44Z)
High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity [69.32473738284374]
拡散モデルは、例外的な品質、詳細な解像度、強い文脈認識を提供することによって、テキストと画像の合成に革命をもたらした。本稿では,拡散モデルにおける事前学習されたU-Netのポテンシャルを利用する拡散駆動セグメンテーションモデルDiffDISを提案する。 DIS5Kデータセットの実験は、DiffDISの優位性を示し、合理化された推論プロセスを通じて最先端の結果を達成する。
論文参考訳（メタデータ） (2024-10-14T02:49:23Z)
Zero-Shot Image Denoising for High-Resolution Electron Microscopy [28.34992348748098]
高分解能電子顕微鏡(HREM)イメージング技術は、広い範囲の物質を直接リアルタイムに可視化するための強力なツールである。超低信号対雑音比(SNR)とデータ可用性の不足により、ノイズ除去の課題に直面している。 HREMのためのゼロショット自己教師型学習(ZS-SSL)フレームワークであるNoss2SRを提案する。
論文参考訳（メタデータ） (2024-06-20T12:40:18Z)
NM-FlowGAN: Modeling sRGB Noise without Paired Images using a Hybrid Approach of Normalizing Flows and GAN [9.81778202920426]
NM-FlowGANは、GANと正規化フローの両方の長所を利用するハイブリッドアプローチである。本手法は, カメラタイプやISO設定などの手軽に取得可能なパラメータなど, クリーンな画像とノイズ特性に影響を与える要因を用いてノイズを合成する。我々のNM-FlowGANは、sRGBノイズ合成タスクにおいて、他のベースラインよりも優れています。
論文参考訳（メタデータ） (2023-12-15T09:09:25Z)
Simultaneous Image-to-Zero and Zero-to-Noise: Diffusion Models with Analytical Image Attenuation [53.04220377034574]
高品質(未条件)な画像生成のための前方拡散プロセスに解析的画像減衰プロセスを導入することを提案する。本手法は,フォワード画像からノイズへのマッピングを,テクスチメジからゼロへのマッピングとテクスティケロ・ツー・ノイズマッピングの同時マッピングとして表現する。我々は,CIFAR-10やCelebA-HQ-256などの無条件画像生成や,超解像,サリエンシ検出,エッジ検出,画像インペインティングなどの画像条件下での下流処理について実験を行った。
論文参考訳（メタデータ） (2023-06-23T18:08:00Z)
Diffusion Model for Generative Image Denoising [17.897180118637856]
画像復調のための教師あり学習では、通常、ペアのクリーンな画像とノイズの多い画像を収集し合成し、復調モデルを訓練する。本稿では,ノイズ画像に条件付けされたクリーン画像の後部分布を推定する問題として,デノナイジングタスクを考察する。
論文参考訳（メタデータ） (2023-02-05T14:53:07Z)
Representing Noisy Image Without Denoising [91.73819173191076]
ラドン空間におけるフラクショナルオーダーモーメント(FMR)は、ノイズの多い画像から直接ロバストな表現を引き出すように設計されている。従来の整数順序法とは異なり、我々の研究は特別な場合のような古典的手法を取り入れたより汎用的な設計である。
論文参考訳（メタデータ） (2023-01-18T10:13:29Z)
Learning to Generate Realistic Noisy Images via Pixel-level Noise-aware Adversarial Training [50.018580462619425]
我々は,PNGAN(Pixel-level Noise-aware Generative Adrial Network)という新しいフレームワークを提案する。 PNGANは、トレーニング済みのリアルデノイザーを使用して、フェイク画像とリアルノイズ画像をほぼノイズのないソリューション空間にマッピングする。より優れたノイズフィッティングを実現するため,ジェネレータとしてSimple Multi-versa-scale Network (SMNet) を提案する。
論文参考訳（メタデータ） (2022-04-06T14:09:02Z)
Unsupervised Single Image Super-resolution Under Complex Noise [60.566471567837574]
本稿では,一般のSISRタスクを未知の劣化で扱うためのモデルベースunsupervised SISR法を提案する。提案手法は, より小さなモデル (0.34M vs. 2.40M) だけでなく, より高速な技術 (SotA) 法 (約1dB PSNR) の現況を明らかに超えることができる。
論文参考訳（メタデータ） (2021-07-02T11:55:40Z)
Image Super-Resolution via Iterative Refinement [53.57766722279425]
SR3は再精製による超解像へのアプローチである。確率的デノイジング拡散モデルを条件付き画像生成に適応させる。様々な倍率係数の超分解能タスクに強い性能を示す。
論文参考訳（メタデータ） (2021-04-15T17:50:42Z)
Designing a Practical Degradation Model for Deep Blind Image Super-Resolution [134.9023380383406]
単一画像スーパーレゾリューション (sisr) 法は, 推定劣化モデルが実画像から逸脱した場合はうまく動作しない。本稿では, ランダムにシャッフルされたブラー, ダウンサンプリング, ノイズ劣化からなる, より複雑で実用的な劣化モデルを提案する。
論文参考訳（メタデータ） (2021-03-25T17:40:53Z)
Neighbor2Neighbor: Self-Supervised Denoising from Single Noisy Images [98.82804259905478]
Neighbor2Neighborを提示し、ノイズの多い画像のみで効果的な画像消音モデルをトレーニングします。ネットワークのトレーニングに使用される入力とターゲットは、同じノイズ画像からサブサンプリングされた画像である。デノイジングネットワークは、第1段階で生成されたサブサンプルトレーニングペアで訓練され、提案された正規化器は、より良いパフォーマンスのための追加の損失として訓練される。
論文参考訳（メタデータ） (2021-01-08T02:03:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。