論文の概要: Denoising Diffusion Probabilistic Models for Robust Image
Super-Resolution in the Wild
- arxiv url: http://arxiv.org/abs/2302.07864v1
- Date: Wed, 15 Feb 2023 18:56:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-16 14:03:22.969301
- Title: Denoising Diffusion Probabilistic Models for Robust Image
Super-Resolution in the Wild
- Title(参考訳): 野生におけるロバスト画像超解像の拡散確率モデル
- Authors: Hshmat Sahak, Daniel Watson, Chitwan Saharia, David Fleet
- Abstract要約: 本稿では,ブラインド超解像のための拡散モデルSR3+を紹介する。
我々は, 自己指導訓練のための複合的, パラメータ化劣化, および, 訓練および試験中の騒音増強を併用した自己指導訓練を提唱する。
これらのイノベーション、大規模な畳み込みアーキテクチャ、大規模なデータセットにより、SR3+はSR3を大きく上回っている。
- 参考スコア(独自算出の注目度): 2.190237353315235
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models have shown promising results on single-image
super-resolution and other image- to-image translation tasks. Despite this
success, they have not outperformed state-of-the-art GAN models on the more
challenging blind super-resolution task, where the input images are out of
distribution, with unknown degradations. This paper introduces SR3+, a
diffusion-based model for blind super-resolution, establishing a new
state-of-the-art. To this end, we advocate self-supervised training with a
combination of composite, parameterized degradations for self-supervised
training, and noise-conditioing augmentation during training and testing. With
these innovations, a large-scale convolutional architecture, and large-scale
datasets, SR3+ greatly outperforms SR3. It outperforms Real-ESRGAN when trained
on the same data, with a DRealSR FID score of 36.82 vs. 37.22, which further
improves to FID of 32.37 with larger models, and further still with larger
training sets.
- Abstract(参考訳): 拡散モデルは、単一画像の超解像や他の画像から画像への変換タスクにおいて有望な結果を示している。
この成功にもかかわらず、彼らは、入力画像が分布から外れ、未知の劣化を伴う、より困難な超解像課題において、最先端のGANモデルよりも優れていない。
本稿では,ブラインド超解像のための拡散モデルSR3+を紹介する。
そこで本研究では,複合化とパラメータ化による自己教師付き学習と,訓練とテストにおけるノイズコンディショニング強化を組み合わせた自己教師付き学習を提案する。
これらのイノベーション、大規模な畳み込みアーキテクチャ、大規模なデータセットにより、SR3+はSR3を大きく上回っている。
DRealSR FIDスコアは36.82対37.22で、さらに大きなモデルで32.37のFIDに改善され、さらに大きなトレーニングセットで、同じデータでトレーニングされた場合、Real-ESRGANより優れていた。
関連論文リスト
- Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors [75.24313405671433]
拡散に基づく画像超解像法 (SR) は、事前訓練された大規模なテキスト・画像拡散モデルを先行として活用することにより、顕著な成功を収めた。
本稿では,拡散型SR手法の効率問題に対処する新しい一段階SRモデルを提案する。
既存の微調整戦略とは異なり、SR専用の劣化誘導低ランク適応 (LoRA) モジュールを設計した。
論文 参考訳(メタデータ) (2024-09-25T16:15:21Z) - DiSR-NeRF: Diffusion-Guided View-Consistent Super-Resolution NeRF [50.458896463542494]
DiSR-NeRFは、ビュー一貫性を持つ超解像(SR)NeRFのための拡散誘導フレームワークである。
我々は,NeRFの固有多視点整合性により不整合問題を緩和するイテレーティブ3Dシンクロナイゼーション(I3DS)を提案する。
論文 参考訳(メタデータ) (2024-04-01T03:06:23Z) - Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation [59.184980778643464]
ファインチューニング拡散モデル : 生成人工知能(GenAI)の最前線
本稿では,拡散モデル(SPIN-Diffusion)のための自己演奏ファインチューニングという革新的な手法を紹介する。
提案手法は従来の教師付き微調整とRL戦略の代替として,モデル性能とアライメントの両方を大幅に改善する。
論文 参考訳(メタデータ) (2024-02-15T18:59:18Z) - DFU: scale-robust diffusion model for zero-shot super-resolution image
generation [15.689418447376587]
複数の解像度で空間情報とスペクトル情報を組み合わせることでスコア演算子を近似する新しいディープラーニングアーキテクチャDual-FNO UNet(DFU)を提案する。
本稿では,FIDをFFHQの最大トレーニング解像度の1.66倍の1.66倍の1.3倍の精度で達成し,ゼロショット超解像画像生成能力をさらに高めるための微調整戦略を提案する。
論文 参考訳(メタデータ) (2023-11-30T23:31:33Z) - Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and
Reconstruction [77.69363640021503]
3D対応画像合成は、シーン生成や画像からの新規ビュー合成など、様々なタスクを含む。
本稿では,様々な物体の多視点画像から,ニューラルラディアンス場(NeRF)の一般化可能な事前学習を行うために,表現拡散モデルを用いた統一的アプローチであるSSDNeRFを提案する。
論文 参考訳(メタデータ) (2023-04-13T17:59:01Z) - Image Super-Resolution via Iterative Refinement [53.57766722279425]
SR3は再精製による超解像へのアプローチである。
確率的デノイジング拡散モデルを条件付き画像生成に適応させる。
様々な倍率係数の超分解能タスクに強い性能を示す。
論文 参考訳(メタデータ) (2021-04-15T17:50:42Z) - Joint Generative Learning and Super-Resolution For Real-World
Camera-Screen Degradation [6.14297871633911]
現実世界の単一画像超解像(SISR)タスクでは、低解像度画像はより複雑な劣化に苦しむ。
本稿では,カメラ画面の劣化に着目し,実世界のデータセット(Cam-ScreenSR)を構築する。
まず、ダウンサンプリング劣化GAN(DD-GAN)をトレーニングし、その分解をモデル化し、より多様なLR画像を生成する。
そして、二重残差チャネルアテンションネットワーク(DuRCAN)がSR画像の復元を学習する。
論文 参考訳(メタデータ) (2020-08-01T07:10:13Z) - Characteristic Regularisation for Super-Resolving Face Images [81.84939112201377]
既存の顔画像超解像法(SR)は、主に人工的にダウンサンプリングされた低解像度(LR)画像の改善に焦点を当てている。
従来の非教師なしドメイン適応(UDA)手法は、未ペアの真のLRとHRデータを用いてモデルをトレーニングすることでこの問題に対処する。
これにより、視覚的特徴を構成することと、画像の解像度を高めることの2つのタスクで、モデルをオーバーストレッチする。
従来のSRモデルとUDAモデルの利点を結合する手法を定式化する。
論文 参考訳(メタデータ) (2019-12-30T16:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。