論文の概要: One-to-many Approach for Improving Super-Resolution
- arxiv url: http://arxiv.org/abs/2106.10437v2
- Date: Tue, 22 Jun 2021 01:25:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-24 11:02:47.748509
- Title: One-to-many Approach for Improving Super-Resolution
- Title(参考訳): 超解法改善のための一対一アプローチ
- Authors: Sieun Park, Eunho Lee
- Abstract要約: 本稿では,Residual-in-Residual Dense Block (RRDB) 毎に重み付けされた画素単位のノイズを追加することで,生成元が様々な画像を生成することを提案する。
我々は、一貫したコンテンツがある限り、再構成された画像の変動をペナルティにしないよう厳格なコンテンツ損失を修正した。
我々は,x4知覚的SRにおけるESRGANの性能を改善し,x16知覚的極端SRにおける最先端LPIPSスコアを達成できた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Super-resolution (SR) is a one-to-many task with multiple possible solutions.
However, previous works were not concerned about this characteristic. For a
one-to-many pipeline, the generator should be able to generate multiple
estimates of the reconstruction, and not be penalized for generating similar
and equally realistic images. To achieve this, we propose adding weighted
pixel-wise noise after every Residual-in-Residual Dense Block (RRDB) to enable
the generator to generate various images. We modify the strict content loss to
not penalize the stochastic variation in reconstructed images as long as it has
consistent content. Additionally, we observe that there are out-of-focus
regions in the DIV2K, DIV8K datasets that provide unhelpful guidelines. We
filter blurry regions in the training data using the method of [10]. Finally,
we modify the discriminator to receive the low-resolution image as a reference
image along with the target image to provide better feedback to the generator.
Using our proposed methods, we were able to improve the performance of ESRGAN
in x4 perceptual SR and achieve the state-of-the-art LPIPS score in x16
perceptual extreme SR.
- Abstract(参考訳): 超解法 (SR) は、複数の可能な解を持つ1対多の課題である。
ただし、この特徴については以前の作品には触れられていない。
1対多のパイプラインでは、ジェネレータは再構成の複数の見積を生成でき、類似したリアルな画像を生成するために罰せられるべきではない。
そこで本研究では,残差密度ブロック (rrdb) 毎に重み付き画素単位のノイズを付加し,様々な画像を生成することを提案する。
コンテントの一貫性が保たれる限り,再構成画像の確率的変動を損なわないよう,コンテンツロスを補正する。
さらに,DIV2K,DIV8Kデータセットには,不適切なガイドラインを提供するアウト・オブ・フォーカス領域が存在することも確認した。
訓練データ中のぼやけた領域を[10]の方法でフィルタリングする。
最後に,識別器を改良して参照画像として低解像度画像と対象画像とを受信し,ジェネレータにフィードバックを与える。
提案手法を用いて,x4知覚SRにおけるESRGANの性能を改善し,x16知覚極端SRにおける最先端LPIPSスコアを達成できた。
関連論文リスト
- Multi-Feature Aggregation in Diffusion Models for Enhanced Face Super-Resolution [6.055006354743854]
超解像を生成するために,複数の低画質画像から抽出した特徴と組み合わせた低解像度画像を利用するアルゴリズムを開発した。
他のアルゴリズムとは異なり、我々のアプローチは属性情報を明示的に提供せずに顔の特徴を復元する。
これは、高解像度画像と低解像度画像を組み合わせて、より信頼性の高い超高解像度画像を生成するコンディショナーとして初めて使用される。
論文 参考訳(メタデータ) (2024-08-27T20:08:33Z) - Accelerating Image Super-Resolution Networks with Pixel-Level Classification [29.010136088811137]
Pixel-level for Single Image SuperResolutionは、ピクセルレベルで計算資源を適応的に分配する新しい手法である。
提案手法では,再学習を伴わない推論における性能と計算コストのバランスが可能である。
論文 参考訳(メタデータ) (2024-07-31T08:53:10Z) - DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior [70.46245698746874]
DiffBIRは、視覚の異なる画像復元タスクを処理できる一般的な修復パイプラインである。
DiffBIRは, ブラインド画像復元問題を, 1) 劣化除去: 画像に依存しない内容の除去; 2) 情報再生: 失われた画像内容の生成の2段階に分離する。
第1段階では, 修復モジュールを用いて劣化を除去し, 高忠実度復元結果を得る。
第2段階では、潜伏拡散モデルの生成能力を活用して現実的な詳細を生成するIRControlNetを提案する。
論文 参考訳(メタデータ) (2023-08-29T07:11:52Z) - Learning Multiple Probabilistic Degradation Generators for Unsupervised
Real World Image Super Resolution [5.987801889633082]
教師なしの現実世界のスーパーレゾリューションは、ペア化されたデータが利用できない場合に、低解像度(LR)入力を与えられた高解像度(HR)イメージを復元することを目的としている。
最も一般的なアプローチの1つは、GANを使ってノイズの多いLR画像を合成し、合成データセットを使用してモデルを教師付きで訓練することである。
HR画像が与えられたLR画像の分布を近似する確率分解生成器を提案する。
論文 参考訳(メタデータ) (2022-01-26T04:49:11Z) - LAPAR: Linearly-Assembled Pixel-Adaptive Regression Network for Single
Image Super-Resolution and Beyond [75.37541439447314]
単一画像超解像(SISR)は、低解像度(LR)画像を高解像度(HR)バージョンにアップサンプリングする根本的な問題を扱う。
本稿では,線形組立画素適応回帰ネットワーク (LAPAR) を提案する。
論文 参考訳(メタデータ) (2021-05-21T15:47:18Z) - SRWarp: Generalized Image Super-Resolution under Arbitrary
Transformation [65.88321755969677]
ディープCNNは、単一の画像超解像を含む画像処理とそのアプリケーションで大きな成功を収めています。
近年のアプローチでは、実測値のアップサンプリング要因にまで範囲を広げている。
任意の画像変換に向けてSRタスクをさらに一般化するSRWarpフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-21T02:50:41Z) - VSpSR: Explorable Super-Resolution via Variational Sparse Representation [15.810502797317502]
超解像度 (SR) は、無限に多くの高解像度 (HR) 画像が同じ低解像度 (LR) 画像に分解できるという問題である。
ニューラルネットワークを用いたVari Sparseational Framework for Super-Resolution (VSpSR)を開発。
論文 参考訳(メタデータ) (2021-04-17T15:36:24Z) - Adversarial Generation of Continuous Images [31.92891885615843]
本稿では,INRに基づく画像デコーダ構築のための2つの新しいアーキテクチャ手法を提案する。
私たちは、最先端の連続画像GANを構築するためにそれらを使用します。
提案したINR-GANアーキテクチャは連続画像生成装置の性能を数倍改善する。
論文 参考訳(メタデータ) (2020-11-24T11:06:40Z) - Exploiting Deep Generative Prior for Versatile Image Restoration and
Manipulation [181.08127307338654]
本研究は, 大規模自然画像に基づいて学習したGAN(Generative Adversarial Network)により, 得られた画像の有効利用方法を示す。
深層生成前駆体(DGP)は、色、パッチ、解像度、様々な劣化した画像の欠落したセマンティクスを復元するための説得力のある結果を提供する。
論文 参考訳(メタデータ) (2020-03-30T17:45:07Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。