論文の概要: Human Guided Ground-truth Generation for Realistic Image
Super-resolution
- arxiv url: http://arxiv.org/abs/2303.13069v1
- Date: Thu, 23 Mar 2023 06:53:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-24 15:21:38.786462
- Title: Human Guided Ground-truth Generation for Realistic Image
Super-resolution
- Title(参考訳): リアル画像超解像のための人間誘導地中構造生成
- Authors: Du Chen, Jie Liang, Xindong Zhang, Ming Liu, Hui Zeng, Lei Zhang
- Abstract要約: GT画像を生成する方法は、現実的な画像超解像(Real-ISR)モデルをトレーニングする上で重要な問題である。
既存の手法は主に高分解能(HR)画像をGTとして取り、低分解能(LR)画像をシミュレートするために様々な劣化を適用している。
本稿では,人間誘導型GT生成手法を提案する。
- 参考スコア(独自算出の注目度): 27.74022069080442
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: How to generate the ground-truth (GT) image is a critical issue for training
realistic image super-resolution (Real-ISR) models. Existing methods mostly
take a set of high-resolution (HR) images as GTs and apply various degradations
to simulate their low-resolution (LR) counterparts. Though great progress has
been achieved, such an LR-HR pair generation scheme has several limitations.
First, the perceptual quality of HR images may not be high enough, limiting the
quality of Real-ISR outputs. Second, existing schemes do not consider much
human perception in GT generation, and the trained models tend to produce
over-smoothed results or unpleasant artifacts. With the above considerations,
we propose a human guided GT generation scheme. We first elaborately train
multiple image enhancement models to improve the perceptual quality of HR
images, and enable one LR image having multiple HR counterparts. Human subjects
are then involved to annotate the high quality regions among the enhanced HR
images as GTs, and label the regions with unpleasant artifacts as negative
samples. A human guided GT image dataset with both positive and negative
samples is then constructed, and a loss function is proposed to train the
Real-ISR models. Experiments show that the Real-ISR models trained on our
dataset can produce perceptually more realistic results with less artifacts.
Dataset and codes can be found at https://github.com/ChrisDud0257/HGGT
- Abstract(参考訳): GT画像を生成する方法は、現実的な画像超解像(Real-ISR)モデルをトレーニングする上で重要な問題である。
既存の手法は主に高分解能(HR)画像をGTとして取り、低分解能(LR)画像をシミュレートするために様々な劣化を適用している。
しかし、LR-HRペア生成方式にはいくつかの制限がある。
第一に、HR画像の知覚品質は十分に高くないことがあり、リアルISR出力の品質が制限される。
第二に、既存のスキームはgt生成において人間の知覚をあまり考慮せず、訓練されたモデルは過剰な結果や不快な成果を生み出す傾向がある。
以上の観点から,人間の誘導型GT生成手法を提案する。
まず、HR画像の知覚品質を向上させるために複数の画像強調モデルを精巧に訓練し、複数のHR画像を持つ1つのLR画像を可能にする。
被験者は、強化されたHR画像中の高品質領域をGTとして注釈付けし、不快なアーティファクトを負のサンプルとしてラベル付けする。
次に、正と負の両方のサンプルを持つ人間のガイド付きGT画像データセットを構築し、Real-ISRモデルをトレーニングするために損失関数を提案する。
実験によれば、データセットでトレーニングされた実際のisrモデルは、より少ないアーティファクトで知覚的により現実的な結果を生み出すことができる。
データセットとコードはhttps://github.com/ChrisDud0257/HGGTで確認できる。
関連論文リスト
- Efficient Test-Time Adaptation for Super-Resolution with Second-Order
Degradation and Reconstruction [62.955327005837475]
画像超解像(SR)は,低分解能(LR)から高分解能(HR)へのマッピングを,一対のHR-LRトレーニング画像を用いて学習することを目的としている。
SRTTAと呼ばれるSRの効率的なテスト時間適応フレームワークを提案し、SRモデルを異なる/未知の劣化型でテストドメインに迅速に適応させることができる。
論文 参考訳(メタデータ) (2023-10-29T13:58:57Z) - Learning Many-to-Many Mapping for Unpaired Real-World Image
Super-resolution and Downscaling [60.80788144261183]
実世界のLR画像とHR画像の双方向多対多マッピングを教師なしで同時に学習するSDFlowと呼ばれる画像ダウンスケーリングとSRモデルを提案する。
実世界の画像SRデータセットによる実験結果から,SDFlowは定量的かつ定性的に,多様な現実的なLRとSRの画像を生成可能であることが示唆された。
論文 参考訳(メタデータ) (2023-10-08T01:48:34Z) - Learning Multiple Probabilistic Degradation Generators for Unsupervised
Real World Image Super Resolution [5.987801889633082]
教師なしの現実世界のスーパーレゾリューションは、ペア化されたデータが利用できない場合に、低解像度(LR)入力を与えられた高解像度(HR)イメージを復元することを目的としている。
最も一般的なアプローチの1つは、GANを使ってノイズの多いLR画像を合成し、合成データセットを使用してモデルを教師付きで訓練することである。
HR画像が与えられたLR画像の分布を近似する確率分解生成器を提案する。
論文 参考訳(メタデータ) (2022-01-26T04:49:11Z) - Real-World Super-Resolution of Face-Images from Surveillance Cameras [25.258587196435464]
本稿では,現実的なLR/HRトレーニングペアを生成するための新しいフレームワークを提案する。
本フレームワークは、実写のぼやけたカーネル、ノイズ分布、JPEG圧縮アーチファクトを推定し、ソース領域のものと類似した画像特性を持つLR画像を生成する。
我々はGANベースのSRモデルを用いて、よく使われるVGG-loss[24]とLPIPS-loss[52]を交換した。
論文 参考訳(メタデータ) (2021-02-05T11:38:30Z) - Joint Generative Learning and Super-Resolution For Real-World
Camera-Screen Degradation [6.14297871633911]
現実世界の単一画像超解像(SISR)タスクでは、低解像度画像はより複雑な劣化に苦しむ。
本稿では,カメラ画面の劣化に着目し,実世界のデータセット(Cam-ScreenSR)を構築する。
まず、ダウンサンプリング劣化GAN(DD-GAN)をトレーニングし、その分解をモデル化し、より多様なLR画像を生成する。
そして、二重残差チャネルアテンションネットワーク(DuRCAN)がSR画像の復元を学習する。
論文 参考訳(メタデータ) (2020-08-01T07:10:13Z) - Closed-loop Matters: Dual Regression Networks for Single Image
Super-Resolution [73.86924594746884]
ディープニューラルネットワークは、画像超解像において有望な性能を示した。
これらのネットワークは、低分解能(LR)画像から高分解能(HR)画像への非線形マッピング関数を学習する。
本稿では,可能な関数の空間を削減するために,LRデータに新たな制約を導入することで,二重回帰手法を提案する。
論文 参考訳(メタデータ) (2020-03-16T04:23:42Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z) - Learning to Zoom-in via Learning to Zoom-out: Real-world
Super-resolution by Generating and Adapting Degradation [91.40265983636839]
本稿では,SR を任意の LR と HR 画像から学習するためのフレームワークを提案する。
我々は、劣化適応SRネットワークを学習しながら、生成されたデータと実データとの差を最小限にする。
提案手法は,ペア学習法をより好むデータセットであっても,実世界の画像上での最先端のSR結果を実現する。
論文 参考訳(メタデータ) (2020-01-08T05:17:02Z) - Characteristic Regularisation for Super-Resolving Face Images [81.84939112201377]
既存の顔画像超解像法(SR)は、主に人工的にダウンサンプリングされた低解像度(LR)画像の改善に焦点を当てている。
従来の非教師なしドメイン適応(UDA)手法は、未ペアの真のLRとHRデータを用いてモデルをトレーニングすることでこの問題に対処する。
これにより、視覚的特徴を構成することと、画像の解像度を高めることの2つのタスクで、モデルをオーバーストレッチする。
従来のSRモデルとUDAモデルの利点を結合する手法を定式化する。
論文 参考訳(メタデータ) (2019-12-30T16:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。