論文の概要: A comparative analysis of SRGAN models
- arxiv url: http://arxiv.org/abs/2307.09456v2
- Date: Wed, 19 Jul 2023 14:27:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-20 10:58:55.631558
- Title: A comparative analysis of SRGAN models
- Title(参考訳): SRGANモデルの比較解析
- Authors: Fatemeh Rezapoor Nikroo, Ajinkya Deshmukh, Anantha Sharma, Adrian Tam,
Kaarthik Kumar, Cleo Norris, Aditya Dangi
- Abstract要約: 実世界の画像のベンチマークデータセットを用いて,SRGAN(Super Resolution Generative Adversarial Network)モデル,ESRGAN,Real-ESRGAN,EDSRの性能評価を行った。
いくつかのモデルは、視覚的品質を維持しながら入力画像の解像度を著しく向上させるように見えるが、これはTesseract OCRエンジンを用いて評価される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this study, we evaluate the performance of multiple state-of-the-art SRGAN
(Super Resolution Generative Adversarial Network) models, ESRGAN, Real-ESRGAN
and EDSR, on a benchmark dataset of real-world images which undergo degradation
using a pipeline. Our results show that some models seem to significantly
increase the resolution of the input images while preserving their visual
quality, this is assessed using Tesseract OCR engine. We observe that EDSR-BASE
model from huggingface outperforms the remaining candidate models in terms of
both quantitative metrics and subjective visual quality assessments with least
compute overhead. Specifically, EDSR generates images with higher peak
signal-to-noise ratio (PSNR) and structural similarity index (SSIM) values and
are seen to return high quality OCR results with Tesseract OCR engine. These
findings suggest that EDSR is a robust and effective approach for single-image
super-resolution and may be particularly well-suited for applications where
high-quality visual fidelity is critical and optimized compute.
- Abstract(参考訳): 本研究では,パイプラインを用いて劣化する実画像のベンチマークデータセットを用いて,複数の最先端SRGAN(Super Resolution Generative Adversarial Network, ESRGAN, Real-ESRGAN, EDSR)モデルの性能を評価する。
その結果,視覚品質を維持しつつ入力画像の解像度を著しく向上させるモデルがみられ,tesseract ocrエンジンを用いて評価した。
EDSR-BASEモデルは,最小の計算オーバーヘッドを伴って,定量的指標と主観的視覚的品質評価の両方の観点から,残りの候補モデルよりも優れている。
具体的には、EDSRは、高いピーク信号対雑音比(PSNR)と構造類似度指数(SSIM)の画像を生成し、Tesseract OCRエンジンで高品質なOCR結果を返す。
これらの結果から,EDSRは単一画像の超解像に対する堅牢かつ効果的なアプローチであり,高品質な視覚的忠実度が重要かつ最適化された計算手法に特に適している可能性が示唆された。
関連論文リスト
- DifAugGAN: A Practical Diffusion-style Data Augmentation for GAN-based
Single Image Super-resolution [88.13972071356422]
本稿では,DifAugGAN として知られる GAN ベースの画像超解像法(SR) のための拡散型データ拡張手法を提案する。
それは、訓練中の判別器の校正を改善するために、生成拡散モデルに拡散過程を適用することを含む。
我々のDifAugGANは、現在のGANベースのSISR手法のプラグ・アンド・プレイ戦略であり、判別器の校正を改善し、SR性能を向上させることができる。
論文 参考訳(メタデータ) (2023-11-30T12:37:53Z) - ESSAformer: Efficient Transformer for Hyperspectral Image
Super-resolution [76.7408734079706]
単一ハイパースペクトル像超解像(単一HSI-SR)は、低分解能観測から高分解能ハイパースペクトル像を復元することを目的としている。
本稿では,1つのHSI-SRの繰り返し精製構造を持つESSA注目組込みトランスフォーマネットワークであるESSAformerを提案する。
論文 参考訳(メタデータ) (2023-07-26T07:45:14Z) - Underwater Image Super-Resolution using Generative Adversarial
Network-based Model [3.127436744845925]
単一画像超解像モデル(SISR)は、水中画像の解像度と視覚的品質を向上させることができる。
本稿では,水中画像の超解像のための事前訓練されたReal-ESRGANモデルを微調整する。
論文 参考訳(メタデータ) (2022-11-07T13:38:28Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Textural-Structural Joint Learning for No-Reference Super-Resolution
Image Quality Assessment [59.91741119995321]
我々は、TSNetと呼ばれる品質予測のためのテキスト情報と構造情報を共同で探索するデュアルストリームネットワークを開発した。
画像の重要な領域に注意を払っている人間の視覚システム(HVS)を模倣することにより、視覚に敏感な領域をより区別しやすくするための空間的注意機構を開発する。
実験の結果,提案したTSNetは現状のIQA法よりも視覚的品質を正確に予測し,人間の視点との整合性を示した。
論文 参考訳(メタデータ) (2022-05-27T09:20:06Z) - Generative Adversarial Networks for Image Super-Resolution: A Survey [101.39605080291783]
単一画像超解像(SISR)は画像処理の分野で重要な役割を果たしている。
近年のGAN(Generative Adversarial Network)は,小サンプルを用いた低解像度画像に対して優れた結果が得られる。
本稿では,異なる視点からGANの比較研究を行う。
論文 参考訳(メタデータ) (2022-04-28T16:35:04Z) - A-ESRGAN: Training Real-World Blind Super-Resolution with Attention
U-Net Discriminators [0.0]
ブラインド画像超解像(SR)は、未知の複雑な歪みに苦しむ低解像度画像の復元を目的とした、CVにおける長年の課題である。
本稿では,A-ESRGANについて述べる。A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN。
論文 参考訳(メタデータ) (2021-12-19T02:50:23Z) - Real-World Single Image Super-Resolution: A Brief Review [44.14123585227239]
単一画像超解像(SISR)は、低解像(LR)観測から高解像(HR)画像を再構成することを目的とする。
深層学習に基づく超解像法が注目され,合成データの再構成性能が大幅に向上した。
論文 参考訳(メタデータ) (2021-03-03T12:41:44Z) - Unsupervised Alternating Optimization for Blind Hyperspectral Imagery
Super-resolution [40.350308926790255]
本稿では, 盲点HSI融合問題に対処するために, 盲点HSI SR法を提案する。
本稿ではまず,デジェネレーションモデルを推定し,遅延画像の再構成を行うために,逐次最適化に基づく深層フレームワークを提案する。
そして,ネットワークを事前学習するメタラーニングに基づく機構が提案され,ネットワークの速度と一般化能力を効果的に向上させることができる。
論文 参考訳(メタデータ) (2020-12-03T07:52:32Z) - Characteristic Regularisation for Super-Resolving Face Images [81.84939112201377]
既存の顔画像超解像法(SR)は、主に人工的にダウンサンプリングされた低解像度(LR)画像の改善に焦点を当てている。
従来の非教師なしドメイン適応(UDA)手法は、未ペアの真のLRとHRデータを用いてモデルをトレーニングすることでこの問題に対処する。
これにより、視覚的特徴を構成することと、画像の解像度を高めることの2つのタスクで、モデルをオーバーストレッチする。
従来のSRモデルとUDAモデルの利点を結合する手法を定式化する。
論文 参考訳(メタデータ) (2019-12-30T16:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。