論文の概要: Frequency Domain-based Perceptual Loss for Super Resolution
- arxiv url: http://arxiv.org/abs/2007.12296v1
- Date: Thu, 23 Jul 2020 23:35:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 13:05:27.928319
- Title: Frequency Domain-based Perceptual Loss for Super Resolution
- Title(参考訳): 超解像のための周波数領域に基づく知覚損失
- Authors: Shane D. Sims
- Abstract要約: 単一画像超解像(SR)の損失関数である周波数領域知覚損失(FDPL)を導入する。
FDPLは単一画像超解像(SR)の損失関数である
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Frequency Domain Perceptual Loss (FDPL), a loss function for
single image super resolution (SR). Unlike previous loss functions used to
train SR models, which are all calculated in the pixel (spatial) domain, FDPL
is computed in the frequency domain. By working in the frequency domain we can
encourage a given model to learn a mapping that prioritizes those frequencies
most related to human perception. While the goal of FDPL is not to maximize the
Peak Signal to Noise Ratio (PSNR), we found that there is a correlation between
decreasing FDPL and increasing PSNR. Training a model with FDPL results in a
higher average PSRN (30.94), compared to the same model trained with pixel loss
(30.59), as measured on the Set5 image dataset. We also show that our method
achieves higher qualitative results, which is the goal of a perceptual loss
function. However, it is not clear that the improved perceptual quality is due
to the slightly higher PSNR or the perceptual nature of FDPL.
- Abstract(参考訳): 本稿では、単一画像超解像(SR)の損失関数である周波数領域知覚損失(FDPL)を紹介する。
ピクセル(空間)領域で計算されるsrモデルのトレーニングに用いられる以前の損失関数とは異なり、fdplは周波数領域で計算される。
周波数領域で働くことで、人間の知覚に最も関係した周波数を優先順位付けするマッピングを学ぶよう、与えられたモデルに促すことができます。
FDPLの目標は、Pak Signal to Noise Ratio (PSNR) を最大化することではなく、FDPLの減少とPSNRの増加との間には相関があることを見出した。
FDPLでモデルをトレーニングすると、Set5イメージデータセットで測定されたピクセル損失(30.59)でトレーニングされたのと同じモデルと比較して、平均PSRN(30.94)が上がる。
また,本手法は知覚損失関数の目標であるより高い質的結果が得られることを示す。
しかし,PSNRが若干高くなるか,FDPLの知覚特性が向上しているかは明らかになっていない。
関連論文リスト
- FreqINR: Frequency Consistency for Implicit Neural Representation with Adaptive DCT Frequency Loss [5.349799154834945]
本稿では、新しい任意スケール超解像法であるFreqINR(FreqINR)について述べる。
トレーニングでは,適応離散コサイン変換周波数損失(adaptive Discrete Cosine Transform Frequency Loss,ADFL)を用いて,HR画像と地絡画像の周波数ギャップを最小化する。
推論の際には,低分解能(LR)画像と地軸画像のスペクトルコヒーレンスを維持するために受容場を拡張した。
論文 参考訳(メタデータ) (2024-08-25T03:53:17Z) - Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - Aug-NeRF: Training Stronger Neural Radiance Fields with Triple-Level
Physically-Grounded Augmentations [111.08941206369508]
我々は,NeRFトレーニングの正規化にロバストなデータ拡張のパワーを初めてもたらすAugmented NeRF(Aug-NeRF)を提案する。
提案手法では,最悪の場合の摂動を3段階のNeRFパイプラインにシームレスにブレンドする。
Aug-NeRFは、新しいビュー合成と基礎となる幾何再構成の両方において、NeRF性能を効果的に向上させる。
論文 参考訳(メタデータ) (2022-07-04T02:27:07Z) - Frequency selective extrapolation with residual filtering for image
error concealment [2.3484130340004326]
信号外挿の目的は、未知の信号部品を既知のサンプルから推定することである。
自然画像の低パス動作を考慮した周波数選択外挿法(FSE)を提案する。
論文 参考訳(メタデータ) (2022-05-16T06:59:36Z) - NeRF-SR: High-Quality Neural Radiance Fields using Super-Sampling [82.99453001445478]
主に低分解能(LR)入力を用いた高分解能(HR)新規ビュー合成のソリューションであるNeRF-SRを提案する。
提案手法は,多層パーセプトロンを用いて各点密度と色を予測するニューラルレージアンス場(NeRF)上に構築されている。
論文 参考訳(メタデータ) (2021-12-03T07:33:47Z) - FreqNet: A Frequency-domain Image Super-Resolution Network with Dicrete
Cosine Transform [16.439669339293747]
単一画像超解像(SISR)は低分解能(LR)入力から高分解能(HR)出力を得ることを目的とした不適切な問題である。
高ピーク信号-雑音比(PSNR)の結果にもかかわらず、モデルが望まれる高周波の詳細を正しく付加するかどうかを判断することは困難である。
本稿では、周波数領域の観点から直感的なパイプラインであるFreqNetを提案し、この問題を解決する。
論文 参考訳(メタデータ) (2021-11-21T11:49:12Z) - Wavelet-Based Network For High Dynamic Range Imaging [64.66969585951207]
光学フローベースやエンド・ツー・エンドのディープラーニングベースのソリューションのような既存の方法は、詳細な復元やゴーストを除去する際にエラーを起こしやすい。
本研究では、周波数領域でHDR融合を行うための新しい周波数誘導型エンド・ツー・エンドディープニューラルネットワーク(FNet)を提案し、ウェーブレット変換(DWT)を用いて入力を異なる周波数帯域に分解する。
低周波信号は特定のゴーストアーティファクトを避けるために使用され、高周波信号は詳細を保存するために使用される。
論文 参考訳(メタデータ) (2021-08-03T12:26:33Z) - Fourier Space Losses for Efficient Perceptual Image Super-Resolution [131.50099891772598]
提案した損失関数の適用のみで,最近導入された効率的なジェネレータアーキテクチャの性能向上が可能であることを示す。
フーリエ空間における周波数に対する損失の直接的強調は知覚的画質を著しく向上させることを示す。
訓練されたジェネレータは、最先端の知覚的SR法である RankSRGAN と SRFlow よりも2.4倍、48倍高速である。
論文 参考訳(メタデータ) (2021-06-01T20:34:52Z) - Test-Time Adaptation for Super-Resolution: You Only Need to Overfit on a
Few More Images [12.846479438896338]
事前訓練されたSRネットワークからHR予測の知覚品質を改善するためのシンプルで普遍的なアプローチを提案します。
知覚品質とPSNR/SSIM値の点で、画像に対する微調整の効果を示します。
論文 参考訳(メタデータ) (2021-04-06T16:50:52Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。