論文の概要: What Hinders Perceptual Quality of PSNR-oriented Methods?
- arxiv url: http://arxiv.org/abs/2201.01034v1
- Date: Tue, 4 Jan 2022 08:30:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 14:19:25.113156
- Title: What Hinders Perceptual Quality of PSNR-oriented Methods?
- Title(参考訳): PSNR指向手法の知覚品質に障害があるか?
- Authors: Tianshuo Xu, Peng Mi, Xiawu Zheng, Lijiang Li, Fei Chao, Guannan
Jiang, Wei Zhang, Yiyi Zhou, Rongrong Ji
- Abstract要約: 本稿では,高頻度拡張モジュールと空間コントラスト学習モジュールを組み合わせることで,COO問題と低周波傾向の影響を低減することを提案する。
実験結果から、DCLossを複数の正規SRモデルに適用する際の効率と有効性を示した。
- 参考スコア(独自算出の注目度): 61.648259566212424
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we discover two factors that inhibit POMs from achieving high
perceptual quality: 1) center-oriented optimization (COO) problem and 2)
model's low-frequency tendency. First, POMs tend to generate an SR image whose
position in the feature space is closest to the distribution center of all
potential high-resolution (HR) images, resulting in such POMs losing
high-frequency details. Second, $90\%$ area of an image consists of
low-frequency signals; in contrast, human perception relies on an image's
high-frequency details. However, POMs apply the same calculation to process
different-frequency areas, so that POMs tend to restore the low-frequency
regions. Based on these two factors, we propose a Detail Enhanced Contrastive
Loss (DECLoss), by combining a high-frequency enhancement module and spatial
contrastive learning module, to reduce the influence of the COO problem and
low-Frequency tendency. Experimental results show the efficiency and
effectiveness when applying DECLoss on several regular SR models. E.g, in EDSR,
our proposed method achieves 3.60$\times$ faster learning speed compared to a
GAN-based method with a subtle degradation in visual quality. In addition, our
final results show that an SR network equipped with our DECLoss generates more
realistic and visually pleasing textures compared to state-of-the-art methods.
%The source code of the proposed method is included in the supplementary
material and will be made publicly available in the future.
- Abstract(参考訳): 本稿では,POMの知覚品質向上を阻害する2つの要因について述べる。
1)センター指向最適化(COO)問題
2)モデルの低周波傾向。
まず、pomは、特徴空間における位置が全ての高分解能画像の分布中心に最も近いsr画像を生成する傾向にあり、その結果、高周波数詳細が失われる。
第2に、画像の90\%$領域は低周波信号から成り、対照的に人間の知覚は画像の高周波詳細に依存している。
しかし、POMは異なる周波数領域を処理するために同じ計算を適用するため、POMは低周波数領域を復元する傾向がある。
これらの2つの要因に基づいて,高周波数拡張モジュールと空間コントラスト学習モジュールを組み合わせたDetail Enhanced Contrastive Loss (DECLoss)を提案し,COO問題と低周波数傾向の影響を低減する。
実験結果は,複数の正規srモデルにdeclossを適用する場合の効率と有効性を示す。
例えば、EDSRでは、視覚的品質の微妙な劣化を伴うGAN法と比較して3.60$\times$高速学習を実現する。
さらに,本研究の最終結果は,DECOsを組み込んだSRネットワークが,最先端の手法に比べて現実的で視覚的なテクスチャを生成することを示す。
% 提案手法のソースコードは補足資料に含まれており,今後公開される予定である。
関連論文リスト
- HIR-Diff: Unsupervised Hyperspectral Image Restoration Via Improved
Diffusion Models [38.74983301496911]
ハイパースペクトル画像(HSI)の復元は、劣化した観察からクリーンなイメージを復元することを目的としている。
既存のモデルに基づく手法は、複雑な画像の特徴を正確にモデル化するのに限界がある。
本稿では,事前学習拡散モデル(HIR-Diff)を用いた教師なしHSI復元フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-24T17:15:05Z) - Noise-free Optimization in Early Training Steps for Image
Super-Resolution [20.169700745745462]
本研究では,対象のHR画像を2つのサブコンポーネントに分解することで,基礎となる構成要素をよりよく理解することを目的とする。
本研究は, SISRの誤った性質を把握できないことを示唆するものである。
本研究では,バニラ訓練の初期段階において,固有雑音項を効果的に除去できる新しい最適化手法を提案する。
論文 参考訳(メタデータ) (2023-12-29T09:13:09Z) - GAN-based Image Compression with Improved RDO Process [20.00340507091567]
速度歪みの最適化を改良した新しいGANベースの画像圧縮手法を提案する。
これを実現するために、DisTSとMS-SSIMのメトリクスを用いて、色、テクスチャ、構造における知覚的変性を測定する。
提案手法は,既存のGAN法および最先端ハイブリッド(VVC)よりも優れている。
論文 参考訳(メタデータ) (2023-06-18T03:21:11Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Zero-shot Blind Image Denoising via Implicit Neural Representations [77.79032012459243]
暗黙的ニューラル表現(INR)のアーキテクチャ的帰納的バイアスを利用した代替的認知戦略を提案する。
提案手法は,低雑音シナリオや実雑音シナリオの広い範囲において,既存のゼロショット復調手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-04-05T12:46:36Z) - Fourier Space Losses for Efficient Perceptual Image Super-Resolution [131.50099891772598]
提案した損失関数の適用のみで,最近導入された効率的なジェネレータアーキテクチャの性能向上が可能であることを示す。
フーリエ空間における周波数に対する損失の直接的強調は知覚的画質を著しく向上させることを示す。
訓練されたジェネレータは、最先端の知覚的SR法である RankSRGAN と SRFlow よりも2.4倍、48倍高速である。
論文 参考訳(メタデータ) (2021-06-01T20:34:52Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - Generalized Octave Convolutions for Learned Multi-Frequency Image
Compression [20.504561050200365]
本稿では,初めて学習されたマルチ周波数画像圧縮とエントロピー符号化手法を提案する。
これは最近開発されたオクターブの畳み込みに基づいて、潜水剤を高周波(高分解能)成分に分解する。
提案した一般化オクターブ畳み込みは、他のオートエンコーダベースのコンピュータビジョンタスクの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-02-24T01:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。