論文の概要: UltraSR: Spatial Encoding is a Missing Key for Implicit Image
Function-based Arbitrary-Scale Super-Resolution
- arxiv url: http://arxiv.org/abs/2103.12716v1
- Date: Tue, 23 Mar 2021 17:36:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-24 13:49:41.025444
- Title: UltraSR: Spatial Encoding is a Missing Key for Implicit Image
Function-based Arbitrary-Scale Super-Resolution
- Title(参考訳): UltraSR:空間エンコーディングは、画像機能に基づく任意スケール超解法に欠かせない鍵
- Authors: Xingqian Xu, Zhangyang Wang, Humphrey Shi
- Abstract要約: 本研究では,暗黙的イメージ関数に基づく,シンプルで効果的な新しいネットワーク設計であるUltraSRを提案する。
空間符号化は,次の段階の高精度暗黙的画像機能に対する欠落鍵であることを示す。
UltraSRは、すべての超解像スケールでDIV2Kベンチマークに最新のパフォーマンスを設定します。
- 参考スコア(独自算出の注目度): 74.82282301089994
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The recent success of NeRF and other related implicit neural representation
methods has opened a new path for continuous image representation, where pixel
values no longer need to be looked up from stored discrete 2D arrays but can be
inferred from neural network models on a continuous spatial domain. Although
the recent work LIIF has demonstrated that such novel approach can achieve good
performance on the arbitrary-scale super-resolution task, their upscaled images
frequently show structural distortion due to the faulty prediction on
high-frequency textures. In this work, we propose UltraSR, a simple yet
effective new network design based on implicit image functions in which spatial
coordinates and periodic encoding are deeply integrated with the implicit
neural representation. We show that spatial encoding is indeed a missing key
towards the next-stage high-accuracy implicit image function through extensive
experiments and ablation studies. Our UltraSR sets new state-of-the-art
performance on the DIV2K benchmark under all super-resolution scales comparing
to previous state-of-the-art methods. UltraSR also achieves superior
performance on other standard benchmark datasets in which it outperforms prior
works in almost all experiments. Our code will be released at
https://github.com/SHI-Labs/UltraSR-Arbitrary-Scale-Super-Resolution.
- Abstract(参考訳): nerfや他の関連する暗黙的ニューラルネットワークの手法の成功により、ピクセル値が格納された離散的な2d配列から参照される必要はなくなったが、連続的な空間領域上のニューラルネットワークモデルから推測できる、連続的な画像表現のための新しい経路が開かれた。
LIIFによる最近の研究は、任意のスケールの超解像処理において、そのような新しい手法が優れた性能を発揮することを示したが、高頻度テクスチャの欠陥予測による構造歪みがしばしば現れる。
本研究では,空間座標と周期符号化を暗黙のニューラル表現と深く統合した暗黙のイメージ関数に基づく,シンプルで効果的な新しいネットワーク設計であるUltraSRを提案する。
空間符号化は,広汎な実験とアブレーション研究を通じて,次世代の高精度暗黙的画像機能への欠落鍵であることを示す。
我々のUltraSRは、従来の最先端手法と比較して、すべての超高解像度スケールでDIV2Kベンチマークに新しい最先端性能を設定します。
UltraSRは、他の標準ベンチマークデータセットよりも優れたパフォーマンスを実現している。
私たちのコードはhttps://github.com/SHI-Labs/UltraSR-Arbitrary-Scale-Super-Resolutionでリリースされます。
関連論文リスト
- HF-Diff: High-Frequency Perceptual Loss and Distribution Matching for One-Step Diffusion-Based Image Super-Resolution [0.0]
我々は、ImageNetデータセット上で事前訓練された可逆ニューラルネットワーク(INN)を利用して、高周波の知覚損失を導入する。
トレーニング期間中,我々は超解像および基底真理(GT)画像の高周波特性の保存を強制する。
我々は、RealSR、RealSet65、DIV2K-Val、ImageNetデータセットで最先端のCLIPIQAスコアを得る。
論文 参考訳(メタデータ) (2024-11-20T18:56:24Z) - Super-Resolution Neural Operator [5.018040244860608]
本稿では,低分解能(LR)画像から任意のスケールで高分解能(HR)画像を分解できるフレームワークを提案する。
LR-HR画像対を異なる格子サイズで近似した連続関数として扱うことにより、SRNOは対応する関数空間間のマッピングを学習する。
実験により、SRNOは既存の連続SR法よりも精度と実行時間の両方で優れていることが示された。
論文 参考訳(メタデータ) (2023-03-05T06:17:43Z) - Hybrid Pixel-Unshuffled Network for Lightweight Image Super-Resolution [64.54162195322246]
畳み込みニューラルネットワーク(CNN)は画像超解像(SR)において大きな成功を収めた
ほとんどのディープCNNベースのSRモデルは、高い性能を得るために大量の計算を処理している。
SRタスクに効率的かつ効果的なダウンサンプリングモジュールを導入することで,HPUN(Hybrid Pixel-Unshuffled Network)を提案する。
論文 参考訳(メタデータ) (2022-03-16T20:10:41Z) - NeRF-SR: High-Quality Neural Radiance Fields using Super-Sampling [82.99453001445478]
主に低分解能(LR)入力を用いた高分解能(HR)新規ビュー合成のソリューションであるNeRF-SRを提案する。
提案手法は,多層パーセプトロンを用いて各点密度と色を予測するニューラルレージアンス場(NeRF)上に構築されている。
論文 参考訳(メタデータ) (2021-12-03T07:33:47Z) - Local Texture Estimator for Implicit Representation Function [10.165529175855712]
局所テクスチャ推定器(LTE)は自然画像の主周波数推定器である。
LTEは2Dフーリエ空間で画像テクスチャを特徴付けることができる。
LTEベースのニューラル関数は、任意のスケールで既存のディープSR法より優れていることを示す。
論文 参考訳(メタデータ) (2021-11-17T06:01:17Z) - LAPAR: Linearly-Assembled Pixel-Adaptive Regression Network for Single
Image Super-Resolution and Beyond [75.37541439447314]
単一画像超解像(SISR)は、低解像度(LR)画像を高解像度(HR)バージョンにアップサンプリングする根本的な問題を扱う。
本稿では,線形組立画素適応回帰ネットワーク (LAPAR) を提案する。
論文 参考訳(メタデータ) (2021-05-21T15:47:18Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z) - Hyperspectral Image Super-resolution via Deep Progressive Zero-centric
Residual Learning [62.52242684874278]
空間情報とスペクトル情報の相互モダリティ分布が問題となる。
本稿では,PZRes-Netという,新しいテクスライトウェイトなディープニューラルネットワークベースのフレームワークを提案する。
本フレームワークは,高分解能かつテクテッセロ中心の残像を学習し,シーンの空間的詳細を高頻度で表現する。
論文 参考訳(メタデータ) (2020-06-18T06:32:11Z) - Generalized Octave Convolutions for Learned Multi-Frequency Image
Compression [20.504561050200365]
本稿では,初めて学習されたマルチ周波数画像圧縮とエントロピー符号化手法を提案する。
これは最近開発されたオクターブの畳み込みに基づいて、潜水剤を高周波(高分解能)成分に分解する。
提案した一般化オクターブ畳み込みは、他のオートエンコーダベースのコンピュータビジョンタスクの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-02-24T01:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。