論文の概要: HyperThumbnail: Real-time 6K Image Rescaling with Rate-distortion
Optimization
- arxiv url: http://arxiv.org/abs/2304.01064v1
- Date: Mon, 3 Apr 2023 15:21:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 14:43:13.470400
- Title: HyperThumbnail: Real-time 6K Image Rescaling with Rate-distortion
Optimization
- Title(参考訳): HyperThumbnail: レート歪み最適化によるリアルタイム6Kイメージ再スケーリング
- Authors: Chenyang Qi, Xin Yang, Ka Leong Cheng, Ying-Cong Chen, Qifeng Chen
- Abstract要約: リアルタイム6Kレート歪み認識画像再スケーリングのための新しいフレームワークを提案する。
我々のフレームワークは、HR画像をエンコーダによってJPEG LRサムネイルに埋め込む。
そして、効率的な周波数認識復号器は、LR1から高忠実度HR画像をリアルタイムに再構成する。
- 参考スコア(独自算出の注目度): 53.61374658914277
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contemporary image rescaling aims at embedding a high-resolution (HR) image
into a low-resolution (LR) thumbnail image that contains embedded information
for HR image reconstruction. Unlike traditional image super-resolution, this
enables high-fidelity HR image restoration faithful to the original one, given
the embedded information in the LR thumbnail. However, state-of-the-art image
rescaling methods do not optimize the LR image file size for efficient sharing
and fall short of real-time performance for ultra-high-resolution (e.g., 6K)
image reconstruction. To address these two challenges, we propose a novel
framework (HyperThumbnail) for real-time 6K rate-distortion-aware image
rescaling. Our framework first embeds an HR image into a JPEG LR thumbnail by
an encoder with our proposed quantization prediction module, which minimizes
the file size of the embedding LR JPEG thumbnail while maximizing HR
reconstruction quality. Then, an efficient frequency-aware decoder reconstructs
a high-fidelity HR image from the LR one in real time. Extensive experiments
demonstrate that our framework outperforms previous image rescaling baselines
in rate-distortion performance and can perform 6K image reconstruction in real
time.
- Abstract(参考訳): 現代の画像再構成は、HR画像再構成のための埋め込み情報を含む低解像度(LR)サムネイル画像に高解像度(HR)画像を埋め込むことを目的としている。
従来の超解像とは異なり、LRサムネイルに埋め込まれた情報から、元の画像に忠実な高忠実なHR画像復元を可能にする。
しかし、最先端画像再スケーリング手法では、lr画像ファイルサイズを最適化せず、超高解像度(例えば6k)画像再構成のリアルタイム性能を低下させる。
これら2つの課題に対処するために、リアルタイム6Kレート歪み認識画像再スケーリングのための新しいフレームワーク(HyperThumbnail)を提案する。
提案する量子化予測モジュールにより,まずHR画像のJPEG LRサムネイルへの埋め込みを行い,HR再構成の品質を最大化しながら,埋め込みLR JPEGサムネイルのファイルサイズを最小化する。
そして、効率的な周波数認識復号器は、LR1から高忠実度HR画像をリアルタイムに再構成する。
広範な実験により,従来の画像再スケーリングベースラインよりも性能が優れており,リアルタイムに6k画像再構成が可能となった。
関連論文リスト
- Efficient Test-Time Adaptation for Super-Resolution with Second-Order
Degradation and Reconstruction [62.955327005837475]
画像超解像(SR)は,低分解能(LR)から高分解能(HR)へのマッピングを,一対のHR-LRトレーニング画像を用いて学習することを目的としている。
SRTTAと呼ばれるSRの効率的なテスト時間適応フレームワークを提案し、SRモデルを異なる/未知の劣化型でテストドメインに迅速に適応させることができる。
論文 参考訳(メタデータ) (2023-10-29T13:58:57Z) - Self-Asymmetric Invertible Network for Compression-Aware Image Rescaling [6.861753163565238]
現実世界のアプリケーションでは、ほとんどの画像は伝送のために圧縮される。
圧縮対応画像再スケーリングのための自己非対称可逆ネットワーク(SAIN)を提案する。
論文 参考訳(メタデータ) (2023-03-04T08:33:46Z) - Real Image Super-Resolution using GAN through modeling of LR and HR
process [20.537597542144916]
LRモデルとSRモデルに組み込んだ学習可能な適応正弦波非線形性を提案し,分解分布を直接学習する。
定量的および定性的な実験において提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-10-19T09:23:37Z) - Hierarchical Conditional Flow: A Unified Framework for Image
Super-Resolution and Image Rescaling [139.25215100378284]
画像SRと画像再スケーリングのための統合フレームワークとして階層的条件フロー(HCFlow)を提案する。
HCFlowは、LR画像と残りの高周波成分の分布を同時にモデル化することにより、HRとLR画像ペア間のマッピングを学習する。
さらに性能を高めるために、知覚的損失やGAN損失などの他の損失と、トレーニングで一般的に使用される負の対数類似損失とを組み合わせる。
論文 参考訳(メタデータ) (2021-08-11T16:11:01Z) - LAPAR: Linearly-Assembled Pixel-Adaptive Regression Network for Single
Image Super-Resolution and Beyond [75.37541439447314]
単一画像超解像(SISR)は、低解像度(LR)画像を高解像度(HR)バージョンにアップサンプリングする根本的な問題を扱う。
本稿では,線形組立画素適応回帰ネットワーク (LAPAR) を提案する。
論文 参考訳(メタデータ) (2021-05-21T15:47:18Z) - Real-World Super-Resolution of Face-Images from Surveillance Cameras [25.258587196435464]
本稿では,現実的なLR/HRトレーニングペアを生成するための新しいフレームワークを提案する。
本フレームワークは、実写のぼやけたカーネル、ノイズ分布、JPEG圧縮アーチファクトを推定し、ソース領域のものと類似した画像特性を持つLR画像を生成する。
我々はGANベースのSRモデルを用いて、よく使われるVGG-loss[24]とLPIPS-loss[52]を交換した。
論文 参考訳(メタデータ) (2021-02-05T11:38:30Z) - Super-Resolution of Real-World Faces [3.4376560669160394]
実の低解像度 (LR) の顔画像は、変わらず複雑で既知のダウンサンプリングカーネルによってキャプチャされる劣化を含んでいる。
本稿では,特徴抽出モジュールがLR画像からロバストな特徴を抽出する2つのモジュール超解像ネットワークを提案する。
我々は、劣化GANを訓練し、双対的に縮小されたクリーン画像を実際の劣化画像に変換し、得られた劣化LR画像と、そのクリーンLR画像とを補間する。
論文 参考訳(メタデータ) (2020-11-04T17:25:54Z) - Closed-loop Matters: Dual Regression Networks for Single Image
Super-Resolution [73.86924594746884]
ディープニューラルネットワークは、画像超解像において有望な性能を示した。
これらのネットワークは、低分解能(LR)画像から高分解能(HR)画像への非線形マッピング関数を学習する。
本稿では,可能な関数の空間を削減するために,LRデータに新たな制約を導入することで,二重回帰手法を提案する。
論文 参考訳(メタデータ) (2020-03-16T04:23:42Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。