論文の概要: Versatile Recompression-Aware Perceptual Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2511.18090v1
- Date: Sat, 22 Nov 2025 15:12:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.624225
- Title: Versatile Recompression-Aware Perceptual Image Super-Resolution
- Title(参考訳): Versatile Recompression-Aware Perceptual Image Super-Resolution
- Authors: Mingwei He, Tongda Xu, Xingtong Ge, Ming Sun, Chao Zhou, Yan Wang,
- Abstract要約: 知覚画像超解像(SR)法は劣化した画像を復元し、鋭い出力を生成する。
提案するVersatile Recompression-Aware Perceptual Super-Resolution (VRPSR)は,既存の知覚SRに多目的圧縮を認識させる。
- 参考スコア(独自算出の注目度): 15.300512946481282
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Perceptual image super-resolution (SR) methods restore degraded images and produce sharp outputs. In practice, those outputs are usually recompressed for storage and transmission. Ignoring recompression is suboptimal as the downstream codec might add additional artifacts to restored images. However, jointly optimizing SR and recompression is challenging, as the codecs are not differentiable and vary in configuration. In this paper, we present Versatile Recompression-Aware Perceptual Super-Resolution (VRPSR), which makes existing perceptual SR aware of versatile compression. First, we formulate compression as conditional text-to-image generation and utilize a pre-trained diffusion model to build a generalizable codec simulator. Next, we propose a set of training techniques tailored for perceptual SR, including optimizing the simulator using perceptual targets and adopting slightly compressed images as the training target. Empirically, our VRPSR saves more than 10\% bitrate based on Real-ESRGAN and S3Diff under H.264/H.265/H.266 compression. Besides, our VRPSR facilitates joint optimization of the SR and post-processing model after recompression.
- Abstract(参考訳): 知覚画像超解像(SR)法は劣化した画像を復元し、鋭い出力を生成する。
実際には、これらの出力は通常、記憶と送信のために再圧縮される。
圧縮の無視は、下流コーデックが復元された画像に追加のアーティファクトを追加するため、最適以下である。
しかし、コーデックは微分可能ではなく構成が異なるため、共同でSRと再圧縮を最適化することは困難である。
本稿では,多目的圧縮を意識した既存の知覚SRを実現するVersatile Recompression-Aware Perceptual Super-Resolution(VRPSR)を提案する。
まず、条件付きテキスト・画像生成として圧縮を定式化し、事前学習した拡散モデルを用いて一般化可能なコーデックシミュレータを構築する。
次に、知覚的ターゲットを用いたシミュレータの最適化や、わずかに圧縮された画像をトレーニングターゲットとして採用するなど、知覚的SRに適したトレーニング手法を提案する。
実証的に、我々のVRPSRは、H.264/H.265/H.266圧縮の下で、Real-ESRGANとS3Diffに基づいて10\%以上のビットレートを節約する。
また,我々のVRPSRは,再圧縮後のSRと後処理モデルの協調最適化を容易にする。
関連論文リスト
- COLI: A Hierarchical Efficient Compressor for Large Images [18.697445453003983]
Inlicit Neural Representations (INR)は、空間座標から個々の画像のピクセル強度への連続的なマッピングを学習することで、有望な代替手段を提供する。
我々は、NeRV(Neural Representations for Videos)を利用した新しいフレームワークであるCOLI(Compressor for Large Images)を紹介する。
また,COLIは,最大4倍のNRVトレーニングをしながら,PSNRとSSIMの競合や優れた測定値を,ピクセル当たりのビット数(bpp)で連続的に達成することを示した。
論文 参考訳(メタデータ) (2025-07-15T16:07:07Z) - Ultra Lowrate Image Compression with Semantic Residual Coding and Compression-aware Diffusion [28.61304513668606]
ResULICは残留誘導型超低レート画像圧縮システムである。
残差信号は意味検索と拡散に基づく生成プロセスの両方に組み込む。
最先端拡散法に比べて客観的・主観的性能に優れる。
論文 参考訳(メタデータ) (2025-05-13T06:51:23Z) - Embedding Compression Distortion in Video Coding for Machines [67.97469042910855]
現在、ビデオ伝送は人間の視覚システム(HVS)だけでなく、分析のための機械認識にも役立っている。
本稿では,機械知覚関連歪み表現を抽出し,下流モデルに埋め込む圧縮歪埋め込み(CDRE)フレームワークを提案する。
我々のフレームワークは,実行時間,パラメータ数といったオーバーヘッドを最小限に抑えて,既存のコーデックのレートタスク性能を効果的に向上させることができる。
論文 参考訳(メタデータ) (2025-03-27T13:01:53Z) - FIPER: Factorized Features for Robust Image Super-Resolution and Compression [17.542586429972765]
低レベル視覚タスクに統一表現(Factized Features)を用いることを提案する。
これらのタスク間の共通原則によって動機付けられ、細かい画像の詳細を復元し保存する必要がある。
論文 参考訳(メタデータ) (2024-10-23T17:59:57Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Self-Asymmetric Invertible Network for Compression-Aware Image Rescaling [6.861753163565238]
現実世界のアプリケーションでは、ほとんどの画像は伝送のために圧縮される。
圧縮対応画像再スケーリングのための自己非対称可逆ネットワーク(SAIN)を提案する。
論文 参考訳(メタデータ) (2023-03-04T08:33:46Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。