論文の概要: FIPER: Generalizable Factorized Fields for Joint Image Compression and Super-Resolution
- arxiv url: http://arxiv.org/abs/2410.18083v1
- Date: Wed, 23 Oct 2024 17:59:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-24 13:54:56.484534
- Title: FIPER: Generalizable Factorized Fields for Joint Image Compression and Super-Resolution
- Title(参考訳): FIPER: 画像圧縮と超解像のための一般化可能な分解場
- Authors: Yang-Che Sun, Cheng Yu Yeo, Ernie Chu, Jun-Cheng Chen, Yu-Lun Liu,
- Abstract要約: 本稿では,超解法(SR)と画像圧縮の統一表現(**Factorized Fields**)を提案する。
まず、一般化可能な分解場のための係数バックボーンと基底スウィン変換器を含むSRモデルを導出する。
次に、訓練されたSRモジュールの強い情報回復能力を圧縮パイプラインの先行機能として活用し、圧縮効率と詳細再構築の両方を改善した。
- 参考スコア(独自算出の注目度): 12.77409981295186
- License:
- Abstract: In this work, we propose a unified representation for Super-Resolution (SR) and Image Compression, termed **Factorized Fields**, motivated by the shared principles between these two tasks. Both SISR and Image Compression require recovering and preserving fine image details--whether by enhancing resolution or reconstructing compressed data. Unlike previous methods that mainly focus on network architecture, our proposed approach utilizes a basis-coefficient decomposition to explicitly capture multi-scale visual features and structural components in images, addressing the core challenges of both tasks. We first derive our SR model, which includes a Coefficient Backbone and Basis Swin Transformer for generalizable Factorized Fields. Then, to further unify these two tasks, we leverage the strong information-recovery capabilities of the trained SR modules as priors in the compression pipeline, improving both compression efficiency and detail reconstruction. Additionally, we introduce a merged-basis compression branch that consolidates shared structures, further optimizing the compression process. Extensive experiments show that our unified representation delivers state-of-the-art performance, achieving an average relative improvement of 204.4% in PSNR over the baseline in Super-Resolution (SR) and 9.35% BD-rate reduction in Image Compression compared to the previous SOTA.
- Abstract(参考訳): 本稿では,超解法(SR)と画像圧縮の統一表現(**Factorized Fields**)を提案する。
SISR と Image Compression はどちらも、解像度を向上したり、圧縮されたデータを再構築することによって、細かな画像の詳細を復元し保存する必要がある。
ネットワークアーキテクチャを主眼とする従来の手法とは違い,提案手法では,マルチスケールの視覚的特徴や画像の構造的要素を明示的に捉え,両タスクのコア課題に対処する。
まず、一般化可能な分解場のための係数バックボーンと基底スウィン変換器を含むSRモデルを導出する。
そして、これらの2つのタスクをさらに統合するために、訓練されたSRモジュールの強い情報回復能力を圧縮パイプラインの先行機能として活用し、圧縮効率と詳細再構築の両方を改善した。
さらに、共有構造を集約し、さらに圧縮プロセスを最適化する統合基底圧縮分岐を導入する。
超解法(SR)のベースラインよりもPSNRが204.4%向上し,画像圧縮の9.35%が削減された。
関連論文リスト
- Self-Asymmetric Invertible Network for Compression-Aware Image Rescaling [6.861753163565238]
現実世界のアプリケーションでは、ほとんどの画像は伝送のために圧縮される。
圧縮対応画像再スケーリングのための自己非対称可逆ネットワーク(SAIN)を提案する。
論文 参考訳(メタデータ) (2023-03-04T08:33:46Z) - Bridging Component Learning with Degradation Modelling for Blind Image
Super-Resolution [69.11604249813304]
視覚障害者のためのコンポーネント分解・協調最適化ネットワーク(CDCN)を提案する。
CDCNは入力LR画像を特徴空間の構造と詳細成分に分解する。
本稿では,HR画像の細部と構造復元過程を協調的に監督する,劣化駆動型学習戦略を提案する。
論文 参考訳(メタデータ) (2022-12-03T14:53:56Z) - HST: Hierarchical Swin Transformer for Compressed Image Super-resolution [26.589370745694502]
低解像度圧縮画像を復元する階層型スウィントランス (HST) ネットワークを提案する。
我々のHSTは、低品質の圧縮画像超解像トラックにおけるAIM 2022の5位であり、PSNRは23.51dBである。
論文 参考訳(メタデータ) (2022-08-21T13:41:51Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。
52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文 参考訳(メタデータ) (2021-05-24T12:07:38Z) - Regularized Compression of MRI Data: Modular Optimization of Joint
Reconstruction and Coding [2.370481325034443]
本稿では,MRI再構成と損失圧縮の協調最適化のためのフレームワークを提案する。
本手法は,品質とビットレートのトレードオフを改善するために,医用画像の圧縮表現を生成する。
正規化法と比較すると,PSNRは高いビットレートで0.5から1dBのゲインが得られる。
論文 参考訳(メタデータ) (2020-10-08T15:32:52Z) - Structure-Preserving Super Resolution with Gradient Guidance [87.79271975960764]
単一画像超解像(SISR)の構造
最近のGAN(Generative Adversarial Network)による研究は、SISRの開発を促進している。
しかし、復元された画像には常に望ましくない構造歪みがある。
論文 参考訳(メタデータ) (2020-03-29T17:26:58Z) - Learning Better Lossless Compression Using Lossy Compression [100.50156325096611]
我々は、ロスレス画像圧縮システムを構築するために、強力なロスレス画像圧縮アルゴリズムであるBPGを利用する。
我々は,BPG再構成を条件とした畳み込みニューラルネットワークに基づく確率モデルを用いて,残差分布をモデル化する。
そして、この画像は、BPGが生成したビットストリームと学習した残留コーダの連結を用いて保存される。
論文 参考訳(メタデータ) (2020-03-23T11:21:52Z) - A GAN-based Tunable Image Compression System [13.76136694287327]
本稿では、GAN(Generative Adversarial Network)を用いてコンテンツベースの圧縮を再考し、重要でない領域を再構築する。
モデルを再トレーニングすることなく、特定の圧縮比に画像を圧縮するチューナブル圧縮スキームも提案する。
論文 参考訳(メタデータ) (2020-01-18T02:40:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。