論文の概要: Idempotence and Perceptual Image Compression
- arxiv url: http://arxiv.org/abs/2401.08920v1
- Date: Wed, 17 Jan 2024 02:05:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-18 17:10:58.303221
- Title: Idempotence and Perceptual Image Compression
- Title(参考訳): イデムポテンスと知覚的画像圧縮
- Authors: Tongda Xu, Ziran Zhu, Dailan He, Yanghao Li, Lina Guo, Yuanyuan Wang,
Zhe Wang, Hongwei Qin, Yan Wang, Jingjing Liu, Ya-Qin Zhang
- Abstract要約: イデムポタンス(Idempotence)とは、画像の再圧縮に対する安定性である。
本稿では,非条件生成モデルにIdempotence制約を加えることにより,知覚イメージの新たなパラダイムを提案する。
我々の理論は条件付き生成と等価であり、新しいモデルを訓練する必要はない。
- 参考スコア(独自算出の注目度): 35.469547986620476
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Idempotence is the stability of image codec to re-compression. At the first
glance, it is unrelated to perceptual image compression. However, we find that
theoretically: 1) Conditional generative model-based perceptual codec satisfies
idempotence; 2) Unconditional generative model with idempotence constraint is
equivalent to conditional generative codec. Based on this newfound equivalence,
we propose a new paradigm of perceptual image codec by inverting unconditional
generative model with idempotence constraints. Our codec is theoretically
equivalent to conditional generative codec, and it does not require training
new models. Instead, it only requires a pre-trained mean-square-error codec and
unconditional generative model. Empirically, we show that our proposed approach
outperforms state-of-the-art methods such as HiFiC and ILLM, in terms of
Fr\'echet Inception Distance (FID). The source code is provided in
https://github.com/tongdaxu/Idempotence-and-Perceptual-Image-Compression.
- Abstract(参考訳): Idempotenceはイメージコーデックの再圧縮に対する安定性である。
一見すると、知覚的画像圧縮とは無関係である。
しかし、理論的には、
1)条件付き生成モデルに基づく知覚コーデックは、等性を満たす。
2) 等化制約付き無条件生成モデルは条件生成コーデックと等価である。
この新たな等価性に基づいて,等化制約のある非条件生成モデルを反転させることにより,知覚的イメージコーデックの新しいパラダイムを提案する。
我々のコーデックは理論的には条件付き生成コーデックと等価であり、新しいモデルの訓練を必要としない。
代わりに、訓練済みの平均二乗エラーコーデックと無条件生成モデルのみを必要とする。
実験により,提案手法は,Fr'echet Inception Distance (FID) の観点から,HiFiCやILLMといった最先端手法よりも優れていることを示す。
ソースコードはhttps://github.com/tongdaxu/Idempotence-and-Perceptual-Image-Compressionにある。
関連論文リスト
- Extreme Video Compression with Pre-trained Diffusion Models [11.898317376595697]
本稿では,デコーダにおける拡散型生成モデルの予測力を活用した,極端な映像圧縮のための新しい手法を提案する。
ビデオ全体が順次エンコードされ、知覚品質の指標を考慮し、視覚的に快く再現される。
その結果、生成モデルを用いて映像データの時間的関係を活用できる可能性が示された。
論文 参考訳(メタデータ) (2024-02-14T04:23:05Z) - Image Compression with Product Quantized Masked Image Modeling [44.15706119017024]
最近のニューラル圧縮法は、人気のあるハイパープライアフレームワークに基づいている。
Scalar Quantizationに依存しており、非常に強力な圧縮パフォーマンスを提供します。
これは、ベクトル量子化が一般的に用いられる画像生成と表現学習の最近の進歩とは対照的である。
論文 参考訳(メタデータ) (2022-12-14T17:50:39Z) - Lossy Image Compression with Quantized Hierarchical VAEs [33.173021636656465]
ResNet VAEはもともとデータ(画像)の分散モデリングのために設計された。
自然画像の損失圧縮における従来の手法より優れる、強力で効率的なモデルを提案する。
本モデルでは,画像を粗大に圧縮し,並列符号化と復号化をサポートする。
論文 参考訳(メタデータ) (2022-08-27T17:15:38Z) - CANF-VC: Conditional Augmented Normalizing Flows for Video Compression [81.41594331948843]
CANF-VCは、エンドツーエンドの学習ベースのビデオ圧縮システムである。
条件付き拡張正規化フロー(ANF)に基づく。
論文 参考訳(メタデータ) (2022-07-12T04:53:24Z) - Video Coding Using Learned Latent GAN Compression [1.6058099298620423]
ビデオの表現と圧縮にはStyleGANなどのGANの生成能力を活用する。
各フレームはStyleGANの潜在空間で反転され、そこから最適な圧縮が学習される。
論文 参考訳(メタデータ) (2022-07-09T19:07:43Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z) - An Information Theory-inspired Strategy for Automatic Network Pruning [88.51235160841377]
深層畳み込みニューラルネットワークは、リソース制約のあるデバイスで圧縮されることがよく知られている。
既存のネットワークプルーニング手法の多くは、人的努力と禁忌な計算資源を必要とする。
本稿では,自動モデル圧縮のための情報理論に基づく戦略を提案する。
論文 参考訳(メタデータ) (2021-08-19T07:03:22Z) - Learning Scalable $\ell_\infty$-constrained Near-lossless Image
Compression via Joint Lossy Image and Residual Compression [118.89112502350177]
本稿では,$ell_infty$-constrained near-lossless image compressionを学習するための新しいフレームワークを提案する。
元の残差の学習確率モデルを定量化し、量子化残差の確率モデルを導出する。
論文 参考訳(メタデータ) (2021-03-31T11:53:36Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。