論文の概要: Modeling Lost Information in Lossy Image Compression
- arxiv url: http://arxiv.org/abs/2006.11999v3
- Date: Wed, 8 Jul 2020 01:55:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 05:22:10.726170
- Title: Modeling Lost Information in Lossy Image Compression
- Title(参考訳): 画像圧縮における損失情報のモデル化
- Authors: Yaolong Wang, Mingqing Xiao, Chang Liu, Shuxin Zheng, Tie-Yan Liu
- Abstract要約: ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
- 参考スコア(独自算出の注目度): 72.69327382643549
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Lossy image compression is one of the most commonly used operators for
digital images. Most recently proposed deep-learning-based image compression
methods leverage the auto-encoder structure, and reach a series of promising
results in this field. The images are encoded into low dimensional latent
features first, and entropy coded subsequently by exploiting the statistical
redundancy. However, the information lost during encoding is unfortunately
inevitable, which poses a significant challenge to the decoder to reconstruct
the original images. In this work, we propose a novel invertible framework
called Invertible Lossy Compression (ILC) to largely mitigate the information
loss problem. Specifically, ILC introduces an invertible encoding module to
replace the encoder-decoder structure to produce the low dimensional
informative latent representation, meanwhile, transform the lost information
into an auxiliary latent variable that won't be further coded or stored. The
latent representation is quantized and encoded into bit-stream, and the latent
variable is forced to follow a specified distribution, i.e. isotropic Gaussian
distribution. In this way, recovering the original image is made tractable by
easily drawing a surrogate latent variable and applying the inverse pass of the
module with the sampled variable and decoded latent features. Experimental
results demonstrate that with a new component replacing the auto-encoder in
image compression methods, ILC can significantly outperform the baseline method
on extensive benchmark datasets by combining with the existing compression
algorithms.
- Abstract(参考訳): ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
近年提案された深層学習に基づく画像圧縮手法は, オートエンコーダ構造を活用し, この分野で有望な結果を得た。
画像はまず低次元の潜伏特徴に符号化され、その後、統計冗長性を利用してエントロピー符号化される。
しかし、エンコード中に失われた情報は、残念ながら避けられないため、デコーダが元の画像を再構築する上で大きな課題となる。
本研究では,情報損失問題を抑えるために,ILC(Invertible Lossy Compression)と呼ばれる新しい非可逆的フレームワークを提案する。
特に、ICCはエンコーダ・デコーダ構造を置き換えるための可逆符号化モジュールを導入し、低次元情報潜在表現を生成する一方で、失われた情報をさらなるコード化や保存を行わない補助潜在変数に変換する。
潜伏表現は量子化されビットストリームに符号化され、潜伏変数は特定の分布、すなわち等方ガウス分布に従わざるを得ない。
このようにして、サロゲート潜伏変数を容易に描画し、モジュールの逆パスにサンプル変数と復号化潜伏特徴を加えることにより、原画像の復元を可能にする。
画像圧縮法におけるオートエンコーダを置き換えた新しいコンポーネントにより、ICCは既存の圧縮アルゴリズムと組み合わせることで、広範囲なベンチマークデータセット上でのベースライン手法を大幅に上回ることを示す。
関連論文リスト
- Enhancing Perception Quality in Remote Sensing Image Compression via Invertible Neural Network [10.427300958330816]
リモートセンシング画像をデコードして、特に低解像度で高い知覚品質を実現することは、依然として大きな課題である。
Invertible Neural Network-based Remote Sensor Image compression (INN-RSIC)法を提案する。
我々の INN-RSIC は、認識品質の観点から、既存の最先端のディープラーニングベースの画像圧縮手法よりも優れています。
論文 参考訳(メタデータ) (2024-05-17T03:52:37Z) - HybridFlow: Infusing Continuity into Masked Codebook for Extreme Low-Bitrate Image Compression [51.04820313355164]
HyrbidFlowは、連続的な機能ベースのストリームとコードブックベースのストリームを組み合わせることで、極めて低い条件下で高い知覚品質と高い忠実性を実現する。
実験の結果、超低速で複数のデータセットにまたがる優れた性能が示された。
論文 参考訳(メタデータ) (2024-04-20T13:19:08Z) - Neural Image Compression Using Masked Sparse Visual Representation [17.229601298529825]
本研究では,Sparse Visual Representation (SVR) に基づくニューラル画像圧縮について検討し,学習されたビジュアルコードブックにまたがる離散潜在空間に画像が埋め込まれた。
コードブックをデコーダと共有することにより、エンコーダは効率的でクロスプラットフォームなコードワードインデックスを転送する。
本稿では,マスクを潜在機能部分空間に適用して品質のバランスと再構築を行うMasked Adaptive Codebook Learning (M-AdaCode)法を提案する。
論文 参考訳(メタデータ) (2023-09-20T21:59:23Z) - Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文 参考訳(メタデータ) (2023-07-17T06:14:19Z) - Lossy Image Compression with Conditional Diffusion Models [25.158390422252097]
本稿では,拡散生成モデルを用いた画像圧縮のエンドツーエンド最適化について概説する。
VAEベースのニューラル圧縮とは対照的に、(平均)デコーダは決定論的ニューラルネットワークであり、私たちのデコーダは条件付き拡散モデルである。
提案手法では,GANモデルよりもFIDスコアが強く,VAEモデルとの競合性能も高い。
論文 参考訳(メタデータ) (2022-09-14T21:53:27Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Towards End-to-End Image Compression and Analysis with Transformers [99.50111380056043]
本稿では,クラウドベースの画像分類アプリケーションを対象として,トランスフォーマーを用いたエンドツーエンドの画像圧縮解析モデルを提案する。
我々は、圧縮された特徴から画像分類を行うためにビジョントランスフォーマー(ViT)モデルを再設計し、トランスフォーマーからの長期情報を用いて画像圧縮を容易にすることを目指している。
画像圧縮と分類作業の両方において,提案モデルの有効性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2021-12-17T03:28:14Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。