論文の概要: Split Hierarchical Variational Compression
- arxiv url: http://arxiv.org/abs/2204.02071v1
- Date: Tue, 5 Apr 2022 09:13:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 19:49:08.970735
- Title: Split Hierarchical Variational Compression
- Title(参考訳): スプリット階層型変分圧縮
- Authors: Tom Ryder, Chen Zhang, Ning Kang, Shifeng Zhang
- Abstract要約: 可変オートエンコーダ(VAE)は、画像データセットの圧縮を行う上で大きな成功を収めている。
SHVCは、ピクセルごとの自己回帰と完全に分解された確率モデルとの一般化を可能にする、効率的な自己回帰的サブピクセル畳み込みを導入している。
- 参考スコア(独自算出の注目度): 21.474095984110622
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Variational autoencoders (VAEs) have witnessed great success in performing
the compression of image datasets. This success, made possible by the bits-back
coding framework, has produced competitive compression performance across many
benchmarks. However, despite this, VAE architectures are currently limited by a
combination of coding practicalities and compression ratios. That is, not only
do state-of-the-art methods, such as normalizing flows, often demonstrate
out-performance, but the initial bits required in coding makes single and
parallel image compression challenging. To remedy this, we introduce Split
Hierarchical Variational Compression (SHVC). SHVC introduces two novelties.
Firstly, we propose an efficient autoregressive prior, the autoregressive
sub-pixel convolution, that allows a generalisation between per-pixel
autoregressions and fully factorised probability models. Secondly, we define
our coding framework, the autoregressive initial bits, that flexibly supports
parallel coding and avoids -- for the first time -- many of the practicalities
commonly associated with bits-back coding. In our experiments, we demonstrate
SHVC is able to achieve state-of-the-art compression performance across
full-resolution lossless image compression tasks, with up to 100x fewer model
parameters than competing VAE approaches.
- Abstract(参考訳): 可変オートエンコーダ(VAE)は、画像データセットの圧縮を行う上で大きな成功を収めている。
この成功はビットバックコーディングフレームワークによって実現され、多くのベンチマークで競合する圧縮性能を生み出している。
しかしながら、VAEアーキテクチャは現在、コーディングの実用性と圧縮率の組み合わせによって制限されている。
つまり、フローの正規化のような最先端の手法を行うだけでなく、符号化に必要とされる初期ビットは、単一および並列画像圧縮を困難にしている。
そこで本研究では分割階層型変分圧縮(shvc)を提案する。
SHVCは2つのノベルティを紹介する。
まず,画素単位の自己回帰と完全分解確率モデルの一般化を可能にする,効率的な自己回帰型サブピクセル畳み込みを提案する。
次に、私たちはコーディングフレームワークである自己回帰初期ビットを定義します。これは、柔軟に並列コーディングをサポートし、初めて -- ビットバックコーディングに共通する多くの実用性を回避します。
我々の実験では、SHVCは、全解像度ロスレス画像圧縮タスクにまたがって最先端の圧縮性能を達成でき、競合するVAEのアプローチよりも100倍少ないモデルパラメータを持つことを示した。
関連論文リスト
- Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption [57.056311855630916]
本稿では,制御可能な生成画像圧縮フレームワークである制御-GICを提案する。
高忠実度および一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
我々は、歴史的符号化された多粒度表現に遡ることができる条件条件付き条件付けを開発する。
論文 参考訳(メタデータ) (2024-06-02T14:22:09Z) - Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文 参考訳(メタデータ) (2023-07-17T06:14:19Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Multiscale Augmented Normalizing Flows for Image Compression [17.441496966834933]
本稿では,非可逆潜在変数モデルである拡張正規化フローに対して,階層的潜在空間を適応させる新しい概念を提案する。
私たちの最高のパフォーマンスモデルは、比較対象のシングルスケールモデルよりも7%以上、平均的なコスト削減を実現しました。
論文 参考訳(メタデータ) (2023-05-09T13:42:43Z) - Device Interoperability for Learned Image Compression with Weights and
Activations Quantization [1.373801677008598]
本稿では,最先端の画像圧縮ネットワークのデバイス相互運用性問題を解決する手法を提案する。
本稿では,クロスプラットフォームの符号化と復号化を保証し,高速に実装できる簡易な手法を提案する。
論文 参考訳(メタデータ) (2022-12-02T17:45:29Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - ELIC: Efficient Learned Image Compression with Unevenly Grouped
Space-Channel Contextual Adaptive Coding [9.908820641439368]
本研究では,最先端の速度と圧縮能力を実現するための効率的なモデルであるELICを提案する。
優れたパフォーマンスで、提案モデルは極めて高速なプレビューデコーディングとプログレッシブデコーディングもサポートする。
論文 参考訳(メタデータ) (2022-03-21T11:19:50Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Lossless Compression with Latent Variable Models [4.289574109162585]
我々は「非対称数値系を持つビットバック」(bb-ans)と呼ぶ潜在変数モデルを用いる。
この方法は、エンコードおよびデコードステップをインターリーブし、データのバッチ圧縮時に最適なレートを達成する。
我々は,深層生成モデルを用いた圧縮の高速プロトタイピングのために開発したモジュール型ソフトウェアフレームワークである'craystack'について述べる。
論文 参考訳(メタデータ) (2021-04-21T14:03:05Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。