論文の概要: ANFIC: Image Compression Using Augmented Normalizing Flows
- arxiv url: http://arxiv.org/abs/2107.08470v1
- Date: Sun, 18 Jul 2021 15:02:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-21 02:38:34.675412
- Title: ANFIC: Image Compression Using Augmented Normalizing Flows
- Title(参考訳): ANFIC:Augmented Normalizing Flowsを用いた画像圧縮
- Authors: Yung-Han Ho, Chih-Chun Chan, Wen-Hsiao Peng, Hsueh-Ming Hang, Marek
Domanski
- Abstract要約: 本稿では、ANF(Augmented Normalizing Flows)に基づく、エンドツーエンドの学習画像圧縮システムANFICを紹介する。
PSNR-RGBの観点では、ANFICは最先端の学習画像圧縮と同等かそれ以上に機能する。
特に、ANFICは1つのモデルで可変レート圧縮の条件付き畳み込みで拡張した場合、最先端の性能を達成する。
- 参考スコア(独自算出の注目度): 16.161901495436233
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces an end-to-end learned image compression system, termed
ANFIC, based on Augmented Normalizing Flows (ANF). ANF is a new type of flow
model, which stacks multiple variational autoencoders (VAE) for greater model
expressiveness. The VAE-based image compression has gone mainstream, showing
promising compression performance. Our work presents the first attempt to
leverage VAE-based compression in a flow-based framework. ANFIC advances
further compression efficiency by stacking and extending hierarchically
multiple VAE's. The invertibility of ANF, together with our training
strategies, enables ANFIC to support a wide range of quality levels without
changing the encoding and decoding networks. Extensive experimental results
show that in terms of PSNR-RGB, ANFIC performs comparably to or better than the
state-of-the-art learned image compression. Moreover, it performs close to VVC
intra coding, from low-rate compression up to nearly-lossless compression. In
particular, ANFIC achieves the state-of-the-art performance, when extended with
conditional convolution for variable rate compression with a single model.
- Abstract(参考訳): 本稿では、ANF(Augmented Normalizing Flows)に基づく、エンドツーエンドの学習画像圧縮システムANFICを紹介する。
ANFは複数の変分オートエンコーダ(VAE)を積み重ねてモデル表現性を高める新しいタイプのフローモデルである。
VAEベースの画像圧縮は主流となり、有望な圧縮性能を示している。
我々の研究は、フローベースのフレームワークでVAEベースの圧縮を活用する最初の試みである。
ANFICは階層的に複数のVAEを積み重ねて拡張することで、さらなる圧縮効率を向上させる。
トレーニング戦略とともにANFの可逆性により、ANFICはエンコーディングやデコードネットワークを変更することなく、幅広い品質レベルをサポートすることができる。
広汎な実験結果から,PSNR-RGBでは,ANFICは最先端の学習画像圧縮と同等以上の性能を示した。
さらに、低レート圧縮からほぼロスレス圧縮まで、vvcイントラコーディングに近い性能を発揮する。
特に、ANFICは1つのモデルで可変レート圧縮の条件付き畳み込みで拡張した場合、最先端の性能を達成する。
関連論文リスト
- UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation [59.3877309501938]
Inlicit Neural Representation (INR) ネットワークは、その柔軟な圧縮比のため、顕著な汎用性を示している。
周波数領域情報を含むコードブックをINRネットワークへの事前入力として導入する。
これにより、INRの表現力が向上し、異なる画像ブロックに対して特異な条件付けが提供される。
論文 参考訳(メタデータ) (2024-05-27T05:52:13Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - Streaming Lossless Volumetric Compression of Medical Images Using Gated
Recurrent Convolutional Neural Network [0.0]
本稿では,ハードウェアフレンドリーなストリーミングロスレスボリューム圧縮フレームワークを提案する。
本稿では,多種多様な畳み込み構造と融合ゲート機構を組み合わせたゲートリカレント畳み込みニューラルネットワークを提案する。
提案手法は,堅牢な一般化能力と競争圧縮速度を示す。
論文 参考訳(メタデータ) (2023-11-27T07:19:09Z) - Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文 参考訳(メタデータ) (2023-07-17T06:14:19Z) - Learned Lossless Compression for JPEG via Frequency-Domain Prediction [50.20577108662153]
JPEG画像のロスレス圧縮を学習するための新しいフレームワークを提案する。
周波数領域での学習を可能にするために、DCT係数は暗黙の局所冗長性を利用するためにグループに分割される。
グループ化されたDCT係数のエントロピーモデリングを実現するために、重み付きブロックに基づいてオートエンコーダのようなアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-03-05T13:15:28Z) - High-Fidelity Variable-Rate Image Compression via Invertible Activation
Transformation [24.379052026260034]
Invertible Activation Transformation (IAT) モジュールを提案する。
IATとQLevelは、画像圧縮モデルに、画像の忠実さを良く保ちながら、細かな可変レート制御能力を与える。
提案手法は,特に複数再符号化後に,最先端の可変レート画像圧縮法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2022-09-12T07:14:07Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - A Unified End-to-End Framework for Efficient Deep Image Compression [35.156677716140635]
本稿では,3つの新しい技術に基づくEDIC(Efficient Deep Image Compression)という統合フレームワークを提案する。
具体的には、学習に基づく画像圧縮のためのオートエンコーダスタイルのネットワークを設計する。
EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
論文 参考訳(メタデータ) (2020-02-09T14:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。