論文の概要: A Unified End-to-End Framework for Efficient Deep Image Compression
- arxiv url: http://arxiv.org/abs/2002.03370v3
- Date: Sat, 23 May 2020 22:41:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 14:53:06.119333
- Title: A Unified End-to-End Framework for Efficient Deep Image Compression
- Title(参考訳): 効率的な深部画像圧縮のための統一エンドツーエンドフレームワーク
- Authors: Jiaheng Liu, Guo Lu, Zhihao Hu, Dong Xu
- Abstract要約: 本稿では,3つの新しい技術に基づくEDIC(Efficient Deep Image Compression)という統合フレームワークを提案する。
具体的には、学習に基づく画像圧縮のためのオートエンコーダスタイルのネットワークを設計する。
EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
- 参考スコア(独自算出の注目度): 35.156677716140635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image compression is a widely used technique to reduce the spatial redundancy
in images. Recently, learning based image compression has achieved significant
progress by using the powerful representation ability from neural networks.
However, the current state-of-the-art learning based image compression methods
suffer from the huge computational cost, which limits their capacity for
practical applications. In this paper, we propose a unified framework called
Efficient Deep Image Compression (EDIC) based on three new technologies,
including a channel attention module, a Gaussian mixture model and a
decoder-side enhancement module. Specifically, we design an auto-encoder style
network for learning based image compression. To improve the coding efficiency,
we exploit the channel relationship between latent representations by using the
channel attention module. Besides, the Gaussian mixture model is introduced for
the entropy model and improves the accuracy for bitrate estimation.
Furthermore, we introduce the decoder-side enhancement module to further
improve image compression performance. Our EDIC method can also be readily
incorporated with the Deep Video Compression (DVC) framework to further improve
the video compression performance. Simultaneously, our EDIC method boosts the
coding performance significantly while bringing slightly increased
computational cost. More importantly, experimental results demonstrate that the
proposed approach outperforms the current state-of-the-art image compression
methods and is up to more than 150 times faster in terms of decoding speed when
compared with Minnen's method. The proposed framework also successfully
improves the performance of the recent deep video compression system DVC. Our
code will be released at https://github.com/liujiaheng/compression.
- Abstract(参考訳): 画像圧縮は画像の空間的冗長性を低減するために広く用いられている手法である。
近年,ニューラルネットワークの強力な表現能力を用いて,学習に基づく画像圧縮が大きな進歩を遂げている。
しかし、現在の最先端の学習ベースの画像圧縮手法は、実用的応用能力を制限する膨大な計算コストに苦しむ。
本稿では,チャネルアテンションモジュール,ガウス混合モデル,デコーダ側エンハンスメントモジュールといった3つの新しい技術に基づく,効率的な深部画像圧縮(edic)と呼ばれる統一フレームワークを提案する。
具体的には,画像圧縮を学習するための自動エンコーダ方式ネットワークを設計する。
符号化効率を向上させるために,チャネルアテンションモジュールを用いて潜在表現間のチャネル関係を利用する。
さらに、エントロピーモデルに対してガウス混合モデルを導入し、ビットレート推定の精度を向上させる。
さらに,画像圧縮性能をさらに向上させるデコーダ側強調モジュールを導入する。
EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
同時に, edic法は, 計算コストをわずかに高めながら, 符号化性能を著しく向上させる。
さらに,提案手法が現在の最先端画像圧縮法より優れており,Minnen法と比較して復号速度の150倍以上高速であることを示す実験結果が得られた。
提案フレームワークは,最新のディープビデオ圧縮システムDVCの性能向上にも成功している。
私たちのコードはhttps://github.com/liujiaheng/compressionでリリースします。
関連論文リスト
- Accelerating Learned Video Compression via Low-Resolution Representation Learning [18.399027308582596]
低解像度表現学習に焦点を当てた学習ビデオ圧縮のための効率最適化フレームワークを提案する。
提案手法は,H.266参照ソフトウェアVTMの低遅延P構成と同等の性能を実現する。
論文 参考訳(メタデータ) (2024-07-23T12:02:57Z) - MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large Multimodal Model [78.4051835615796]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - Low-complexity Deep Video Compression with A Distributed Coding
Architecture [4.5885672744218]
一般的な予測符号化に基づくビデオ圧縮手法は、時間的冗長性を低減するために重エンコーダに依存している。
従来の分散コーディング手法は、予測的コーディングとはかなりのパフォーマンスギャップに悩まされている。
本稿では,レート歪み特性を改善するために,最初のエンドツーエンドの分散ビデオ圧縮フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-21T05:34:04Z) - Device Interoperability for Learned Image Compression with Weights and
Activations Quantization [1.373801677008598]
本稿では,最先端の画像圧縮ネットワークのデバイス相互運用性問題を解決する手法を提案する。
本稿では,クロスプラットフォームの符号化と復号化を保証し,高速に実装できる簡易な手法を提案する。
論文 参考訳(メタデータ) (2022-12-02T17:45:29Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - ELIC: Efficient Learned Image Compression with Unevenly Grouped
Space-Channel Contextual Adaptive Coding [9.908820641439368]
本研究では,最先端の速度と圧縮能力を実現するための効率的なモデルであるELICを提案する。
優れたパフォーマンスで、提案モデルは極めて高速なプレビューデコーディングとプログレッシブデコーディングもサポートする。
論文 参考訳(メタデータ) (2022-03-21T11:19:50Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Enhanced Invertible Encoding for Learned Image Compression [40.21904131503064]
本稿では,改良されたインバーチブルを提案する。
非可逆ニューラルネットワーク(INN)によるネットワークは、情報損失問題を大幅に軽減し、圧縮性を向上する。
Kodak, CLIC, Tecnick のデータセットによる実験結果から,本手法は既存の学習画像圧縮法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-08-08T17:32:10Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。