論文の概要: Computationally-Efficient Neural Image Compression with Shallow Decoders
- arxiv url: http://arxiv.org/abs/2304.06244v2
- Date: Fri, 10 Nov 2023 17:14:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-13 18:15:07.340771
- Title: Computationally-Efficient Neural Image Compression with Shallow Decoders
- Title(参考訳): 浅いデコーダを用いた計算効率の高いニューラルイメージ圧縮
- Authors: Yibo Yang and Stephan Mandt
- Abstract要約: 本稿では,JPEGに類似した浅い,あるいは線形な復号変換を用いることで,復号化複雑性のギャップを解消する。
我々は、より強力なエンコーダネットワークと反復符号化を採用することにより、符号化と復号の間のしばしば非対称な予算を利用する。
- 参考スコア(独自算出の注目度): 43.115831685920114
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural image compression methods have seen increasingly strong performance in
recent years. However, they suffer orders of magnitude higher computational
complexity compared to traditional codecs, which hinders their real-world
deployment. This paper takes a step forward towards closing this gap in
decoding complexity by using a shallow or even linear decoding transform
resembling that of JPEG. To compensate for the resulting drop in compression
performance, we exploit the often asymmetrical computation budget between
encoding and decoding, by adopting more powerful encoder networks and iterative
encoding. We theoretically formalize the intuition behind, and our experimental
results establish a new frontier in the trade-off between rate-distortion and
decoding complexity for neural image compression. Specifically, we achieve
rate-distortion performance competitive with the established mean-scale
hyperprior architecture of Minnen et al. (2018) at less than 50K decoding
FLOPs/pixel, reducing the baseline's overall decoding complexity by 80%, or
over 90% for the synthesis transform alone. Our code can be found at
https://github.com/mandt-lab/shallow-ntc.
- Abstract(参考訳): 近年,ニューラル画像圧縮法の性能が向上している。
しかし、従来のコーデックに比べて計算の複雑さが桁違いに高いため、実際のデプロイメントを妨げている。
本稿では,JPEGに類似した浅い,あるいは線形な復号変換を用いて,復号化複雑性のこのギャップを解消する。
圧縮性能の低下を補うために、より強力なエンコーダネットワークと反復符号化を採用することにより、符号化と復号の間の非対称な計算予算を利用する。
我々は理論的にその背景にある直感を定式化し、実験結果からニューラル画像圧縮における速度歪みと復号化複雑性のトレードオフにおける新たなフロンティアを確立した。
具体的には,Mennen et al. (2018) の確立した平均スケールハイパープライアアーキテクチャと50K未満のFLOP/ピクセルで競合し,ベースライン全体のデコーディング複雑性を80%,合成変換だけで90%以上削減する。
私たちのコードはhttps://github.com/mandt-lab/shallow-ntcにあります。
関連論文リスト
- Accelerating Learned Video Compression via Low-Resolution Representation Learning [18.399027308582596]
低解像度表現学習に焦点を当てた学習ビデオ圧縮のための効率最適化フレームワークを提案する。
提案手法は,H.266参照ソフトウェアVTMの低遅延P構成と同等の性能を実現する。
論文 参考訳(メタデータ) (2024-07-23T12:02:57Z) - Low-complexity Deep Video Compression with A Distributed Coding
Architecture [4.5885672744218]
一般的な予測符号化に基づくビデオ圧縮手法は、時間的冗長性を低減するために重エンコーダに依存している。
従来の分散コーディング手法は、予測的コーディングとはかなりのパフォーマンスギャップに悩まされている。
本稿では,レート歪み特性を改善するために,最初のエンドツーエンドの分散ビデオ圧縮フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-21T05:34:04Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - How to Exploit the Transferability of Learned Image Compression to
Conventional Codecs [25.622863999901874]
本稿では,学習した画像の符号化をサロゲートとして利用して,画像の符号化を最適化する方法を示す。
提案手法は,MS-SSIM歪みをデコードオーバーヘッドを伴わずに20%以上の速度改善で補正するために,従来の画像を再構成することができる。
論文 参考訳(メタデータ) (2020-12-03T12:34:51Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z) - A Unified End-to-End Framework for Efficient Deep Image Compression [35.156677716140635]
本稿では,3つの新しい技術に基づくEDIC(Efficient Deep Image Compression)という統合フレームワークを提案する。
具体的には、学習に基づく画像圧縮のためのオートエンコーダスタイルのネットワークを設計する。
EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
論文 参考訳(メタデータ) (2020-02-09T14:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。