論文の概要: Latent-Shift: Gradient of Entropy Helps Neural Codecs
- arxiv url: http://arxiv.org/abs/2308.00725v1
- Date: Tue, 1 Aug 2023 15:12:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-03 14:58:39.902089
- Title: Latent-Shift: Gradient of Entropy Helps Neural Codecs
- Title(参考訳): 潜在シフト:エントロピーの勾配は神経コーデックに役立つ
- Authors: Muhammet Balcilar, Bharath Bhushan Damodaran, Karam Naser, Franck
Galpin and Pierre Hellier
- Abstract要約: エントロピーの勾配は再建誤差の勾配と相関していることを示す。
実験により, この勾配は様々な圧縮法で利用でき, 1-2%の節約率が得られることを示した。
- 参考スコア(独自算出の注目度): 4.449835214520727
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end image/video codecs are getting competitive compared to traditional
compression techniques that have been developed through decades of manual
engineering efforts. These trainable codecs have many advantages over
traditional techniques such as easy adaptation on perceptual distortion metrics
and high performance on specific domains thanks to their learning ability.
However, state of the art neural codecs does not take advantage of the
existence of gradient of entropy in decoding device. In this paper, we
theoretically show that gradient of entropy (available at decoder side) is
correlated with the gradient of the reconstruction error (which is not
available at decoder side). We then demonstrate experimentally that this
gradient can be used on various compression methods, leading to a $1-2\%$ rate
savings for the same quality. Our method is orthogonal to other improvements
and brings independent rate savings.
- Abstract(参考訳): エンドツーエンドのイメージ/ビデオコーデックは、何十年にもわたって手作業で開発された従来の圧縮技術と比較して、競争力を増している。
これらのトレーニング可能なコーデックは、知覚歪みメトリクスへの適応や学習能力のおかげで特定のドメインでのハイパフォーマンスなど、従来のテクニックよりも多くの利点がある。
しかし、デコード装置におけるエントロピーの勾配の存在は、最先端のニューラルコーデックの状態を生かしていない。
本稿では,エントロピーの勾配(デコーダ側で使用可能)が再構成誤差の勾配(デコーダ側では使用できない)と相関していることを理論的に示す。
そして, この勾配を様々な圧縮法で使用できることを実験的に示し, 同じ品質で1-2\%のレート節約が可能となることを示した。
この手法は他の改善と直交し、独立した利率の節約をもたらす。
関連論文リスト
- Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Accelerating Learnt Video Codecs with Gradient Decay and Layer-wise
Distillation [17.980800481385195]
本稿では, 勾配減衰と適応層ワイド蒸留に基づく新しいモデル非依存プルーニング手法を提案する。
その結果,BD-PSNRでは最大65%のMACと2倍のスピードアップ,0.3dB未満のBD-PSNRが得られた。
論文 参考訳(メタデータ) (2023-12-05T09:26:09Z) - DiffRate : Differentiable Compression Rate for Efficient Vision
Transformers [98.33906104846386]
Token圧縮は、プルーニング(ドロップ)やトークンのマージによって、大規模な視覚変換器(ViTなど)を高速化することを目的としている。
DiffRate(ディフレート)は、先行技術にはないいくつかの魅力的な特性を持つ新しいトークン圧縮手法である。
論文 参考訳(メタデータ) (2023-05-29T10:15:19Z) - Computationally-Efficient Neural Image Compression with Shallow Decoders [43.115831685920114]
本稿では,JPEGに類似した浅い,あるいは線形な復号変換を用いることで,復号化複雑性のギャップを解消する。
我々は、より強力なエンコーダネットワークと反復符号化を採用することにより、符号化と復号の間のしばしば非対称な予算を利用する。
論文 参考訳(メタデータ) (2023-04-13T03:38:56Z) - Video Coding Using Learned Latent GAN Compression [1.6058099298620423]
ビデオの表現と圧縮にはStyleGANなどのGANの生成能力を活用する。
各フレームはStyleGANの潜在空間で反転され、そこから最適な圧縮が学習される。
論文 参考訳(メタデータ) (2022-07-09T19:07:43Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Learned transform compression with optimized entropy encoding [72.20409648915398]
学習した変換圧縮の問題を検討し、離散符号上の変換と確率分布の両方を学習する。
勾配のバックプロパゲーションを可能にするために量子化演算をソフト緩和し, 潜在符号のベクトル量子化を(スカラーではなく)採用した。
論文 参考訳(メタデータ) (2021-04-07T17:58:01Z) - How to Exploit the Transferability of Learned Image Compression to
Conventional Codecs [25.622863999901874]
本稿では,学習した画像の符号化をサロゲートとして利用して,画像の符号化を最適化する方法を示す。
提案手法は,MS-SSIM歪みをデコードオーバーヘッドを伴わずに20%以上の速度改善で補正するために,従来の画像を再構成することができる。
論文 参考訳(メタデータ) (2020-12-03T12:34:51Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。