論文の概要: Exploring the Rate-Distortion-Complexity Optimization in Neural Image
Compression
- arxiv url: http://arxiv.org/abs/2305.07678v1
- Date: Fri, 12 May 2023 03:56:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 20:14:30.347392
- Title: Exploring the Rate-Distortion-Complexity Optimization in Neural Image
Compression
- Title(参考訳): ニューラル画像圧縮における速度・歪み・複雑度最適化の探索
- Authors: Yixin Gao, Runsen Feng, Zongyu Guo, Zhibo Chen
- Abstract要約: ニューラル画像圧縮におけるRDC最適化について検討する。
復号化複雑性を最適化目標の要素として定量化することで、RDCトレードオフを正確に制御できるようになりました。
産業的要求に応じて空間的依存関係を適応的に利用するために、可変複雑性ニューラルネットワークが設計されている。
- 参考スコア(独自算出の注目度): 26.1947289647201
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite a short history, neural image codecs have been shown to surpass
classical image codecs in terms of rate-distortion performance. However, most
of them suffer from significantly longer decoding times, which hinders the
practical applications of neural image codecs. This issue is especially
pronounced when employing an effective yet time-consuming autoregressive
context model since it would increase entropy decoding time by orders of
magnitude. In this paper, unlike most previous works that pursue optimal RD
performance while temporally overlooking the coding complexity, we make a
systematical investigation on the rate-distortion-complexity (RDC) optimization
in neural image compression. By quantifying the decoding complexity as a factor
in the optimization goal, we are now able to precisely control the RDC
trade-off and then demonstrate how the rate-distortion performance of neural
image codecs could adapt to various complexity demands. Going beyond the
investigation of RDC optimization, a variable-complexity neural codec is
designed to leverage the spatial dependencies adaptively according to
industrial demands, which supports fine-grained complexity adjustment by
balancing the RDC tradeoff. By implementing this scheme in a powerful base
model, we demonstrate the feasibility and flexibility of RDC optimization for
neural image codecs.
- Abstract(参考訳): 短い歴史にもかかわらず、ニューラル画像コーデックは速度歪み性能の点で古典的画像コーデックを超えることが示されている。
しかし、その多くは非常に長い復号時間に悩まされており、これはニューラルイメージコーデックの実践的応用を妨げる。
この問題は、エントロピー復号時間を桁違いに増やすため、効果的だが時間を要する自己回帰的コンテキストモデルを採用する場合に特に顕著である。
本稿では,符号化の複雑さを時間的に見落としながら最適なrd性能を追求する先行研究と異なり,ニューラルネットワーク圧縮におけるrdc最適化を体系的に検討する。
最適化目標の要因としてデコード複雑さを定量化することにより、rdcトレードオフを正確に制御し、ニューラルネットワークコーデックのレートゆがみ性能が様々な複雑性要求にどのように適応するかを実証することができる。
RDC最適化の調査を超えて、可変複雑ニューラルコーデックは産業的要求に応じて空間的依存関係を適応的に活用するように設計されており、RCCトレードオフのバランスをとることで、微細な複雑性調整をサポートする。
このスキームを強力なベースモデルに実装することにより、ニューラルイメージコーデックに対するRCC最適化の実現可能性と柔軟性を示す。
関連論文リスト
- Neural Image Compression with Quantization Rectifier [7.097091519502871]
我々は,画像特徴相関を利用した画像圧縮のための新しい量子化法(QR)を開発し,量子化の影響を緩和する。
提案手法は,量子化された特徴量から未知の特徴量を予測するニューラルネットワークアーキテクチャを設計する。
評価では、QRを最先端のニューラルイメージコーデックに統合し、広く使用されているKodakベンチマークの強化モデルとベースラインを比較する。
論文 参考訳(メタデータ) (2024-03-25T22:26:09Z) - An Efficient Implicit Neural Representation Image Codec Based on Mixed Autoregressive Model for Low-Complexity Decoding [43.43996899487615]
画像圧縮のためのインプシットニューラル表現(INR)は、最先端のオートエンコーダモデルと比較して2つの重要な利点を提供する新興技術である。
我々は、現在のINRの復号時間を大幅に削減するために、新しいMixed AutoRegressive Model (MARM)を導入する。
MARMには提案したAutoRegressive Upsampler(ARU)ブロックが含まれている。
論文 参考訳(メタデータ) (2024-01-23T09:37:58Z) - ConvNeXt-ChARM: ConvNeXt-based Transform for Efficient Neural Image
Compression [18.05997169440533]
ConvNeXt-ChARMは,効率的なConvNeXtベースのトランスフォーメーションコーディングフレームワークである。
ConvNeXt-ChARMは、VVC参照エンコーダ(VTM-18.0)と最先端の学習画像圧縮手法であるSwinT-ChARMに対して、平均5.24%と1.22%と、一貫したBDレート(PSNR)の低下をもたらすことを示した。
論文 参考訳(メタデータ) (2023-07-12T11:45:54Z) - Joint Hierarchical Priors and Adaptive Spatial Resolution for Efficient
Neural Image Compression [11.25130799452367]
ニューラル画像圧縮(NIC)のための絶対画像圧縮変換器(ICT)を提案する。
ICTは、潜在表現からグローバルコンテキストとローカルコンテキストの両方をキャプチャし、量子化された潜在表現の分布をパラメータ化する。
我々のフレームワークは、多目的ビデオ符号化(VVC)参照符号化(VTM-18.0)とニューラルスウィンT-ChARMに対する符号化効率とデコーダ複雑性のトレードオフを大幅に改善する。
論文 参考訳(メタデータ) (2023-07-05T13:17:14Z) - Convolutional Neural Generative Coding: Scaling Predictive Coding to
Natural Images [79.07468367923619]
畳み込み型神経生成符号化(Conv-NGC)を開発した。
我々は、潜伏状態マップを段階的に洗練する柔軟な神経生物学的動機付けアルゴリズムを実装した。
本研究は,脳にインスパイアされたニューラル・システムによる再建と画像復調の課題に対する効果について検討する。
論文 参考訳(メタデータ) (2022-11-22T06:42:41Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Rate Distortion Characteristic Modeling for Neural Image Compression [59.25700168404325]
エンドツーエンドの最適化機能は、ニューラルイメージ圧縮(NIC)の優れた損失圧縮性能を提供する。
異なるモデルは、R-D空間の異なる点に到達するために訓練される必要がある。
深層ネットワークと統計モデルを用いてNICのR-D挙動を記述するために,本質的な数学的関数の定式化に努めている。
論文 参考訳(メタデータ) (2021-06-24T12:23:05Z) - Substitutional Neural Image Compression [48.20906717052056]
置換型ニューラルイメージ圧縮(snic)は、あらゆるニューラルイメージ圧縮モデルを強化する一般的なアプローチである。
フレキシブルな歪みメトリックに向けて圧縮性能を高め、単一のモデルインスタンスを使用したビットレート制御を可能にする。
論文 参考訳(メタデータ) (2021-05-16T20:53:31Z) - Slimmable Compressive Autoencoders for Practical Neural Image
Compression [20.715312224456138]
実画像圧縮のためのスリム圧縮オートエンコーダ(SlimCAEs)を提案する。
SlimCAEは、優れたレート歪み性能、可変率、メモリの動的調整、計算コスト、レイテンシを提供する柔軟性の高いモデルです。
論文 参考訳(メタデータ) (2021-03-29T16:12:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。