論文の概要: Universal Efficient Variable-rate Neural Image Compression
- arxiv url: http://arxiv.org/abs/2111.11305v1
- Date: Thu, 18 Nov 2021 03:08:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-23 17:15:53.174117
- Title: Universal Efficient Variable-rate Neural Image Compression
- Title(参考訳): 全能率可変レートニューラルイメージ圧縮
- Authors: Shanzhi Yin, Chao Li, Youneng Bao, Yongshang Liang
- Abstract要約: 本稿では,Energy-based Channel Gating(ECG)とBit-rate Modulator(BM)という2つのユニバーサルモジュールを提案する。
ECGは動的プルーニングを用いて、畳み込み層のFLOPを50%以上削減し、BMペアは遅延表現を変調し、チャネルワイズでビットレートを制御する。
- 参考スコア(独自算出の注目度): 4.759359336476555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, Learning-based image compression has reached comparable performance
with traditional image codecs(such as JPEG, BPG, WebP). However, computational
complexity and rate flexibility are still two major challenges for its
practical deployment. To tackle these problems, this paper proposes two
universal modules named Energy-based Channel Gating(ECG) and Bit-rate
Modulator(BM), which can be directly embedded into existing end-to-end image
compression models. ECG uses dynamic pruning to reduce FLOPs for more than 50\%
in convolution layers, and a BM pair can modulate the latent representation to
control the bit-rate in a channel-wise manner. By implementing these two
modules, existing learning-based image codecs can obtain ability to output
arbitrary bit-rate with a single model and reduced computation.
- Abstract(参考訳): 近年、学習ベースの画像圧縮は従来の画像コーデック(JPEG、BPG、WebPなど)と同等のパフォーマンスに達している。
しかし、計算複雑性とレートの柔軟性は、実用的展開において依然として2つの大きな課題である。
本稿では,既存の画像圧縮モデルに直接組み込むことができるEnergy-based Channel Gating(ECG)とBit-rate Modulator(BM)という2つのユニバーサルモジュールを提案する。
ECGは動的プルーニングを用いて、畳み込み層のFLOPを50%以上削減し、BMペアは遅延表現を変調し、チャネル的にビットレートを制御する。
これら2つのモジュールを実装することで、既存の学習ベースのイメージコーデックは、1つのモデルで任意のビットレートを出力でき、計算量を削減できる。
関連論文リスト
- MoDeGPT: Modular Decomposition for Large Language Model Compression [59.361006801465344]
本稿では,新しい構造化圧縮フレームワークである textbfModular bfDecomposition (MoDeGPT) を紹介する。
MoDeGPTはTransformerブロックを行列対からなるモジュールに分割し、隠れた次元を減らす。
本実験では, 後方伝播を伴わないMoDeGPTが, 従来の圧縮手法と一致するか, あるいは超えていることを示す。
論文 参考訳(メタデータ) (2024-08-19T01:30:14Z) - Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption [57.056311855630916]
本稿では,制御可能な生成画像圧縮フレームワークである制御-GICを提案する。
高忠実度および一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
我々は、歴史的符号化された多粒度表現に遡ることができる条件条件付き条件付けを開発する。
論文 参考訳(メタデータ) (2024-06-02T14:22:09Z) - MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large Multimodal Model [78.4051835615796]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - Exploring Effective Mask Sampling Modeling for Neural Image Compression [171.35596121939238]
既存のニューラルイメージ圧縮手法の多くは、空間的冗長性を排除するために、ハイパープライアモデルやコンテキストモデルからのサイド情報に依存している。
近年の自然言語処理と高次視覚のための自己教師付き学習手法におけるマスクサンプリングモデルに着想を得て,ニューラル画像圧縮のための新しい事前学習戦略を提案する。
提案手法は,最先端画像圧縮法と比較して計算複雑性の低い競合性能を実現する。
論文 参考訳(メタデータ) (2023-06-09T06:50:20Z) - Device Interoperability for Learned Image Compression with Weights and
Activations Quantization [1.373801677008598]
本稿では,最先端の画像圧縮ネットワークのデバイス相互運用性問題を解決する手法を提案する。
本稿では,クロスプラットフォームの符号化と復号化を保証し,高速に実装できる簡易な手法を提案する。
論文 参考訳(メタデータ) (2022-12-02T17:45:29Z) - Universal Learned Image Compression With Low Computational Cost [10.174946552630937]
我々は,デコーダのSAPM-EやデコーダのSAPM-Dを含むシフト付加並列モジュール(SAPM)を提案し,エネルギー消費を大幅に削減する。
我々は、潜在表現の確率分布を徹底的に解析し、より正確なエントロピー推定にLaplace Mixture Likelihoodsを使うことを提案する。
論文 参考訳(メタデータ) (2022-06-23T10:23:22Z) - Split Hierarchical Variational Compression [21.474095984110622]
可変オートエンコーダ(VAE)は、画像データセットの圧縮を行う上で大きな成功を収めている。
SHVCは、ピクセルごとの自己回帰と完全に分解された確率モデルとの一般化を可能にする、効率的な自己回帰的サブピクセル畳み込みを導入している。
論文 参考訳(メタデータ) (2022-04-05T09:13:38Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Learned Image Compression with Gaussian-Laplacian-Logistic Mixture Model
and Concatenated Residual Modules [22.818632387206257]
学習画像圧縮の2つの重要な要素は、潜在表現のエントロピーモデルと符号化/復号化ネットワークアーキテクチャである。
本稿では,よりフレキシブルなガウス・ラプラシア・ロジスティック混合モデル(GLLMM)を提案する。
符号化/復号化ネットワーク設計部では、複数の残差ブロックを追加のショートカット接続で直列接続する残差ブロック(CRB)を提案する。
論文 参考訳(メタデータ) (2021-07-14T02:54:22Z) - Learned Multi-Resolution Variable-Rate Image Compression with
Octave-based Residual Blocks [15.308823742699039]
一般化オクターブ畳み込み(GoConv)と一般化オクターブ畳み込み(GoTConv)を用いた新しい可変レート画像圧縮フレームワークを提案する。
単一モデルが異なるビットレートで動作し、複数レートの画像特徴を学習できるようにするため、新しい目的関数が導入される。
実験結果から,H.265/HEVCベースのBPGや最先端の学習に基づく可変レート法などの標準コーデックよりも高い性能を示した。
論文 参考訳(メタデータ) (2020-12-31T06:26:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。