論文の概要: Universal Learned Image Compression With Low Computational Cost
- arxiv url: http://arxiv.org/abs/2206.11599v1
- Date: Thu, 23 Jun 2022 10:23:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-24 20:23:06.484444
- Title: Universal Learned Image Compression With Low Computational Cost
- Title(参考訳): 計算コスト低減によるユニバーサル学習画像圧縮
- Authors: Bowen Li, Yao Xin, Youneng Bao, Fanyang Meng, Yongsheng Liang, Wen Tan
- Abstract要約: 我々は,デコーダのSAPM-EやデコーダのSAPM-Dを含むシフト付加並列モジュール(SAPM)を提案し,エネルギー消費を大幅に削減する。
我々は、潜在表現の確率分布を徹底的に解析し、より正確なエントロピー推定にLaplace Mixture Likelihoodsを使うことを提案する。
- 参考スコア(独自算出の注目度): 10.174946552630937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, learned image compression methods have developed rapidly and
exhibited excellent rate-distortion performance when compared to traditional
standards, such as JPEG, JPEG2000 and BPG. However, the learning-based methods
suffer from high computational costs, which is not beneficial for deployment on
devices with limited resources. To this end, we propose shift-addition parallel
modules (SAPMs), including SAPM-E for the encoder and SAPM-D for the decoder,
to largely reduce the energy consumption. To be specific, they can be taken as
plug-and-play components to upgrade existing CNN-based architectures, where the
shift branch is used to extract large-grained features as compared to
small-grained features learned by the addition branch. Furthermore, we
thoroughly analyze the probability distribution of latent representations and
propose to use Laplace Mixture Likelihoods for more accurate entropy
estimation. Experimental results demonstrate that the proposed methods can
achieve comparable or even better performance on both PSNR and MS-SSIM metrics
to that of the convolutional counterpart with an about 2x energy reduction.
- Abstract(参考訳): 近年, JPEG, JPEG2000, BPGなどの従来の規格と比較して, 画像圧縮法が急速に発展し, 高い速度歪み性能を示した。
しかし、学習ベースの手法は高い計算コストに苦しむため、リソースの少ないデバイスへのデプロイには役に立たない。
そこで本研究では,エンコーダのSAPM-E,デコーダのSAPM-Dを含むシフト付加並列モジュール(SAPM)を提案する。
具体的には、既存のCNNベースのアーキテクチャをアップグレードするためのプラグイン・アンド・プレイコンポーネントとして利用することができる。
さらに,潜伏表現の確率分布を徹底的に解析し,より正確なエントロピー推定のためにラプラス混合推定法を提案する。
実験の結果,psnr と ms-ssim の指標を約 2 倍のエネルギー削減で畳み込み法と比較し,同等あるいはそれ以上の性能が得られることがわかった。
関連論文リスト
- PassionSR: Post-Training Quantization with Adaptive Scale in One-Step Diffusion based Image Super-Resolution [87.89013794655207]
拡散に基づく画像超解像(SR)モデルでは、複数のデノナイジングステップのコストで優れた性能を示す。
本稿では,一段階拡散(OSD)画像SR,PassionSRにおける適応スケールの学習後量子化手法を提案する。
我々のPassionSRは、画像SRの最近の先進的な低ビット量子化法に対して大きな利点がある。
論文 参考訳(メタデータ) (2024-11-26T04:49:42Z) - 2DQuant: Low-bit Post-Training Quantization for Image Super-Resolution [83.09117439860607]
低ビット量子化は、エッジ展開のための画像超解像(SR)モデルを圧縮するために広く普及している。
低ビット量子化は、フル精度(FP)と比較してSRモデルの精度を低下させることが知られている。
本稿では2DQuantという画像超解像のための2段階の低ビット後量子化(PTQ)法を提案する。
論文 参考訳(メタデータ) (2024-06-10T06:06:11Z) - Unifying Generation and Compression: Ultra-low bitrate Image Coding Via
Multi-stage Transformer [35.500720262253054]
本稿では,新しい画像生成圧縮(UIGC)パラダイムを導入し,生成と圧縮のプロセスを統合する。
UIGCフレームワークの重要な特徴は、トークン化にベクトル量子化(VQ)イメージモデルを採用することである。
実験では、既存のコーデックよりも知覚品質と人間の知覚において、提案されたUIGCフレームワークが優れていることを示した。
論文 参考訳(メタデータ) (2024-03-06T14:27:02Z) - Joint Hierarchical Priors and Adaptive Spatial Resolution for Efficient
Neural Image Compression [11.25130799452367]
ニューラル画像圧縮(NIC)のための絶対画像圧縮変換器(ICT)を提案する。
ICTは、潜在表現からグローバルコンテキストとローカルコンテキストの両方をキャプチャし、量子化された潜在表現の分布をパラメータ化する。
我々のフレームワークは、多目的ビデオ符号化(VVC)参照符号化(VTM-18.0)とニューラルスウィンT-ChARMに対する符号化効率とデコーダ複雑性のトレードオフを大幅に改善する。
論文 参考訳(メタデータ) (2023-07-05T13:17:14Z) - Binarized Spectral Compressive Imaging [59.18636040850608]
ハイパースペクトル画像(HSI)再構成のための既存のディープラーニングモデルは、優れた性能を実現するが、膨大なメモリと計算資源を持つ強力なハードウェアを必要とする。
本稿では,BiSRNet(Biarized Spectral-Redistribution Network)を提案する。
BiSRNetは,提案手法を用いてベースモデルのバイナライズを行う。
論文 参考訳(メタデータ) (2023-05-17T15:36:08Z) - Learned Lossless Compression for JPEG via Frequency-Domain Prediction [50.20577108662153]
JPEG画像のロスレス圧縮を学習するための新しいフレームワークを提案する。
周波数領域での学習を可能にするために、DCT係数は暗黙の局所冗長性を利用するためにグループに分割される。
グループ化されたDCT係数のエントロピーモデリングを実現するために、重み付きブロックに基づいてオートエンコーダのようなアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-03-05T13:15:28Z) - Learned Image Compression with Generalized Octave Convolution and
Cross-Resolution Parameter Estimation [5.238765582868391]
本稿では,オクターブの畳み込みを利用して,遅延表現を高分解能 (HR) と低分解能 (LR) に分解する多分解能画像圧縮フレームワークを提案する。
実験結果から,本手法は,最先端の学習画像圧縮法と比較して,復号時間を約73.35 %,93.44 %削減できることがわかった。
論文 参考訳(メタデータ) (2022-09-07T08:21:52Z) - Learned Lossless JPEG Transcoding via Joint Lossy and Residual
Compression [21.205453851414248]
DCT領域の圧縮JPEG画像を圧縮する新しいフレームワークを提案する。
提案するフレームワークはJPEG圧縮に基づいて,平均21.49%の節約を達成できる。
複数のデータセットに対する実験により,提案するフレームワークはJPEG圧縮に基づいて,平均で約21.49%の節約が可能であることを実証した。
論文 参考訳(メタデータ) (2022-08-24T17:12:00Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Universal Efficient Variable-rate Neural Image Compression [4.759359336476555]
本稿では,Energy-based Channel Gating(ECG)とBit-rate Modulator(BM)という2つのユニバーサルモジュールを提案する。
ECGは動的プルーニングを用いて、畳み込み層のFLOPを50%以上削減し、BMペアは遅延表現を変調し、チャネルワイズでビットレートを制御する。
論文 参考訳(メタデータ) (2021-11-18T03:08:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。