論文の概要: Learned Block-based Hybrid Image Compression
- arxiv url: http://arxiv.org/abs/2012.09550v3
- Date: Mon, 18 Jan 2021 11:34:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-02 07:17:13.269313
- Title: Learned Block-based Hybrid Image Compression
- Title(参考訳): 学習ブロックベースハイブリッド画像圧縮
- Authors: Yaojun Wu, Xin Li, Zhizheng Zhang, Xin Jin, Zhibo Chen
- Abstract要約: 学習画像圧縮に関する最近の研究は、完全な解像度で符号化および復号処理を行う。
フルレゾリューション推論は、GPUリソースが限られているメモリ外問題(OOM)を引き起こすことが多い。
本稿では,学習ブロックベースのハイブリッド画像圧縮フレームワークを提供する。
- 参考スコア(独自算出の注目度): 33.44942603425436
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent works on learned image compression perform encoding and decoding
processes in a full-resolution manner, resulting in two problems when deployed
for practical applications. First, parallel acceleration of the autoregressive
entropy model cannot be achieved due to serial decoding. Second,
full-resolution inference often causes the out-of-memory(OOM) problem with
limited GPU resources, especially for high-resolution images. Block partition
is a good design choice to handle the above issues, but it brings about new
challenges in reducing the redundancy between blocks and eliminating block
effects. To tackle the above challenges, this paper provides a learned
block-based hybrid image compression (LBHIC) framework. Specifically, we
introduce explicit intra prediction into a learned image compression framework
to utilize the relation among adjacent blocks. Superior to context modeling by
linear weighting of neighbor pixels in traditional codecs, we propose a
contextual prediction module (CPM) to better capture long-range correlations by
utilizing the strip pooling to extract the most relevant information in
neighboring latent space, thus achieving effective information prediction.
Moreover, to alleviate blocking artifacts, we further propose a boundary-aware
postprocessing module (BPM) with the edge importance taken into account.
Extensive experiments demonstrate that the proposed LBHIC codec outperforms the
VVC, with a bit-rate conservation of 4.1%, and reduces the decoding time by
approximately 86.7% compared with that of state-of-the-art learned image
compression methods.
- Abstract(参考訳): 近年の学習画像圧縮技術は, 符号化処理と復号処理をフル解像度で行い, 実用用途に展開する際の2つの問題点を生じさせている。
第一に、自己回帰エントロピーモデルの並列加速度はシリアルデコードにより達成できない。
第二に、フル解像度の推論は、特に高解像度の画像に対して、GPUリソースが限られているメモリ外問題(OOM)を引き起こすことが多い。
ブロックパーティションは上記の問題に対処するためのよい設計選択だが、ブロック間の冗長性を減らし、ブロック効果をなくすという新たな課題をもたらす。
上記の課題に対処するため,本稿では,学習ブロックベースハイブリッド画像圧縮(LBHIC)フレームワークを提案する。
具体的には,隣接ブロック間の関係を利用するために,学習画像圧縮フレームワークに明示的な内部予測を導入する。
従来のコーデックにおける隣接画素の線形重み付けによるコンテキストモデリングに優れており、ストリッププーリングを利用して隣接潜在空間における最も関連する情報を抽出し、効果的な情報予測を実現することで、長距離相関をよりよく捉えるコンテキスト予測モジュール(cpm)を提案する。
さらに,ブロッキングアーティファクトを緩和するために,エッジの重要性を考慮した境界対応後処理モジュール(BPM)を提案する。
広範な実験により、lbhicコーデックはvvcを4.1%のビットレート保存で上回り、最先端の学習画像圧縮法と比較して約86.7%の復号時間を削減できることが示されている。
関連論文リスト
- Exploiting Inter-Image Similarity Prior for Low-Bitrate Remote Sensing Image Compression [10.427300958330816]
生成された離散コードブックを用いたコードブックベースのRS画像圧縮(Code-RSIC)手法を提案する。
このコードは、知覚品質の観点から、最先端の伝統と学習に基づく画像圧縮アルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2024-07-17T03:33:16Z) - HybridFlow: Infusing Continuity into Masked Codebook for Extreme Low-Bitrate Image Compression [51.04820313355164]
HyrbidFlowは、連続的な機能ベースのストリームとコードブックベースのストリームを組み合わせることで、極めて低い条件下で高い知覚品質と高い忠実性を実現する。
実験の結果、超低速で複数のデータセットにまたがる優れた性能が示された。
論文 参考訳(メタデータ) (2024-04-20T13:19:08Z) - MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large Multimodal Model [78.4051835615796]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文 参考訳(メタデータ) (2023-07-17T06:14:19Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Improving Multi-generation Robustness of Learned Image Compression [16.86614420872084]
ネットワーク構造を変更せずに50回再符号化しても,BPGの最初の圧縮に匹敵する性能が得られることを示す。
論文 参考訳(メタデータ) (2022-10-31T03:26:11Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z) - A Unified End-to-End Framework for Efficient Deep Image Compression [35.156677716140635]
本稿では,3つの新しい技術に基づくEDIC(Efficient Deep Image Compression)という統合フレームワークを提案する。
具体的には、学習に基づく画像圧縮のためのオートエンコーダスタイルのネットワークを設計する。
EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
論文 参考訳(メタデータ) (2020-02-09T14:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。