論文の概要: Leveraging progressive model and overfitting for efficient learned image
compression
- arxiv url: http://arxiv.org/abs/2210.04112v1
- Date: Sat, 8 Oct 2022 21:54:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 16:10:11.776978
- Title: Leveraging progressive model and overfitting for efficient learned image
compression
- Title(参考訳): 効率的な学習画像圧縮のためのプログレッシブモデルとオーバーフィットの活用
- Authors: Honglei Zhang, Francesco Cricri, Hamed Rezazadegan Tavakoli, Emre
Aksu, Miska M. Hannuksela
- Abstract要約: マルチスケールプログレッシブ(MSP)確率モデルと潜在表現オーバーフィッティング(LOF)技術を用いた強力で柔軟なlicフレームワークを提案する。
事前定義されたプロファイルの異なるフレームワークでは、圧縮効率と計算複雑性のバランスポイントを達成できる。
実験の結果,提案フレームワークはVVC/H.266標準よりも2.5%,1.0%,1.3%Bjontegaardデルタビットレート(BDレート)の低減を実現している。
- 参考スコア(独自算出の注目度): 14.937446839215868
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep learning is overwhelmingly dominant in the field of computer vision and
image/video processing for the last decade. However, for image and video
compression, it lags behind the traditional techniques based on discrete cosine
transform (DCT) and linear filters. Built on top of an autoencoder
architecture, learned image compression (LIC) systems have drawn enormous
attention in recent years. Nevertheless, the proposed LIC systems are still
inferior to the state-of-the-art traditional techniques, for example, the
Versatile Video Coding (VVC/H.266) standard, due to either their compression
performance or decoding complexity. Although claimed to outperform the
VVC/H.266 on a limited bit rate range, some proposed LIC systems take over 40
seconds to decode a 2K image on a GPU system. In this paper, we introduce a
powerful and flexible LIC framework with multi-scale progressive (MSP)
probability model and latent representation overfitting (LOF) technique. With
different predefined profiles, the proposed framework can achieve various
balance points between compression efficiency and computational complexity.
Experiments show that the proposed framework achieves 2.5%, 1.0%, and 1.3%
Bjontegaard delta bit rate (BD-rate) reduction over the VVC/H.266 standard on
three benchmark datasets on a wide bit rate range. More importantly, the
decoding complexity is reduced from O(n) to O(1) compared to many other LIC
systems, resulting in over 20 times speedup when decoding 2K images.
- Abstract(参考訳): ディープラーニングは過去10年間、コンピュータビジョンと画像/ビデオ処理の分野で圧倒的に支配的だった。
しかし、画像やビデオの圧縮では、離散コサイン変換(DCT)と線形フィルタに基づく従来の手法に遅れがある。
オートエンコーダアーキテクチャ上に構築された学習画像圧縮(lic)システムは近年大きな注目を集めている。
それでも提案されたlicシステムは、圧縮性能または復号化の複雑さのため、Versatile Video Coding (VVC/H.266) 規格のような最先端の伝統的な技術に劣っている。
限られたビットレート範囲でVVC/H.266より優れていると主張したが、GPUシステムで2K画像をデコードするのに40秒以上かかるという提案がある。
本稿では,マルチスケールプログレッシブ(MSP)確率モデルと潜在表現オーバーフィッティング(LOF)技術を用いた,強力で柔軟なlicフレームワークを提案する。
事前定義されたプロファイルの異なるフレームワークでは、圧縮効率と計算複雑性のバランスポイントを達成できる。
実験の結果,提案フレームワークはVVC/H.266標準よりも2.5%,1.0%,1.3%のBjontegaardデルタビットレート(BDレート)の削減を実現している。
さらに重要なことに、2K画像の復号時に20倍以上のスピードアップが生じるため、復号複雑性はO(n)からO(1)に減少する。
関連論文リスト
- Accelerating Learned Video Compression via Low-Resolution Representation Learning [18.399027308582596]
低解像度表現学習に焦点を当てた学習ビデオ圧縮のための効率最適化フレームワークを提案する。
提案手法は,H.266参照ソフトウェアVTMの低遅延P構成と同等の性能を実現する。
論文 参考訳(メタデータ) (2024-07-23T12:02:57Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Asymmetric Learned Image Compression with Multi-Scale Residual Block,
Importance Map, and Post-Quantization Filtering [15.056672221375104]
ディープラーニングに基づく画像圧縮は、最新のH.266/VVCよりも高いレート歪み(R-D)性能を実現している。
多くの先導的な学習スキームは、パフォーマンスと複雑さの間の良いトレードオフを維持することができません。
そこで本研究では,R-D の性能を技術状況よりも低い複雑さで実現した,効率的かつ効果的な画像符号化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-21T09:34:29Z) - Split Hierarchical Variational Compression [21.474095984110622]
可変オートエンコーダ(VAE)は、画像データセットの圧縮を行う上で大きな成功を収めている。
SHVCは、ピクセルごとの自己回帰と完全に分解された確率モデルとの一般化を可能にする、効率的な自己回帰的サブピクセル畳み込みを導入している。
論文 参考訳(メタデータ) (2022-04-05T09:13:38Z) - Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。
提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文 参考訳(メタデータ) (2021-08-21T17:30:06Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Learning for Video Compression with Recurrent Auto-Encoder and Recurrent
Probability Model [164.7489982837475]
本稿では、リカレントオートエンコーダ(RAE)とリカレント確率モデル(RPM)を用いたリカレントラーニングビデオ圧縮(RLVC)手法を提案する。
RAEは、ビデオフレーム間の時間的相関を利用するために、エンコーダとデコーダの両方で繰り返しセルを使用する。
提案手法は,PSNRとMS-SSIMの両方の観点から,最先端の学習ビデオ圧縮性能を実現する。
論文 参考訳(メタデータ) (2020-06-24T08:46:33Z) - Learning for Video Compression with Hierarchical Quality and Recurrent
Enhancement [164.7489982837475]
本稿では,階層型ビデオ圧縮(HLVC)手法を提案する。
我々のHLVCアプローチでは、エンコーダ側とデコーダ側の低品質フレームの圧縮と強化を容易にするため、階層的品質は符号化効率の恩恵を受ける。
論文 参考訳(メタデータ) (2020-03-04T09:31:37Z) - Improved Image Coding Autoencoder With Deep Learning [8.92071749364712]
自動エンコーダベースのパイプラインを構築し,Ball'eのアプローチに基づく極端エンドツーエンドの画像圧縮を実現する。
ピクセル当たりのビット数は4.0%減少し(bpp)、マルチスケール構造類似度(MS-SSIM)は0.03%増加し、ピーク信号-ノイズ比(PSNR)は0.47%低下した。
論文 参考訳(メタデータ) (2020-02-28T03:21:47Z) - A Unified End-to-End Framework for Efficient Deep Image Compression [35.156677716140635]
本稿では,3つの新しい技術に基づくEDIC(Efficient Deep Image Compression)という統合フレームワークを提案する。
具体的には、学習に基づく画像圧縮のためのオートエンコーダスタイルのネットワークを設計する。
EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
論文 参考訳(メタデータ) (2020-02-09T14:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。