論文の概要: Evaluating the Practicality of Learned Image Compression
- arxiv url: http://arxiv.org/abs/2207.14524v1
- Date: Fri, 29 Jul 2022 07:45:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-01 13:20:41.802314
- Title: Evaluating the Practicality of Learned Image Compression
- Title(参考訳): 学習画像圧縮の実践性評価
- Authors: Hongjiu Yu, Qiancheng Sun, Jin Hu, Xingyuan Xue, Jixiang Luo, Dailan
He, Yilong Li, Pengbo Wang, Yuanyuan Wang, Yaxu Dai, Yan Wang, Hongwei Qin
- Abstract要約: 学習画像圧縮は従来の手法と比較してPSNRやMS-SSIMでは異常な速度歪み性能を達成している。
我々は、より効率のよいネットワークを低レイテンシで設計するために、ニューラルネットワーク探索(NAS)を導入し、量子化を活用して推論プロセスを高速化する。
licの実装は、符号化用の145 fpsと、1080pイメージ用のTesla T4 GPU上のデコード用の208 fpsという驚くべきスループットに達しました。
- 参考スコア(独自算出の注目度): 8.960283367872666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learned image compression has achieved extraordinary rate-distortion
performance in PSNR and MS-SSIM compared to traditional methods. However, it
suffers from intensive computation, which is intolerable for real-world
applications and leads to its limited industrial application for now. In this
paper, we introduce neural architecture search (NAS) to designing more
efficient networks with lower latency, and leverage quantization to accelerate
the inference process. Meanwhile, efforts in engineering like multi-threading
and SIMD have been made to improve efficiency. Optimized using a hybrid loss of
PSNR and MS-SSIM for better visual quality, we obtain much higher MS-SSIM than
JPEG, JPEG XL and AVIF over all bit rates, and PSNR between that of JPEG XL and
AVIF. Our software implementation of LIC achieves comparable or even faster
inference speed compared to jpeg-turbo while being multiple times faster than
JPEG XL and AVIF. Besides, our implementation of LIC reaches stunning
throughput of 145 fps for encoding and 208 fps for decoding on a Tesla T4 GPU
for 1080p images. On CPU, the latency of our implementation is comparable with
JPEG XL.
- Abstract(参考訳): 学習画像圧縮は従来の手法と比較してPSNRやMS-SSIMでは異常な速度歪み性能を達成している。
しかし、これは実世界のアプリケーションには耐え難い計算に悩まされ、現時点ではその限られた産業用途に繋がる。
本稿では,低レイテンシで効率的なネットワークを設計するためにニューラルネットワーク検索(nas)を導入し,量子化を利用して推論プロセスを高速化する。
一方、マルチスレッドやSIMDのようなエンジニアリングの取り組みは効率を向上させるために行われてきた。
視力向上のためにPSNRとMS-SSIMのハイブリッド損失を最適化し,すべてのビットレートでJPEG,JPEG XL,AVIFよりもはるかに高いMS-SSIM,JPEG XLとAVIFのPSNRを得る。
我々のソフトウェア実装は、JPEG XL や AVIF の何倍も高速でありながら、jpeg-turbo と同等またはそれ以上高速な推論速度を実現している。
さらに,符号化には145fps,1080pイメージにはTesla T4 GPUのデコードには208fpsのスループットを実現しています。
CPUでは、実装のレイテンシはJPEG XLと同等です。
関連論文リスト
- JPEG Inspired Deep Learning [4.958744940097937]
精巧なJPEG圧縮は、ディープラーニング(DL)の性能を実際に向上させる
トレーニング可能なJPEG圧縮層で基盤となるDNNアーキテクチャをプリペイドする新しいDLフレームワークであるJPEG-DLを提案する。
論文 参考訳(メタデータ) (2024-10-09T17:23:54Z) - GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting [27.33121386538575]
Inlicit Neural representations (INRs) は画像の表現と圧縮で大成功を収めた。
しかし、この要件は、メモリが限られているローエンドデバイスでの使用を妨げることが多い。
本稿では,2次元ガウススプラッティングによる画像表現と圧縮の基盤となるパラダイムであるガウス画像を提案する。
論文 参考訳(メタデータ) (2024-03-13T14:02:54Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - PILC: Practical Image Lossless Compression with an End-to-end GPU
Oriented Neural Framework [88.18310777246735]
本稿では,1台のNVIDIA Tesla V100 GPUを用いて,圧縮と圧縮の両面で200MB/sを実現するエンドツーエンド画像圧縮フレームワークを提案する。
実験により、我々のフレームワークは、複数のデータセットで30%のマージンで、PNGよりも圧縮が優れていることが示された。
論文 参考訳(メタデータ) (2022-06-10T03:00:10Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - MBRS : Enhancing Robustness of DNN-based Watermarking by Mini-Batch of
Real and Simulated JPEG Compression [40.944632292011846]
JPEGのロバスト性を高めるために,Mini-Batch of Real and Simulated JPEG compression (MBRS) を用いた新しいエンドツーエンドトレーニングアーキテクチャを提案する。
我々のモデルは抽出されたメッセージに対して0.01%未満のビット誤り率を達成し、符号化された画像に対してPSNRが36以上であり、JPEG攻撃に対する堅牢性を示す。
論文 参考訳(メタデータ) (2021-08-18T15:47:37Z) - Learning to Improve Image Compression without Changing the Standard
Decoder [100.32492297717056]
本稿では,標準デコーダによる符号化性能向上のための学習法を提案する。
具体的には、DCT係数の分布を最適化する周波数領域事前編集法を提案する。
JPEGデコーダは変更しないので、広く使われている標準JPEGデコーダで画像を見る際には、我々のアプローチが適用可能である。
論文 参考訳(メタデータ) (2020-09-27T19:24:42Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z) - Improved Image Coding Autoencoder With Deep Learning [8.92071749364712]
自動エンコーダベースのパイプラインを構築し,Ball'eのアプローチに基づく極端エンドツーエンドの画像圧縮を実現する。
ピクセル当たりのビット数は4.0%減少し(bpp)、マルチスケール構造類似度(MS-SSIM)は0.03%増加し、ピーク信号-ノイズ比(PSNR)は0.47%低下した。
論文 参考訳(メタデータ) (2020-02-28T03:21:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。