論文の概要: PILC: Practical Image Lossless Compression with an End-to-end GPU
Oriented Neural Framework
- arxiv url: http://arxiv.org/abs/2206.05279v1
- Date: Fri, 10 Jun 2022 03:00:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-19 18:07:22.949816
- Title: PILC: Practical Image Lossless Compression with an End-to-end GPU
Oriented Neural Framework
- Title(参考訳): pilc: エンドツーエンドgpu指向ニューラルフレームワークによる実用的な画像ロスレス圧縮
- Authors: Ning Kang, Shanzhao Qiu, Shifeng Zhang, Zhenguo Li, Shutao Xia
- Abstract要約: 本稿では,1台のNVIDIA Tesla V100 GPUを用いて,圧縮と圧縮の両面で200MB/sを実現するエンドツーエンド画像圧縮フレームワークを提案する。
実験により、我々のフレームワークは、複数のデータセットで30%のマージンで、PNGよりも圧縮が優れていることが示された。
- 参考スコア(独自算出の注目度): 88.18310777246735
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative model based image lossless compression algorithms have seen a
great success in improving compression ratio. However, the throughput for most
of them is less than 1 MB/s even with the most advanced AI accelerated chips,
preventing them from most real-world applications, which often require 100
MB/s. In this paper, we propose PILC, an end-to-end image lossless compression
framework that achieves 200 MB/s for both compression and decompression with a
single NVIDIA Tesla V100 GPU, 10 times faster than the most efficient one
before. To obtain this result, we first develop an AI codec that combines
auto-regressive model and VQ-VAE which performs well in lightweight setting,
then we design a low complexity entropy coder that works well with our codec.
Experiments show that our framework compresses better than PNG by a margin of
30% in multiple datasets. We believe this is an important step to bring AI
compression forward to commercial use.
- Abstract(参考訳): 生成モデルに基づく画像ロスレス圧縮アルゴリズムは圧縮率の向上に大きな成功を収めている。
しかし、ほとんどのスループットは、最も先進的なAIアクセラレーションチップでも1MB/s未満であり、多くの場合100MB/sを必要とする現実世界のアプリケーションでは利用できない。
本稿では,1台のNVIDIA Tesla V100 GPUを用いて,200MB/sの圧縮と圧縮の両面で達成可能な,エンドツーエンドの画像ロスレス圧縮フレームワークPILCを提案する。
この結果を得るために、我々はまず、自動回帰モデルと軽量環境でよく機能するVQ-VAEを組み合わせたAIコーデックを開発し、コーデックとうまく機能する低複雑性エントロピーコーダを設計する。
実験の結果、複数のデータセットでpngよりも30%のマージンで圧縮できることがわかった。
これは、AI圧縮を商用利用に進めるための重要なステップだと考えています。
関連論文リスト
- CMC-Bench: Towards a New Paradigm of Visual Signal Compression [85.1839779884282]
本稿では,画像圧縮のための画像間テキスト(I2T)モデルとテキスト間画像(T2I)モデルの協調性能のベンチマークであるCMC-Benchを紹介する。
超低速では、いくつかのI2TモデルとT2Iモデルの組み合わせが、最も先進的な視覚信号プロトコルを超えたことが証明されている。
論文 参考訳(メタデータ) (2024-06-13T17:41:37Z) - GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting [27.33121386538575]
Inlicit Neural representations (INRs) は画像の表現と圧縮で大成功を収めた。
しかし、この要件は、メモリが限られているローエンドデバイスでの使用を妨げることが多い。
本稿では,2次元ガウススプラッティングによる画像表現と圧縮の基盤となるパラダイムであるガウス画像を提案する。
論文 参考訳(メタデータ) (2024-03-13T14:02:54Z) - MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large Multimodal Model [78.4051835615796]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - Random-Access Neural Compression of Material Textures [1.2971248363246106]
材料テクスチャに特化して設計された新しいニューラル圧縮手法を提案する。
我々は低圧縮でさらに2つの詳細レベル、すなわち16倍のテクセルをアンロックする。
本手法では,ランダムアクセスによるオンデマンドリアルタイム圧縮が可能で,ディスクやメモリ上での圧縮が可能となる。
論文 参考訳(メタデータ) (2023-05-26T17:16:22Z) - Computationally-Efficient Neural Image Compression with Shallow Decoders [43.115831685920114]
本稿では,JPEGに類似した浅い,あるいは線形な復号変換を用いることで,復号化複雑性のギャップを解消する。
我々は、より強力なエンコーダネットワークと反復符号化を採用することにより、符号化と復号の間のしばしば非対称な予算を利用する。
論文 参考訳(メタデータ) (2023-04-13T03:38:56Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。
52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文 参考訳(メタデータ) (2021-05-24T12:07:38Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - A Unified End-to-End Framework for Efficient Deep Image Compression [35.156677716140635]
本稿では,3つの新しい技術に基づくEDIC(Efficient Deep Image Compression)という統合フレームワークを提案する。
具体的には、学習に基づく画像圧縮のためのオートエンコーダスタイルのネットワークを設計する。
EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
論文 参考訳(メタデータ) (2020-02-09T14:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。