論文の概要: End-to-End Image Compression with Probabilistic Decoding
- arxiv url: http://arxiv.org/abs/2109.14837v1
- Date: Thu, 30 Sep 2021 04:07:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 14:42:08.041715
- Title: End-to-End Image Compression with Probabilistic Decoding
- Title(参考訳): 確率的復号化によるエンドツーエンド画像圧縮
- Authors: Haichuan Ma, Dong Liu, Cunhui Dong, Li Li and Feng Wu
- Abstract要約: 確率的復号化を支援するための学習画像圧縮フレームワークを提案する。
提案するフレームワークは、画素を係数に変換するための可逆ニューラルネットワークベースの変換に依存する。
- 参考スコア(独自算出の注目度): 31.38636002751645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Lossy image compression is a many-to-one process, thus one bitstream
corresponds to multiple possible original images, especially at low bit rates.
However, this nature was seldom considered in previous studies on image
compression, which usually chose one possible image as reconstruction, e.g. the
one with the maximal a posteriori probability. We propose a learned image
compression framework to natively support probabilistic decoding. The
compressed bitstream is decoded into a series of parameters that instantiate a
pre-chosen distribution; then the distribution is used by the decoder to sample
and reconstruct images. The decoder may adopt different sampling strategies and
produce diverse reconstructions, among which some have higher signal fidelity
and some others have better visual quality. The proposed framework is dependent
on a revertible neural network-based transform to convert pixels into
coefficients that obey the pre-chosen distribution as much as possible. Our
code and models will be made publicly available.
- Abstract(参考訳): ロスシー画像圧縮は多対一のプロセスであるため、1ビットストリームは、特に低ビットレートで、複数の元の画像に対応する。
しかし、この性質は、画像圧縮に関する以前の研究ではほとんど考えられなかった。
本稿では,確率的復号化をネイティブにサポートする学習画像圧縮フレームワークを提案する。
圧縮されたビットストリームは、プリチョセン分布をインスタンス化する一連のパラメータにデコードされ、デコーダによって画像のサンプリングと再構成に使用される。
復号器は異なるサンプリング戦略を採用し、様々な再構成を行うことができ、そのうちのいくつかは高い信号忠実度を持ち、他のいくつかはより良い視覚的品質を持つ。
提案手法は、画素を可能な限りプレチョン分布に従う係数に変換するための可逆ニューラルネットワークに基づく変換に依存する。
私たちのコードとモデルは公開されます。
関連論文リスト
- Exploiting Inter-Image Similarity Prior for Low-Bitrate Remote Sensing Image Compression [10.427300958330816]
生成された離散コードブックを用いたコードブックベースのRS画像圧縮(Code-RSIC)手法を提案する。
このコードは、知覚品質の観点から、最先端の伝統と学習に基づく画像圧縮アルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2024-07-17T03:33:16Z) - Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文 参考訳(メタデータ) (2023-07-17T06:14:19Z) - Multiscale Augmented Normalizing Flows for Image Compression [17.441496966834933]
本稿では,非可逆潜在変数モデルである拡張正規化フローに対して,階層的潜在空間を適応させる新しい概念を提案する。
私たちの最高のパフォーマンスモデルは、比較対象のシングルスケールモデルよりも7%以上、平均的なコスト削減を実現しました。
論文 参考訳(メタデータ) (2023-05-09T13:42:43Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Learning Scalable $\ell_\infty$-constrained Near-lossless Image
Compression via Joint Lossy Image and Residual Compression [118.89112502350177]
本稿では,$ell_infty$-constrained near-lossless image compressionを学習するための新しいフレームワークを提案する。
元の残差の学習確率モデルを定量化し、量子化残差の確率モデルを導出する。
論文 参考訳(メタデータ) (2021-03-31T11:53:36Z) - How to Exploit the Transferability of Learned Image Compression to
Conventional Codecs [25.622863999901874]
本稿では,学習した画像の符号化をサロゲートとして利用して,画像の符号化を最適化する方法を示す。
提案手法は,MS-SSIM歪みをデコードオーバーヘッドを伴わずに20%以上の速度改善で補正するために,従来の画像を再構成することができる。
論文 参考訳(メタデータ) (2020-12-03T12:34:51Z) - Lossy Image Compression with Normalizing Flows [19.817005399746467]
ディープ・イメージ・圧縮のための最先端のソリューションは、通常、入力を低次元の潜在空間にマッピングするオートエンコーダを用いる。
対照的に、画像圧縮における従来のアプローチは、より幅広い品質レベルを実現する。
論文 参考訳(メタデータ) (2020-08-24T14:46:23Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Learning Better Lossless Compression Using Lossy Compression [100.50156325096611]
我々は、ロスレス画像圧縮システムを構築するために、強力なロスレス画像圧縮アルゴリズムであるBPGを利用する。
我々は,BPG再構成を条件とした畳み込みニューラルネットワークに基づく確率モデルを用いて,残差分布をモデル化する。
そして、この画像は、BPGが生成したビットストリームと学習した残留コーダの連結を用いて保存される。
論文 参考訳(メタデータ) (2020-03-23T11:21:52Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。