論文の概要: Learned Image Compression with Separate Hyperprior Decoders
- arxiv url: http://arxiv.org/abs/2111.00485v1
- Date: Sun, 31 Oct 2021 13:01:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-02 16:55:30.210004
- Title: Learned Image Compression with Separate Hyperprior Decoders
- Title(参考訳): 切り離したハイパープリアーデコーダによる学習画像圧縮
- Authors: Zhao Zan, Chao Liu, Heming Sun, Xiaoyang Zeng, and Yibo Fan
- Abstract要約: 離散ガウス混合確率における混合パラメータの復号過程を分離するために、3つの超プライア復号器を提案する。
提案手法は,最先端手法と比較して平均3.36%のBDレート低減を実現している。
- 参考スコア(独自算出の注目度): 19.14246055282486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learned image compression techniques have achieved considerable development
in recent years. In this paper, we find that the performance bottleneck lies in
the use of a single hyperprior decoder, in which case the ternary Gaussian
model collapses to a binary one. To solve this, we propose to use three
hyperprior decoders to separate the decoding process of the mixed parameters in
discrete Gaussian mixture likelihoods, achieving more accurate parameters
estimation. Experimental results demonstrate the proposed method optimized by
MS-SSIM achieves on average 3.36% BD-rate reduction compared with
state-of-the-art approach. The contribution of the proposed method to the
coding time and FLOPs is negligible.
- Abstract(参考訳): 学習した画像圧縮技術は近年大きく進歩している。
本稿では, 3次ガウスモデルが2次モデルに崩壊する場合において, 性能ボトルネックは1つのハイパープライアデコーダを使用することにあることを示す。
そこで,我々は3つのハイパープリオデコーダを用いて,混合パラメータの復号過程を離散ガウス混合確率で分離し,より正確なパラメータ推定を実現することを提案する。
実験により,MS-SSIMにより最適化された手法は,最先端手法と比較して平均3.36%のBDレート削減を実現した。
提案手法の符号化時間とFLOPへの寄与は無視できない。
関連論文リスト
- CompGS: Efficient 3D Scene Representation via Compressed Gaussian Splatting [68.94594215660473]
Compressed Gaussian Splatting (CompGS) という,効率的な3次元シーン表現を提案する。
我々は少数のアンカープリミティブを予測に利用し、プリミティブの大多数を非常にコンパクトな残留形にカプセル化することができる。
実験の結果,提案手法は既存の手法よりも優れており,モデル精度とレンダリング品質を損なうことなく,3次元シーン表現のコンパクト性に優れていた。
論文 参考訳(メタデータ) (2024-04-15T04:50:39Z) - Fast Semisupervised Unmixing Using Nonconvex Optimization [80.11512905623417]
半/ライブラリベースのアンミックスのための新しい凸凸モデルを提案する。
スパース・アンミキシングの代替手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-01-23T10:07:41Z) - GPS-Gaussian: Generalizable Pixel-wise 3D Gaussian Splatting for Real-time Human Novel View Synthesis [70.24111297192057]
我々は、文字の新たなビューをリアルタイムに合成するための新しいアプローチ、GPS-Gaussianを提案する。
提案手法は,スパースビューカメラ設定下での2K解像度のレンダリングを可能にする。
論文 参考訳(メタデータ) (2023-12-04T18:59:55Z) - An Optimization-based Deep Equilibrium Model for Hyperspectral Image
Deconvolution with Convergence Guarantees [71.57324258813675]
本稿では,ハイパースペクトル画像のデコンボリューション問題に対処する新しい手法を提案する。
新しい最適化問題を定式化し、学習可能な正規化器をニューラルネットワークの形で活用する。
導出した反復解法は、Deep Equilibriumフレームワーク内の不動点計算問題として表現される。
論文 参考訳(メタデータ) (2023-06-10T08:25:16Z) - Poisson-Gaussian Holographic Phase Retrieval with Score-based Image
Prior [19.231581775644617]
本稿では,スコア関数を先行生成関数とする高速化されたWirtinger Flow (AWF) を用いた新しいアルゴリズム"AWFS"を提案する。
PRの対数様関数の勾配を計算し、リプシッツ定数を決定する。
本稿では,提案アルゴリズムの臨界点収束保証を確立する理論的解析を行う。
論文 参考訳(メタデータ) (2023-05-12T18:08:47Z) - Learned Image Compression with Generalized Octave Convolution and
Cross-Resolution Parameter Estimation [5.238765582868391]
本稿では,オクターブの畳み込みを利用して,遅延表現を高分解能 (HR) と低分解能 (LR) に分解する多分解能画像圧縮フレームワークを提案する。
実験結果から,本手法は,最先端の学習画像圧縮法と比較して,復号時間を約73.35 %,93.44 %削減できることがわかった。
論文 参考訳(メタデータ) (2022-09-07T08:21:52Z) - The split Gibbs sampler revisited: improvements to its algorithmic
structure and augmented target distribution [1.1279808969568252]
現在の最先端の手法は、後部密度を滑らかな近似で置き換えることによってこれらの問題に対処することが多い。
別のアプローチはデータ拡張と緩和に基づいており、補助変数を導入して近似的な拡張後分布を構築する。
本稿では,2つの戦略の利点を密結合した潜在空間SK-ROCKと呼ばれる,新しい加速近位MCMC法を提案する。
論文 参考訳(メタデータ) (2022-06-28T11:21:41Z) - Lossy Compression with Gaussian Diffusion [28.930398810600504]
非条件拡散生成モデルに基づく新しい損失圧縮手法DiffCについて述べる。
エンコーダ変換の欠如にもかかわらず、概念実証を実装し、驚くほどうまく機能することを発見した。
流れに基づく再構築は,祖先サンプリングよりも高頻度で3dBのゲインを達成できることを示す。
論文 参考訳(メタデータ) (2022-06-17T16:46:31Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Plug-And-Play Learned Gaussian-mixture Approximate Message Passing [71.74028918819046]
そこで本研究では,従来のi.i.d.ソースに適した圧縮圧縮センシング(CS)リカバリアルゴリズムを提案する。
我々のアルゴリズムは、Borgerdingの学習AMP(LAMP)に基づいて構築されるが、アルゴリズムに普遍的な復調関数を採用することにより、それを大幅に改善する。
数値評価により,L-GM-AMPアルゴリズムは事前の知識を必要とせず,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-11-18T16:40:45Z) - Improving Inference for Neural Image Compression [31.999462074510305]
State-of-the-art method build on Hierarchical variational autoencoders to predict a compressible latent representation of each data point。
従来の手法では性能を制限した3つの近似ギャップを同定する。
本稿では,これら3つの制約のそれぞれについて,反復的推論に関する考え方に基づく対策を提案する。
論文 参考訳(メタデータ) (2020-06-07T19:26:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。