論文の概要: Universal Rate-Distortion-Perception Representations for Lossy
Compression
- arxiv url: http://arxiv.org/abs/2106.10311v1
- Date: Fri, 18 Jun 2021 18:52:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-22 15:07:53.661274
- Title: Universal Rate-Distortion-Perception Representations for Lossy
Compression
- Title(参考訳): 損失圧縮のためのユニバーサルレートゆがみ知覚表現
- Authors: George Zhang, Jingjing Qian, Jun Chen, Ashish Khisti
- Abstract要約: 我々は、エンコーダを固定し、デコーダを変更して歪みや知覚制約の集合内の任意の点を達成できる普遍表現の概念を考える。
対応する情報理論の普遍的速度歪曲知覚が、近似的な意味で操作可能であることを証明した。
- 参考スコア(独自算出の注目度): 31.28856752892628
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the context of lossy compression, Blau & Michaeli (2019) adopt a
mathematical notion of perceptual quality and define the information
rate-distortion-perception function, generalizing the classical rate-distortion
tradeoff. We consider the notion of universal representations in which one may
fix an encoder and vary the decoder to achieve any point within a collection of
distortion and perception constraints. We prove that the corresponding
information-theoretic universal rate-distortion-perception function is
operationally achievable in an approximate sense. Under MSE distortion, we show
that the entire distortion-perception tradeoff of a Gaussian source can be
achieved by a single encoder of the same rate asymptotically. We then
characterize the achievable distortion-perception region for a fixed
representation in the case of arbitrary distributions, identify conditions
under which the aforementioned results continue to hold approximately, and
study the case when the rate is not fixed in advance. This motivates the study
of practical constructions that are approximately universal across the RDP
tradeoff, thereby alleviating the need to design a new encoder for each
objective. We provide experimental results on MNIST and SVHN suggesting that on
image compression tasks, the operational tradeoffs achieved by machine learning
models with a fixed encoder suffer only a small penalty when compared to their
variable encoder counterparts.
- Abstract(参考訳): 損失圧縮の文脈において、Blau & Michaeli (2019) は知覚品質の数学的概念を採用し、古典的な速度歪みトレードオフを一般化して情報速度歪み知覚関数を定義する。
我々は、エンコーダを固定し、歪みや知覚の制約の集合内の任意の点を達成するためにデコーダを変化させる普遍表現の概念を考える。
対応する情報理論の普遍的速度歪み知覚関数が,近似的に動作可能であることを証明した。
mse歪みの下では、ガウス源の歪み受容トレードオフ全体が、漸近的に同じ速度の1つのエンコーダによって達成できることを示す。
次に、任意の分布の場合の固定表現に対する達成可能な歪み知覚領域を特徴付けるとともに、上記の結果がほぼ持続する条件を特定し、予め固定されていない場合について検討する。
このことは、RDPトレードオフ全体でほぼ普遍的な実践的な構造の研究を動機付け、それぞれの目的のために新しいエンコーダを設計する必要がなくなる。
画像圧縮タスクにおいて、固定エンコーダを持つ機械学習モデルによって達成される運用上のトレードオフは、可変エンコーダに比べて少ないペナルティしか得られないことを示唆するMNISTとSVHNの実験結果を示す。
関連論文リスト
- UNIQA: A Unified Framework for Both Full-Reference and No-Reference
Image Quality Assessment [53.895598734070695]
完全参照(FR)と非参照(NR)のIQAのための統一ネットワークを提案する。
入力画像から多レベル特徴を抽出するためにエンコーダを用いる。
FRおよびNR入力のユニバーサルアダプタとして階層自己認識(HSA)モジュールを提案する。
HSA と CSCA を採用することにより,提案ネットワークは FR と NR IQA の両方を効果的に実行することができる。
論文 参考訳(メタデータ) (2023-10-14T11:03:04Z) - The END: An Equivariant Neural Decoder for Quantum Error Correction [73.4384623973809]
データ効率のよいニューラルデコーダを導入し、この問題の対称性を活用する。
本稿では,従来のニューラルデコーダに比べて精度の高い新しい同変アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-04-14T19:46:39Z) - Rate-Distortion Theory for Mixed States [2.578242050187029]
速度歪理論は圧縮率とコピー毎の誤差の間のトレードオフを研究する。
本稿では混合状態圧縮の速度歪み関数を導出する。
論文 参考訳(メタデータ) (2022-08-24T17:59:35Z) - Optimally Controllable Perceptual Lossy Compression [16.208548355509127]
損失圧縮の最近の研究は、歪みと知覚品質が互いに相反していることを示している。
異なる知覚品質を得るためには、異なるデコーダをトレーニングする必要がある。
任意のD-Pトレードオフを最適に達成できるデコーダは2つしかないという非自明な発見を示す。
論文 参考訳(メタデータ) (2022-06-21T02:48:35Z) - Neural Estimation of the Rate-Distortion Function With Applications to
Operational Source Coding [25.59334941818991]
損失のあるデータ圧縮スキームを設計する際の根本的な問題は、速度歪み関数と比較してどれだけうまくできるかである。
本研究では,大規模な実世界のデータに対して,速度歪み関数を推定する手法について検討する。
本稿では, NERDと呼ばれる速度歪み推定器を画像データセットに適用する。
論文 参考訳(メタデータ) (2022-04-04T16:06:40Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - On Perceptual Lossy Compression: The Cost of Perceptual Reconstruction
and An Optimal Training Framework [12.13586501618741]
完全知覚品質を達成するためのコストは、達成可能なMSE歪みの2倍であることを示す。
完全知覚制約下で最小のMSE歪みを与えられたビットレートで達成するための新しいトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-05T02:53:38Z) - Substitutional Neural Image Compression [48.20906717052056]
置換型ニューラルイメージ圧縮(snic)は、あらゆるニューラルイメージ圧縮モデルを強化する一般的なアプローチである。
フレキシブルな歪みメトリックに向けて圧縮性能を高め、単一のモデルインスタンスを使用したビットレート制御を可能にする。
論文 参考訳(メタデータ) (2021-05-16T20:53:31Z) - Autoencoding Variational Autoencoder [56.05008520271406]
我々は,この行動が学習表現に与える影響と,自己整合性の概念を導入することでそれを修正する結果について検討する。
自己整合性アプローチで訓練されたエンコーダは、敵攻撃による入力の摂動に対して頑健な(無神経な)表現につながることを示す。
論文 参考訳(メタデータ) (2020-12-07T14:16:14Z) - The Rate-Distortion-Accuracy Tradeoff: JPEG Case Study [30.84385779593074]
JPEG圧縮標準における量子化テーブルの設計に焦点をあてる。
連続的な最適化を通じて、これらのテーブルの新たな最適チューニングを提供する。
本報告では,これらのテーブルの簡易かつ簡易な変更による性能向上について報告する。
論文 参考訳(メタデータ) (2020-08-03T01:39:01Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。