Fugu-MT 論文翻訳(概要): Universal Rate-Distortion-Perception Representations for Lossy Compression

論文の概要: Universal Rate-Distortion-Perception Representations for Lossy Compression

arxiv url: http://arxiv.org/abs/2106.10311v1
Date: Fri, 18 Jun 2021 18:52:08 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-22 15:07:53.661274
Title: Universal Rate-Distortion-Perception Representations for Lossy Compression
Title（参考訳）: 損失圧縮のためのユニバーサルレートゆがみ知覚表現
Authors: George Zhang, Jingjing Qian, Jun Chen, Ashish Khisti
Abstract要約: 我々は、エンコーダを固定し、デコーダを変更して歪みや知覚制約の集合内の任意の点を達成できる普遍表現の概念を考える。対応する情報理論の普遍的速度歪曲知覚が、近似的な意味で操作可能であることを証明した。
参考スコア（独自算出の注目度）: 31.28856752892628
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the context of lossy compression, Blau & Michaeli (2019) adopt a mathematical notion of perceptual quality and define the information rate-distortion-perception function, generalizing the classical rate-distortion tradeoff. We consider the notion of universal representations in which one may fix an encoder and vary the decoder to achieve any point within a collection of distortion and perception constraints. We prove that the corresponding information-theoretic universal rate-distortion-perception function is operationally achievable in an approximate sense. Under MSE distortion, we show that the entire distortion-perception tradeoff of a Gaussian source can be achieved by a single encoder of the same rate asymptotically. We then characterize the achievable distortion-perception region for a fixed representation in the case of arbitrary distributions, identify conditions under which the aforementioned results continue to hold approximately, and study the case when the rate is not fixed in advance. This motivates the study of practical constructions that are approximately universal across the RDP tradeoff, thereby alleviating the need to design a new encoder for each objective. We provide experimental results on MNIST and SVHN suggesting that on image compression tasks, the operational tradeoffs achieved by machine learning models with a fixed encoder suffer only a small penalty when compared to their variable encoder counterparts.
Abstract（参考訳）: 損失圧縮の文脈において、Blau & Michaeli (2019) は知覚品質の数学的概念を採用し、古典的な速度歪みトレードオフを一般化して情報速度歪み知覚関数を定義する。我々は、エンコーダを固定し、歪みや知覚の制約の集合内の任意の点を達成するためにデコーダを変化させる普遍表現の概念を考える。対応する情報理論の普遍的速度歪み知覚関数が,近似的に動作可能であることを証明した。 mse歪みの下では、ガウス源の歪み受容トレードオフ全体が、漸近的に同じ速度の1つのエンコーダによって達成できることを示す。次に、任意の分布の場合の固定表現に対する達成可能な歪み知覚領域を特徴付けるとともに、上記の結果がほぼ持続する条件を特定し、予め固定されていない場合について検討する。このことは、RDPトレードオフ全体でほぼ普遍的な実践的な構造の研究を動機付け、それぞれの目的のために新しいエンコーダを設計する必要がなくなる。画像圧縮タスクにおいて、固定エンコーダを持つ機械学習モデルによって達成される運用上のトレードオフは、可変エンコーダに比べて少ないペナルティしか得られないことを示唆するMNISTとSVHNの実験結果を示す。

関連論文リスト

Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文参考訳（メタデータ） (2025-04-15T10:42:25Z)
Universal Representations for Classification-enhanced Lossy Compression [3.3838477077773925]
損失圧縮では、圧縮速度と復元歪みの古典的なトレードオフがアルゴリズム設計に導かれる。近年,[19]では, 変形に伴う分類精度を考慮し, 圧縮性能の評価を行った。そこでは,様々な歪みや分類制約にまたがる複数のデコード目的を達成するために,単一のエンコーダを開発するユニバーサル表現について検討する。
論文参考訳（メタデータ） (2025-04-12T00:55:56Z)
Sample what you cant compress [6.24979299238534]
拡散に基づく損失の下で、連続エンコーダとデコーダの学習方法を示す。このアプローチは、GANベースのオートエンコーダと比較して、再構築品質が向上する。また, 得られた表現は, 最先端のGANに基づく損失から得られた表現と比較して, 潜時拡散モデルによりモデル化し易いことを示す。
論文参考訳（メタデータ） (2024-09-04T08:42:42Z)
Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption [57.056311855630916]
本稿では,制御可能な生成画像圧縮フレームワークである制御-GICを提案する。高忠実度および一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。我々は、歴史的符号化された多粒度表現に遡ることができる条件条件付き条件付けを開発する。
論文参考訳（メタデータ） (2024-06-02T14:22:09Z)
Correcting Diffusion-Based Perceptual Image Compression with Privileged End-to-End Decoder [49.01721042973929]
本稿では,特権付きエンド・ツー・エンド・エンド・デコーダ・モデルを用いた拡散型画像圧縮法を提案する。従来の知覚圧縮法と比較して,歪みと知覚の両方において,本手法の優位性を示す実験を行った。
論文参考訳（メタデータ） (2024-04-07T10:57:54Z)
Optimally Controllable Perceptual Lossy Compression [16.208548355509127]
損失圧縮の最近の研究は、歪みと知覚品質が互いに相反していることを示している。異なる知覚品質を得るためには、異なるデコーダをトレーニングする必要がある。任意のD-Pトレードオフを最適に達成できるデコーダは2つしかないという非自明な発見を示す。
論文参考訳（メタデータ） (2022-06-21T02:48:35Z)
Neural Estimation of the Rate-Distortion Function With Applications to Operational Source Coding [25.59334941818991]
損失のあるデータ圧縮スキームを設計する際の根本的な問題は、速度歪み関数と比較してどれだけうまくできるかである。本研究では,大規模な実世界のデータに対して,速度歪み関数を推定する手法について検討する。本稿では, NERDと呼ばれる速度歪み推定器を画像データセットに適用する。
論文参考訳（メタデータ） (2022-04-04T16:06:40Z)
Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文参考訳（メタデータ） (2022-02-09T18:48:02Z)
On Perceptual Lossy Compression: The Cost of Perceptual Reconstruction and An Optimal Training Framework [12.13586501618741]
完全知覚品質を達成するためのコストは、達成可能なMSE歪みの2倍であることを示す。完全知覚制約下で最小のMSE歪みを与えられたビットレートで達成するための新しいトレーニングフレームワークを提案する。
論文参考訳（メタデータ） (2021-06-05T02:53:38Z)
Substitutional Neural Image Compression [48.20906717052056]
置換型ニューラルイメージ圧縮(snic)は、あらゆるニューラルイメージ圧縮モデルを強化する一般的なアプローチである。フレキシブルな歪みメトリックに向けて圧縮性能を高め、単一のモデルインスタンスを使用したビットレート制御を可能にする。
論文参考訳（メタデータ） (2021-05-16T20:53:31Z)
Autoencoding Variational Autoencoder [56.05008520271406]
我々は,この行動が学習表現に与える影響と,自己整合性の概念を導入することでそれを修正する結果について検討する。自己整合性アプローチで訓練されたエンコーダは、敵攻撃による入力の摂動に対して頑健な(無神経な)表現につながることを示す。
論文参考訳（メタデータ） (2020-12-07T14:16:14Z)
The Rate-Distortion-Accuracy Tradeoff: JPEG Case Study [30.84385779593074]
JPEG圧縮標準における量子化テーブルの設計に焦点をあてる。連続的な最適化を通じて、これらのテーブルの新たな最適チューニングを提供する。本報告では,これらのテーブルの簡易かつ簡易な変更による性能向上について報告する。
論文参考訳（メタデータ） (2020-08-03T01:39:01Z)
A Deep Ordinal Distortion Estimation Approach for Distortion Rectification [62.72089758481803]
より高精度なパラメータを効率良く得る新しい歪み補正手法を提案する。本研究では, 局所言語関連推定ネットワークを設計し, 順序歪みを学習し, 現実的な歪み分布を近似する。歪み情報の冗長性を考慮すると,本手法では歪み画像の一部のみを用いて順序方向の歪み推定を行う。
論文参考訳（メタデータ） (2020-07-21T10:03:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。