論文の概要: Universal Representations for Classification-enhanced Lossy Compression
- arxiv url: http://arxiv.org/abs/2504.13191v1
- Date: Sat, 12 Apr 2025 00:55:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-28 21:13:07.224994
- Title: Universal Representations for Classification-enhanced Lossy Compression
- Title(参考訳): 分類強化型ロシー圧縮のための普遍表現
- Authors: Nam Nguyen,
- Abstract要約: 損失圧縮では、圧縮速度と復元歪みの古典的なトレードオフがアルゴリズム設計に導かれる。
近年,[19]では, 変形に伴う分類精度を考慮し, 圧縮性能の評価を行った。
そこでは,様々な歪みや分類制約にまたがる複数のデコード目的を達成するために,単一のエンコーダを開発するユニバーサル表現について検討する。
- 参考スコア(独自算出の注目度): 3.3838477077773925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In lossy compression, the classical tradeoff between compression rate and reconstruction distortion has traditionally guided algorithm design. However, Blau and Michaeli [5] introduced a generalized framework, known as the rate-distortion-perception (RDP) function, incorporating perceptual quality as an additional dimension of evaluation. More recently, the rate-distortion-classification (RDC) function was investigated in [19], evaluating compression performance by considering classification accuracy alongside distortion. In this paper, we explore universal representations, where a single encoder is developed to achieve multiple decoding objectives across various distortion and classification (or perception) constraints. This universality avoids retraining encoders for each specific operating point within these tradeoffs. Our experimental validation on the MNIST dataset indicates that a universal encoder incurs only minimal performance degradation compared to individually optimized encoders for perceptual image compression tasks, aligning with prior results from [23]. Nonetheless, we also identify that in the RDC setting, reusing an encoder optimized for one specific classification-distortion tradeoff leads to a significant distortion penalty when applied to alternative points.
- Abstract(参考訳): 損失圧縮では、圧縮率と復元歪みの間の古典的なトレードオフがアルゴリズム設計を導いてきた。
しかし、Blau と Michaeli [5] は、RDP(Ralse-Distortion-Perception)関数として知られる一般化されたフレームワークを導入し、知覚品質を付加的な評価の次元として取り入れた。
近年,[19]では, 変形に伴う分類精度を考慮し, 圧縮性能を評価できるRDC関数が検討されている。
本稿では,様々な歪みや分類(あるいは知覚)の制約にまたがる複数のデコード目的を達成するために,単一のエンコーダを開発するユニバーサル表現について検討する。
この普遍性は、これらのトレードオフの中で特定の操作点ごとにエンコーダを再訓練することを避ける。
MNISTデータセットに対する実験的な検証は, [23] の先行結果と一致して, 個々の画像圧縮タスクに対して最適化されたエンコーダと比較して, ユニバーサルエンコーダは最小限の性能劣化しか生じないことを示す。
それにもかかわらず、RDC設定では、ある特定の分類歪みトレードオフに最適化されたエンコーダを再利用することで、代替点に適用した場合、大きな歪みペナルティが生じる。
関連論文リスト
- Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。
本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。
提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption [52.82508784748278]
本稿では,制御生成画像圧縮フレームワークである制御-GICを提案する。
制御-GICは、高忠実度と一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
符号化符号に従って歴史的多粒度表現を検索できる条件デコーダを開発し、条件付き確率の形式化において階層的特徴を再構築する。
論文 参考訳(メタデータ) (2024-06-02T14:22:09Z) - A Rate-Distortion-Classification Approach for Lossy Image Compression [0.0]
損失画像圧縮では、画像を特定のビットレートに圧縮しながら、最小限の信号歪みを実現する。
画像圧縮と視覚解析のギャップを埋めるために、損失画像圧縮のためのRDCモデルを提案する。
論文 参考訳(メタデータ) (2024-05-06T14:11:36Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Fundamental Limits of Two-layer Autoencoders, and Achieving Them with
Gradient Methods [91.54785981649228]
本稿では,非線形二層型オートエンコーダについて述べる。
本結果は,人口リスクの最小化要因を特徴付け,その最小化要因が勾配法によって達成されることを示す。
符号アクティベーション関数の特別な場合において、この解析は、シャローオートエンコーダによるガウス音源の損失圧縮の基本的な限界を確立する。
論文 参考訳(メタデータ) (2022-12-27T12:37:34Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Universal Rate-Distortion-Perception Representations for Lossy
Compression [31.28856752892628]
我々は、エンコーダを固定し、デコーダを変更して歪みや知覚制約の集合内の任意の点を達成できる普遍表現の概念を考える。
対応する情報理論の普遍的速度歪曲知覚が、近似的な意味で操作可能であることを証明した。
論文 参考訳(メタデータ) (2021-06-18T18:52:08Z) - On Perceptual Lossy Compression: The Cost of Perceptual Reconstruction
and An Optimal Training Framework [12.13586501618741]
完全知覚品質を達成するためのコストは、達成可能なMSE歪みの2倍であることを示す。
完全知覚制約下で最小のMSE歪みを与えられたビットレートで達成するための新しいトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-05T02:53:38Z) - The Rate-Distortion-Accuracy Tradeoff: JPEG Case Study [30.84385779593074]
JPEG圧縮標準における量子化テーブルの設計に焦点をあてる。
連続的な最適化を通じて、これらのテーブルの新たな最適チューニングを提供する。
本報告では,これらのテーブルの簡易かつ簡易な変更による性能向上について報告する。
論文 参考訳(メタデータ) (2020-08-03T01:39:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。