論文の概要: Differentiable JPEG: The Devil is in the Details
- arxiv url: http://arxiv.org/abs/2309.06978v3
- Date: Thu, 30 Nov 2023 15:23:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-01 23:10:07.017321
- Title: Differentiable JPEG: The Devil is in the Details
- Title(参考訳): JPEGの差別化:悪魔は細部にある
- Authors: Christoph Reich, Biplob Debnath, Deep Patel, Srimat Chakradhar
- Abstract要約: 従来の制限を克服する新しいdiff. JPEGアプローチを提案する。
我々のアプローチは、入力画像、JPEG品質、量子化テーブル、色変換パラメータなど、微分可能である。
提案したdiff. JPEGは(非diff.)参照実装に最もよく似ており、最近のbest diff.アプローチを平均$3.47$dB (PSNR) で大幅に上回っている。
- 参考スコア(独自算出の注目度): 2.246961121930528
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: JPEG remains one of the most widespread lossy image coding methods. However,
the non-differentiable nature of JPEG restricts the application in deep
learning pipelines. Several differentiable approximations of JPEG have recently
been proposed to address this issue. This paper conducts a comprehensive review
of existing diff. JPEG approaches and identifies critical details that have
been missed by previous methods. To this end, we propose a novel diff. JPEG
approach, overcoming previous limitations. Our approach is differentiable
w.r.t. the input image, the JPEG quality, the quantization tables, and the
color conversion parameters. We evaluate the forward and backward performance
of our diff. JPEG approach against existing methods. Additionally, extensive
ablations are performed to evaluate crucial design choices. Our proposed diff.
JPEG resembles the (non-diff.) reference implementation best, significantly
surpassing the recent-best diff. approach by $3.47$dB (PSNR) on average. For
strong compression rates, we can even improve PSNR by $9.51$dB. Strong
adversarial attack results are yielded by our diff. JPEG, demonstrating the
effective gradient approximation. Our code is available at
https://github.com/necla-ml/Diff-JPEG.
- Abstract(参考訳): jpegは最も広く普及している画像符号化方法の1つである。
しかしながら、jpegの非微分性は、ディープラーニングパイプラインのアプリケーションを制限する。
JPEGのいくつかの異なる近似がこの問題に対処するために最近提案されている。
本稿では既存の差分を包括的に検討する。
JPEGは従来の方法で見逃された重要な詳細にアプローチし、識別する。
この目的のために、我々は新しい差分を提案する。
JPEGアプローチは、以前の制限を克服する。
我々のアプローチは、入力画像、jpeg品質、量子化テーブル、色変換パラメータを微分可能なw.r.tである。
我々は差分の前方および後方のパフォーマンスを評価する。
既存のメソッドに対するJPEGアプローチ。
さらに、重要な設計選択を評価するために広範なアブレーションが行われる。
我々の提案した差分。
JPEGは(非差分)参照実装に最も似ており、近年の差分をはるかに上回っている。
平均$3.47$dB (PSNR) のアプローチ。
強い圧縮率では、PSNRも9.51ドルdB改善できる。
強い敵攻撃の結果は差分によって得られる。
JPEGは、効果的な勾配近似を示す。
私たちのコードはhttps://github.com/necla-ml/Diff-JPEGで公開されています。
関連論文リスト
- JPEG Inspired Deep Learning [4.958744940097937]
精巧なJPEG圧縮は、ディープラーニング(DL)の性能を実際に向上させる
トレーニング可能なJPEG圧縮層で基盤となるDNNアーキテクチャをプリペイドする新しいDLフレームワークであるJPEG-DLを提案する。
論文 参考訳(メタデータ) (2024-10-09T17:23:54Z) - Unified learning-based lossy and lossless JPEG recompression [15.922937139019547]
本稿では,学習量子化テーブルとマルコフ階層型変分オートエンコーダから構成されるJPEG再圧縮フレームワークを提案する。
実験の結果,JPEGが上界に近づくと,任意に低歪みが得られることがわかった。
論文 参考訳(メタデータ) (2023-12-05T12:07:27Z) - Learned Lossless Compression for JPEG via Frequency-Domain Prediction [50.20577108662153]
JPEG画像のロスレス圧縮を学習するための新しいフレームワークを提案する。
周波数領域での学習を可能にするために、DCT係数は暗黙の局所冗長性を利用するためにグループに分割される。
グループ化されたDCT係数のエントロピーモデリングを実現するために、重み付きブロックに基づいてオートエンコーダのようなアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-03-05T13:15:28Z) - High-Perceptual Quality JPEG Decoding via Posterior Sampling [13.238373528922194]
JPEGアーチファクト修正のための異なるパラダイムを提案する。
我々は、圧縮された入力と整合しながら、シャープで詳細で視覚的に再構成された画像を得ることを目指している。
我々のソリューションは、完全な整合性のある入力に対して、多種多様な可塑性かつ高速な再構成を提供する。
論文 参考訳(メタデータ) (2022-11-21T19:47:59Z) - Practical Learned Lossless JPEG Recompression with Multi-Level
Cross-Channel Entropy Model in the DCT Domain [10.655855413391324]
本稿では,DCT領域で動作するディープラーニングに基づくJPEG再圧縮手法を提案する。
実験により,従来のJPEG再圧縮手法と比較して最先端の性能が得られた。
論文 参考訳(メタデータ) (2022-03-30T14:36:13Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Towards Flexible Blind JPEG Artifacts Removal [73.46374658847675]
人工物除去と細部保存のトレードオフを制御するために,適応可能な品質因子を予測できるフレキシブルブラインド畳み込みニューラルネットワーク,すなわちFBCNNを提案する。
提案するFBCNNは,定量的な計測値と視覚的品質の両方の観点から,最先端の手法に対して良好な性能を実現する。
論文 参考訳(メタデータ) (2021-09-29T17:12:10Z) - Towards Robust Data Hiding Against (JPEG) Compression: A
Pseudo-Differentiable Deep Learning Approach [78.05383266222285]
これらの圧縮に対抗できるデータ隠蔽の目標を達成することは、依然としてオープンな課題である。
ディープラーニングはデータの隠蔽に大きな成功を収めていますが、JPEGの非差別化性は、損失のある圧縮に対する堅牢性を改善するための深いパイプラインのトレーニングを困難にしています。
本稿では,上記の制約をすべて一度に解決するための,単純かつ効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-12-30T12:30:09Z) - Learning to Improve Image Compression without Changing the Standard
Decoder [100.32492297717056]
本稿では,標準デコーダによる符号化性能向上のための学習法を提案する。
具体的には、DCT係数の分布を最適化する周波数領域事前編集法を提案する。
JPEGデコーダは変更しないので、広く使われている標準JPEGデコーダで画像を見る際には、我々のアプローチが適用可能である。
論文 参考訳(メタデータ) (2020-09-27T19:24:42Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。