論文の概要: Improving Multi-generation Robustness of Learned Image Compression
- arxiv url: http://arxiv.org/abs/2210.17039v1
- Date: Mon, 31 Oct 2022 03:26:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 18:56:13.853776
- Title: Improving Multi-generation Robustness of Learned Image Compression
- Title(参考訳): 学習画像圧縮の多世代ロバスト性向上
- Authors: Litian Li, Zheng Yang, Ronggang Wang
- Abstract要約: ネットワーク構造を変更せずに50回再符号化しても,BPGの最初の圧縮に匹敵する性能が得られることを示す。
- 参考スコア(独自算出の注目度): 16.86614420872084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Benefit from flexible network designs and end-to-end joint optimization
approach, learned image compression (LIC) has demonstrated excellent coding
performance and practical feasibility in recent years. However, existing
compression models suffer from serious multi-generation loss, which always
occurs during image editing and transcoding. During the process of repeatedly
encoding and decoding, the quality of the image will rapidly degrade, resulting
in various types of distortion, which significantly limits the practical
application of LIC. In this paper, a thorough analysis is carried out to
determine the source of generative loss in successive image compression (SIC).
We point out and solve the quantization drift problem that affects SIC,
reversibility loss function as well as channel relaxation method are proposed
to further reduce the generation loss. Experiments show that by using our
proposed solutions, LIC can achieve comparable performance to the first
compression of BPG even after 50 times reencoding without any change of the
network structure.
- Abstract(参考訳): 近年,フレキシブルネットワーク設計とエンドツーエンド共同最適化アプローチの恩恵により,学習画像圧縮(lic)は優れた符号化性能と実用的な実現可能性を示した。
しかし、既存の圧縮モデルは、画像編集やトランスコーディング中に常に発生する深刻なマルチジェネレーションの損失に苦しむ。
繰り返し符号化と復号を行う過程において、画像の品質は急速に低下し、様々な種類の歪みが生じ、licの実用的利用が著しく制限される。
本稿では,連続画像圧縮(sic)における生成損失の発生源を決定するために,詳細な解析を行う。
本研究では,sicに影響を与える量子化ドリフト問題を指摘・解決し,再生可能性損失関数とチャネル緩和関数を用いて,発生損失を更に低減する手法を提案する。
実験により,提案手法を用いることで,ネットワーク構造の変化を伴わずに50回再符号化しても,BPGの最初の圧縮に匹敵する性能が得られることが示された。
関連論文リスト
- Rate-Distortion-Cognition Controllable Versatile Neural Image Compression [47.72668401825835]
速度歪み認識制御可能な多目的画像圧縮法を提案する。
本手法は, 良好なICM性能とフレキシブルレート・ディストーション・コグニテーション制御を実現する。
論文 参考訳(メタデータ) (2024-07-16T13:17:51Z) - Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption [57.056311855630916]
本稿では,制御可能な生成画像圧縮フレームワークである制御-GICを提案する。
高忠実度および一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
我々は、歴史的符号化された多粒度表現に遡ることができる条件条件付き条件付けを開発する。
論文 参考訳(メタデータ) (2024-06-02T14:22:09Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - VCISR: Blind Single Image Super-Resolution with Video Compression
Synthetic Data [18.877077302923713]
本稿では,映像圧縮に基づく劣化モデルを用いて,ブラインドSISRタスクにおける低解像度画像データを合成する。
提案手法は既存の画像データセットに適用可能である。
SISR分解モデルにビデオ符号化アーティファクトを導入することで、ニューラルネットワークは、ビデオ圧縮劣化を復元する機能を備えた、画像の超解凍を可能にする。
論文 参考訳(メタデータ) (2023-11-02T05:24:19Z) - Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文 参考訳(メタデータ) (2023-07-17T06:14:19Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Modeling Image Quantization Tradeoffs for Optimal Compression [0.0]
ロスシー圧縮アルゴリズムは、圧縮率を上げるために高周波データを定量化することでトレードオフを狙う。
本稿では,Deep Learningとminimax損失関数を用いた量子化テーブルの最適化手法を提案する。
論文 参考訳(メタデータ) (2021-12-14T07:35:22Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Learning Better Lossless Compression Using Lossy Compression [100.50156325096611]
我々は、ロスレス画像圧縮システムを構築するために、強力なロスレス画像圧縮アルゴリズムであるBPGを利用する。
我々は,BPG再構成を条件とした畳み込みニューラルネットワークに基づく確率モデルを用いて,残差分布をモデル化する。
そして、この画像は、BPGが生成したビットストリームと学習した残留コーダの連結を用いて保存される。
論文 参考訳(メタデータ) (2020-03-23T11:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。