論文の概要: GAN-based Image Compression with Improved RDO Process
- arxiv url: http://arxiv.org/abs/2306.10461v1
- Date: Sun, 18 Jun 2023 03:21:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 20:33:42.162056
- Title: GAN-based Image Compression with Improved RDO Process
- Title(参考訳): 改良されたRDOプロセスによるGAN画像圧縮
- Authors: Fanxin Xia, Jian Jin, Lili Meng, Feng Ding, Huaxiang Zhang
- Abstract要約: 速度歪みの最適化を改良した新しいGANベースの画像圧縮手法を提案する。
これを実現するために、DisTSとMS-SSIMのメトリクスを用いて、色、テクスチャ、構造における知覚的変性を測定する。
提案手法は,既存のGAN法および最先端ハイブリッド(VVC)よりも優れている。
- 参考スコア(独自算出の注目度): 20.00340507091567
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: GAN-based image compression schemes have shown remarkable progress lately due
to their high perceptual quality at low bit rates. However, there are two main
issues, including 1) the reconstructed image perceptual degeneration in color,
texture, and structure as well as 2) the inaccurate entropy model. In this
paper, we present a novel GAN-based image compression approach with improved
rate-distortion optimization (RDO) process. To achieve this, we utilize the
DISTS and MS-SSIM metrics to measure perceptual degeneration in color, texture,
and structure. Besides, we absorb the discretized gaussian-laplacian-logistic
mixture model (GLLMM) for entropy modeling to improve the accuracy in
estimating the probability distributions of the latent representation. During
the evaluation process, instead of evaluating the perceptual quality of the
reconstructed image via IQA metrics, we directly conduct the Mean Opinion Score
(MOS) experiment among different codecs, which fully reflects the actual
perceptual results of humans. Experimental results demonstrate that the
proposed method outperforms the existing GAN-based methods and the
state-of-the-art hybrid codec (i.e., VVC).
- Abstract(参考訳): GANベースの画像圧縮方式は,低ビットレートで高い知覚品質を実現するため,近年顕著な進歩を見せている。
しかし、主な問題として2つある。
1)色,テクスチャ,構造及び構造における再構成画像の知覚的変性
2)不正確なエントロピーモデル。
本稿では、レート歪み最適化(RDO)プロセスを改善した新しいGANベースの画像圧縮手法を提案する。
これを実現するために、DisTSとMS-SSIMのメトリクスを用いて、色、テクスチャ、構造における知覚的変性を測定する。
さらに,エントロピーモデルのための離散ガウス・ラプラシア・ロジスティック混合モデル(gllmm)を吸収し,潜在表現の確率分布の推定精度を向上させる。
評価過程において, iqaメトリクスを用いて再構成画像の知覚品質を評価する代わりに, ヒトの知覚結果を完全に反映する異なるコーデック間の平均評価スコア(mos)実験を直接実施する。
実験の結果,提案手法は既存のGAN法と最先端のハイブリッドコーデック(VVC)よりも優れていた。
関連論文リスト
- Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - DiffSCI: Zero-Shot Snapshot Compressive Imaging via Iterative Spectral
Diffusion Model [18.25548360119976]
マルチスペクトル画像(MSI)におけるスナップショット圧縮画像(SCI)再構成の精度向上を目指した。
DiffSCIと呼ばれる新しいゼロショット拡散モデルを提案する。
我々は,DiffSCIが自己監督的,ゼロショット的アプローチよりも顕著な性能向上を示すことを示すため,広範囲な試験を行った。
論文 参考訳(メタデータ) (2023-11-19T20:27:14Z) - ARNIQA: Learning Distortion Manifold for Image Quality Assessment [28.773037051085318]
No-Reference Image Quality Assessment (NR-IQA) は、高品質な参照画像を必要としない、人間の知覚に合わせて画像品質を測定する手法を開発することを目的としている。
本研究では、画像歪み多様体をモデル化し、本質的な表現を得るための自己教師型アプローチ ARNIQA を提案する。
論文 参考訳(メタデータ) (2023-10-20T17:22:25Z) - ACDMSR: Accelerated Conditional Diffusion Models for Single Image
Super-Resolution [84.73658185158222]
本稿では,ACDMSRと呼ばれる拡散モデルに基づく超解像法を提案する。
提案手法は, 決定論的反復分解過程を通じて超解像を行うために, 標準拡散モデルに適応する。
提案手法は,低解像度画像に対してより視覚的に現実的な表現を生成し,現実的なシナリオにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2023-07-03T06:49:04Z) - SAR Despeckling using a Denoising Diffusion Probabilistic Model [52.25981472415249]
スペックルの存在は画像品質を劣化させ、SAR画像理解アプリケーションの性能に悪影響を及ぼす。
本稿では,SAR脱種のための拡散確率モデルであるSAR-DDPMを紹介する。
提案手法は, 最先端の切り離し法と比較して, 定量化と定性化の両面で有意な改善を実現している。
論文 参考訳(メタデータ) (2022-06-09T14:00:26Z) - Perceptual Image Restoration with High-Quality Priori and Degradation
Learning [28.93489249639681]
本モデルは,復元画像と劣化画像の類似度を測定するのに有効であることを示す。
同時修復・拡張フレームワークは,実世界の複雑な分解型によく一般化する。
論文 参考訳(メタデータ) (2021-03-04T13:19:50Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - Perceptually Optimizing Deep Image Compression [53.705543593594285]
平均二乗誤差(MSE)と$ell_p$ノルムは、ニューラルネットワークの損失の測定で大きく支配されている。
本稿では,定量的知覚モデルに対して,画像解析ネットワークを最適化するための異なるプロキシ手法を提案する。
論文 参考訳(メタデータ) (2020-07-03T14:33:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。