論文の概要: Synonymous Variational Inference for Perceptual Image Compression
- arxiv url: http://arxiv.org/abs/2505.22438v1
- Date: Wed, 28 May 2025 15:03:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.669882
- Title: Synonymous Variational Inference for Perceptual Image Compression
- Title(参考訳): 知覚的画像圧縮のための同義変分推論
- Authors: Zijian Liang, Kai Niu, Changshuo Wang, Jin Xu, Ping Zhang,
- Abstract要約: 本稿では,画像圧縮問題を再解析する同義的変分推論(SVI)手法を提案する。
理想的な同義集合(シンセット)を構築するために、典型的な同義語規準として知覚的類似性を用いる(シンセット)
本稿では,SVIの解析過程に対応する新しい画像圧縮方式を提案する。
- 参考スコア(独自算出の注目度): 9.694218792074693
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent contributions of semantic information theory reveal the set-element relationship between semantic and syntactic information, represented as synonymous relationships. In this paper, we propose a synonymous variational inference (SVI) method based on this synonymity viewpoint to re-analyze the perceptual image compression problem. It takes perceptual similarity as a typical synonymous criterion to build an ideal synonymous set (Synset), and approximate the posterior of its latent synonymous representation with a parametric density by minimizing a partial semantic KL divergence. This analysis theoretically proves that the optimization direction of perception image compression follows a triple tradeoff that can cover the existing rate-distortion-perception schemes. Additionally, we introduce synonymous image compression (SIC), a new image compression scheme that corresponds to the analytical process of SVI, and implement a progressive SIC codec to fully leverage the model's capabilities. Experimental results demonstrate comparable rate-distortion-perception performance using a single progressive SIC codec, thus verifying the effectiveness of our proposed analysis method.
- Abstract(参考訳): 近年のセマンティック・インフォメーション・セマンティック・インフォメーション・セマンティック・インフォメーションのコントリビューションにより,セマンティック・インフォメーションとセマンティック・インフォメーションのセマンティック・エレメントの関係が明らかになった。
本稿では,この同義性視点に基づく同義性変分推論(SVI)手法を提案し,知覚的画像圧縮問題を再解析する。
知覚的類似性(perceptual similarity)は、典型的な同義的基準として、イデアル同義集合(シンセット)を構築し、部分意味的 KL の発散を最小化することにより、その潜在同義的表現の後方をパラメトリック密度で近似する。
この分析は、知覚画像圧縮の最適化方向が、既存の速度歪み知覚スキームをカバーする3つのトレードオフに従うことを理論的に証明している。
さらに、SVIの分析プロセスに対応する新しい画像圧縮方式である同義語画像圧縮(SIC)を導入し、モデル機能を完全に活用するプログレッシブSICコーデックを実装した。
提案手法の有効性を検証するため,SICコーデックを1つのプログレッシブ・SICコーデックを用いて提案手法の有効性を検証した。
関連論文リスト
- Higher fidelity perceptual image and video compression with a latent conditioned residual denoising diffusion model [55.2480439325792]
本稿では,認知品質に最適化されたハイブリッド圧縮方式を提案し,CDCモデルのアプローチをデコーダネットワークで拡張する。
CDCと比較した場合,LPIPSとFIDの知覚スコアを比較検討しながら,最大2dBPSNRの忠実度向上を実現した。
論文 参考訳(メタデータ) (2025-05-19T14:13:14Z) - Ultra Lowrate Image Compression with Semantic Residual Coding and Compression-aware Diffusion [28.61304513668606]
ResULICは残留誘導型超低レート画像圧縮システムである。
残差信号は意味検索と拡散に基づく生成プロセスの両方に組み込む。
最先端拡散法に比べて客観的・主観的性能に優れる。
論文 参考訳(メタデータ) (2025-05-13T06:51:23Z) - Hierarchical Semantic Compression for Consistent Image Semantic Restoration [62.97519327310638]
生成モデルから固有意味空間内で純粋に機能する新しい階層意味圧縮(HSC)フレームワークを提案する。
実験の結果,提案したHSCフレームワークは人間の視力に対する主観的品質と一貫性に関する最先端の性能を実現することが示された。
論文 参考訳(メタデータ) (2025-02-24T03:20:44Z) - A Rate-Distortion-Classification Approach for Lossy Image Compression [0.0]
損失画像圧縮では、画像を特定のビットレートに圧縮しながら、最小限の信号歪みを実現する。
画像圧縮と視覚解析のギャップを埋めるために、損失画像圧縮のためのRDCモデルを提案する。
論文 参考訳(メタデータ) (2024-05-06T14:11:36Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - End-to-End Optimized Image Compression with the Frequency-Oriented
Transform [8.27145506280741]
本稿では,周波数指向変換により最適化された画像圧縮モデルを提案する。
このモデルは任意の周波数成分を選択的に伝送することでスケーラブルな符号化を可能にする。
次世代標準H.266/VVCを含む従来のコーデックをMS-SSIMで比較した。
論文 参考訳(メタデータ) (2024-01-16T08:16:10Z) - Unified Multivariate Gaussian Mixture for Efficient Neural Image
Compression [151.3826781154146]
先行変数と超優先度を持つ潜伏変数は、変動画像圧縮において重要な問題である。
ベクトル化された視点で潜伏変数を観察する際、相関関係や相関関係は存在する。
当社のモデルでは、速度歪曲性能が向上し、圧縮速度が3.18倍に向上した。
論文 参考訳(メタデータ) (2022-03-21T11:44:17Z) - Perceptually Optimizing Deep Image Compression [53.705543593594285]
平均二乗誤差(MSE)と$ell_p$ノルムは、ニューラルネットワークの損失の測定で大きく支配されている。
本稿では,定量的知覚モデルに対して,画像解析ネットワークを最適化するための異なるプロキシ手法を提案する。
論文 参考訳(メタデータ) (2020-07-03T14:33:28Z) - Improving Inference for Neural Image Compression [31.999462074510305]
State-of-the-art method build on Hierarchical variational autoencoders to predict a compressible latent representation of each data point。
従来の手法では性能を制限した3つの近似ギャップを同定する。
本稿では,これら3つの制約のそれぞれについて,反復的推論に関する考え方に基づく対策を提案する。
論文 参考訳(メタデータ) (2020-06-07T19:26:37Z) - Saliency Driven Perceptual Image Compression [6.201592931432016]
画像圧縮技術の性能評価にはMS-SSIMやPSNRなどの評価指標が不十分であることを示す。
画像圧縮に特有な知覚的類似性データに基づいて学習する新しい指標を提案する。
このモデルは視覚的に優れた画像を生成するだけでなく、その後のコンピュータビジョンタスクに優れた性能を与える。
論文 参考訳(メタデータ) (2020-02-12T13:43:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。