論文の概要: HVQ-CGIC: Enabling Hyperprior Entropy Modeling for VQ-Based Controllable Generative Image Compression
- arxiv url: http://arxiv.org/abs/2512.07192v1
- Date: Mon, 08 Dec 2025 06:10:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.730937
- Title: HVQ-CGIC: Enabling Hyperprior Entropy Modeling for VQ-Based Controllable Generative Image Compression
- Title(参考訳): HVQ-CGIC:VQに基づく制御可能な生成画像圧縮のためのハイパープライアエントロピーモデルの実現
- Authors: Niu Yi, Xu Tianyi, Ma Mingming, Wang Xinkun,
- Abstract要約: VQハイパープライヤに基づく制御可能な生成画像圧縮フレームワークを提案する。
HVQ-CGICは、VQ指標エントロピーモデルにハイパープライアを導入する数学的基礎を厳密に導き出している。
現状のSOTA (State-of-the-art) 生成圧縮法と比較して,RD( rate-distortion) 性能において大きな利点がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative learned image compression methods using Vector Quantization (VQ) have recently shown impressive potential in balancing distortion and perceptual quality. However, these methods typically estimate the entropy of VQ indices using a static, global probability distribution, which fails to adapt to the specific content of each image. This non-adaptive approach leads to untapped bitrate potential and challenges in achieving flexible rate control. To address this challenge, we introduce a Controllable Generative Image Compression framework based on a VQ Hyperprior, termed HVQ-CGIC. HVQ-CGIC rigorously derives the mathematical foundation for introducing a hyperprior to the VQ indices entropy model. Based on this foundation, through novel loss design, to our knowledge, this framework is the first to introduce RD balance and control into vector quantization-based Generative Image Compression. Cooperating with a lightweight hyper-prior estimation network, HVQ-CGIC achieves a significant advantage in rate-distortion (RD) performance compared to current state-of-the-art (SOTA) generative compression methods. On the Kodak dataset, we achieve the same LPIPS as Control-GIC, CDC and HiFiC with an average of 61.3% fewer bits. We posit that HVQ-CGIC has the potential to become a foundational component for VQGAN-based image compression, analogous to the integral role of the HyperPrior framework in neural image compression.
- Abstract(参考訳): ベクトル量子化(VQ)を用いた学習画像圧縮法は近年,歪みと知覚品質のバランスをとる上で,優れた可能性を示している。
しかし、これらの手法は通常、静的な大域的確率分布を用いてVQ指標のエントロピーを推定する。
この非適応的なアプローチは、未解決のビットレートポテンシャルとフレキシブルレート制御の達成に繋がる。
この課題に対処するために,HVQ-CGICと呼ばれるVQハイパープライヤをベースとした,制御可能な生成画像圧縮フレームワークを提案する。
HVQ-CGICは、VQ指標エントロピーモデルにハイパープライアを導入する数学的基礎を厳密に導き出している。
この基盤をベースとして、新しい損失設計を通じて、私たちの知る限り、このフレームワークは、ベクトル量子化に基づく生成画像圧縮にRDバランスと制御を導入する最初のものである。
HVQ-CGICは、軽量な高優先度推定ネットワークと協調して、現在のSOTA(State-of-the-art)生成圧縮法と比較して、RD( rate-distortion)性能において大きな優位性を実現する。
Kodakデータセットでは、コントロール-GIC、CDC、HiFiCと同じLPIPSを平均61.3%のビットで達成している。
我々は、HVQ-CGICが、ニューラル画像圧縮におけるHyperPriorフレームワークの不可欠な役割に類似した、VQGANベースの画像圧縮の基盤となる可能性を持っていると仮定する。
関連論文リスト
- Deeply-Conditioned Image Compression via Self-Generated Priors [75.29511865838812]
我々は,自己生成前駆体(DCIC-sgp)を経由したDeeply-Conditioned Image Compression(Deeply-Conditioned Image Compression)という,機能的分解を前提としたフレームワークを提案する。
我々のフレームワークは、Kodak、CLIC、Tecnickデータセット上のVVCテストモデルVTM-12.1に対して、14.4%、15.7%、および15.1%のBDレートの大幅な削減を実現している。
論文 参考訳(メタデータ) (2025-10-28T14:04:19Z) - Higher fidelity perceptual image and video compression with a latent conditioned residual denoising diffusion model [55.2480439325792]
本稿では,認知品質に最適化されたハイブリッド圧縮方式を提案し,CDCモデルのアプローチをデコーダネットワークで拡張する。
CDCと比較した場合,LPIPSとFIDの知覚スコアを比較検討しながら,最大2dBPSNRの忠実度向上を実現した。
論文 参考訳(メタデータ) (2025-05-19T14:13:14Z) - HDCompression: Hybrid-Diffusion Image Compression for Ultra-Low Bitrates [35.28538714213459]
ハイブリッド拡散画像圧縮(Hybrid-Diffusion Image Compression、HDCompression)は、VQモデルと拡散モデルの両方を利用するデュアルストリームフレームワークである。
実験の結果,HDCompression は従来の lic, 生成型VQ-modeling, およびハイブリッドフレームワークよりも優れていた。
論文 参考訳(メタデータ) (2025-02-11T00:56:44Z) - Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaptation [52.82508784748278]
本稿では,制御生成画像圧縮フレームワークである制御-GICを提案する。
制御-GICは、高忠実度と一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
実験により,制御-GICは高い柔軟かつ制御可能な適応を可能にし,その結果が最近の最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-02T14:22:09Z) - Unifying Generation and Compression: Ultra-low bitrate Image Coding Via
Multi-stage Transformer [35.500720262253054]
本稿では,新しい画像生成圧縮(UIGC)パラダイムを導入し,生成と圧縮のプロセスを統合する。
UIGCフレームワークの重要な特徴は、トークン化にベクトル量子化(VQ)イメージモデルを採用することである。
実験では、既存のコーデックよりも知覚品質と人間の知覚において、提案されたUIGCフレームワークが優れていることを示した。
論文 参考訳(メタデータ) (2024-03-06T14:27:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。