論文の概要: A Noise Constrained Diffusion (NC-Diffusion) Framework for High Fidelity Image Compression
- arxiv url: http://arxiv.org/abs/2604.06568v1
- Date: Wed, 08 Apr 2026 01:35:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.289796
- Title: A Noise Constrained Diffusion (NC-Diffusion) Framework for High Fidelity Image Compression
- Title(参考訳): 高忠実度画像圧縮のためのノイズ拘束拡散(NC拡散)フレームワーク
- Authors: Zhenyu Du, Yanbo Gao, Shuai Li, Yiyang Li, Hui Yuan, Mao Ye,
- Abstract要約: 高忠実度画像圧縮のためのノイズ拘束拡散(NC拡散)
NC拡散は、もともと学習画像圧縮に付加された量子化ノイズを拡散の前処理のノイズとして定式化する。
適応周波数領域フィルタリングモジュールは、U-Netベースの拡散アーキテクチャにおけるスキップ接続を強化するために開発された。
- 参考スコア(独自算出の注目度): 21.919751666534395
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the great success of diffusion models in image generation, diffusion-based image compression is attracting increasing interests. However, due to the random noise introduced in the diffusion learning, they usually produce reconstructions with deviation from the original images, leading to suboptimal compression results. To address this problem, in this paper, we propose a Noise Constrained Diffusion (NC-Diffusion) framework for high fidelity image compression. Unlike existing diffusion-based compression methods that add random Gaussian noise and direct the noise into the image space, the proposed NC-Diffusion formulates the quantization noise originally added in the learned image compression as the noise in the forward process of diffusion. Then a noise constrained diffusion process is constructed from the ground-truth image to the initial compression result generated with quantization noise. The NC-Diffusion overcomes the problem of noise mismatch between compression and diffusion, significantly improving the inference efficiency. In addition, an adaptive frequency-domain filtering module is developed to enhance the skip connections in the U-Net based diffusion architecture, in order to enhance high-frequency details. Moreover, a zero-shot sample-guided enhancement method is designed to further improve the fidelity of the image. Experiments on multiple benchmark datasets demonstrate that our method can achieve the best performance compared with existing methods.
- Abstract(参考訳): 画像生成における拡散モデルの成功により、拡散に基づく画像圧縮が関心を集めている。
しかし、拡散学習で生じるランダムノイズのため、通常は元の画像から逸脱して再構成し、最適下圧縮結果をもたらす。
本稿では,高忠実度画像圧縮のためのノイズ制約拡散(NC-Diffusion)フレームワークを提案する。
画像空間にランダムなガウスノイズを加え、ノイズを誘導する既存の拡散ベース圧縮法とは異なり、NC拡散法は、もともと学習画像圧縮に付加された量子化ノイズを拡散の前処理のノイズとして定式化する。
そして、地上構造画像から量子化ノイズで生成された初期圧縮結果に制約付き拡散過程を構築する。
NC拡散は、圧縮と拡散のノイズミスマッチの問題を克服し、推論効率を大幅に改善する。
さらに、U-Netベースの拡散アーキテクチャにおけるスキップ接続を強化するために、適応周波数領域フィルタリングモジュールを開発し、高周波の詳細を強化する。
さらに、画像の忠実度をさらに向上するために、ゼロショットサンプル誘導強調法を設計する。
複数のベンチマークデータセットの実験により,本手法が既存手法と比較して最高の性能を達成できることが実証された。
関連論文リスト
- Higher fidelity perceptual image and video compression with a latent conditioned residual denoising diffusion model [55.2480439325792]
本稿では,認知品質に最適化されたハイブリッド圧縮方式を提案し,CDCモデルのアプローチをデコーダネットワークで拡張する。
CDCと比較した場合,LPIPSとFIDの知覚スコアを比較検討しながら,最大2dBPSNRの忠実度向上を実現した。
論文 参考訳(メタデータ) (2025-05-19T14:13:14Z) - RDEIC: Accelerating Diffusion-Based Extreme Image Compression with Relay Residual Diffusion [29.277211609920155]
Relay Residual Diffusion Extreme Image Compression (RDEIC)を提案する。
まず, 純雑音ではなく, 付加雑音を付加した画像の圧縮潜時特徴を出発点として, 復調過程の不要な初期段階を除去する。
RDEICは、最先端の視覚的品質を実現し、既存の拡散に基づく極端画像圧縮手法よりも忠実さと効率性が優れている。
論文 参考訳(メタデータ) (2024-10-03T16:24:20Z) - High Frequency Matters: Uncertainty Guided Image Compression with Wavelet Diffusion [4.76749587454871]
ウェーブレット拡散(UGDiff)を用いた不確実性誘導画像圧縮手法を提案する。
本稿では,ウェーブレット変換による高周波圧縮に着目した。
2つのベンチマークデータセットに関する総合的な実験は、UGDiffの有効性を検証する。
論文 参考訳(メタデータ) (2024-07-17T13:21:31Z) - NoiseDiffusion: Correcting Noise for Image Interpolation with Diffusion Models beyond Spherical Linear Interpolation [86.7260950382448]
画像の妥当性を補正する新しい手法としてノイズ拡散法を提案する。
NoiseDiffusionはノイズの多い画像空間内で動作し、これらのノイズの多い画像に生画像を注入することで、情報損失の課題に対処する。
論文 参考訳(メタデータ) (2024-03-13T12:32:25Z) - VideoFusion: Decomposed Diffusion Models for High-Quality Video
Generation [88.49030739715701]
本研究は, フレームごとのノイズを, 全フレーム間で共有されるベースノイズ, 時間軸に沿って変化する残雑音に分解することで, 拡散過程を分解する。
様々なデータセットの実験により,ビデオフュージョンと呼ばれる我々の手法が,高品質なビデオ生成において,GANベースと拡散ベースの両方の選択肢を上回ることが確認された。
論文 参考訳(メタデータ) (2023-03-15T02:16:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。