Fugu-MT 論文翻訳(概要): High Frequency Matters: Uncertainty Guided Image Compression with Wavelet Diffusion

論文の概要: High Frequency Matters: Uncertainty Guided Image Compression with Wavelet Diffusion

arxiv url: http://arxiv.org/abs/2407.12538v1
Date: Wed, 17 Jul 2024 13:21:31 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-18 17:07:03.153031
Title: High Frequency Matters: Uncertainty Guided Image Compression with Wavelet Diffusion
Title（参考訳）: 高周波:ウェーブレット拡散による不確かさ誘導画像圧縮
Authors: Juan Song, Jiaxiang He, Mingtao Feng, Keyan Wang, Yunsong Li, Ajmal Mian,
Abstract要約: ウェーブレット拡散(UGDiff)を用いた不確実性誘導画像圧縮手法を提案する。本稿では,ウェーブレット変換による高周波圧縮に着目した。 2つのベンチマークデータセットに関する総合的な実験は、UGDiffの有効性を検証する。
参考スコア（独自算出の注目度）: 35.168244436206685
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Diffusion probabilistic models have recently achieved remarkable success in generating high-quality images. However, balancing high perceptual quality and low distortion remains challenging in image compression applications. To address this issue, we propose an efficient Uncertainty-Guided image compression approach with wavelet Diffusion (UGDiff). Our approach focuses on high frequency compression via the wavelet transform, since high frequency components are crucial for reconstructing image details. We introduce a wavelet conditional diffusion model for high frequency prediction, followed by a residual codec that compresses and transmits prediction residuals to the decoder. This diffusion prediction-then-residual compression paradigm effectively addresses the low fidelity issue common in direct reconstructions by existing diffusion models. Considering the uncertainty from the random sampling of the diffusion model, we further design an uncertainty-weighted rate-distortion (R-D) loss tailored for residual compression, providing a more rational trade-off between rate and distortion. Comprehensive experiments on two benchmark datasets validate the effectiveness of UGDiff, surpassing state-of-the-art image compression methods in R-D performance, perceptual quality, subjective quality, and inference time. Our code is available at: https://github.com/hejiaxiang1/Wavelet-Diffusion/tree/main
Abstract（参考訳）: 拡散確率モデルは近年,高品質な画像の生成において顕著な成功を収めている。しかし、画像圧縮アプリケーションでは、高い知覚品質と低歪みのバランスが依然として困難である。この問題に対処するために,ウェーブレット拡散(UGDiff)を用いた効率の良い不確実性誘導画像圧縮手法を提案する。本稿では,ウェーブレット変換による高周波圧縮に着目した。本稿では、高周波予測のためのウェーブレット条件拡散モデルを導入し、次いでデコーダに残差を圧縮し送信する残差コーデックを提案する。この拡散予測残差圧縮パラダイムは、既存の拡散モデルによる直接再構成に共通する低忠実度問題に効果的に対処する。拡散モデルのランダムサンプリングからの不確実性を考えると、残留圧縮に適した不確実性重み付き速度歪み(R-D)損失を設計し、速度と歪みのより合理的なトレードオフを与える。 2つのベンチマークデータセットの総合的な実験により、R-Dパフォーマンス、知覚品質、主観的品質、推測時間における最先端の画像圧縮手法を超越したUGDiffの有効性が検証された。私たちのコードは、https://github.com/hejiaxiang1/Wavelet-Diffusion/tree/mainで利用可能です。

関連論文リスト

Towards Efficient Low-rate Image Compression with Frequency-aware Diffusion Prior Refinement [12.819185499129388]
我々はtextbfConsistency Prior textbfRefinement (DiffCR) を用いた Accelerate textbfDiffusion-based Image Compression を提案する。 DiffCRは、効率的かつ高忠実な画像再構成のための新しい圧縮フレームワークである。
論文参考訳（メタデータ） (2026-01-15T13:25:25Z)
SODiff: Semantic-Oriented Diffusion Model for JPEG Compression Artifacts Removal [50.90827365790281]
SODiffはJPEGアーティファクト削除のためのセマンティック指向のワンステップ拡散モデルである。我々の中核的な考え方は、効果的な復元ヒンジは、事前訓練された拡散モデルに対する意味指向的なガイダンスを提供することである。 SAIPEは、低品質(LQ)画像からリッチな特徴を抽出し、テキストエンコーダとセマンティックに整合した埋め込み空間に投影する。
論文参考訳（メタデータ） (2025-08-10T13:48:07Z)
OSCAR: One-Step Diffusion Codec Across Multiple Bit-rates [52.65036099944483]
事前訓練された潜伏拡散モデルでは、画像圧縮が失われる可能性が強い。既存の手法のほとんどは、ランダムノイズから反復的にデノイングすることで、イメージを再構成する。我々はOSCARと呼ばれる複数のビットレートにまたがる1ステップ拡散を提案する。
論文参考訳（メタデータ） (2025-05-22T00:14:12Z)
Higher fidelity perceptual image and video compression with a latent conditioned residual denoising diffusion model [55.2480439325792]
本稿では,認知品質に最適化されたハイブリッド圧縮方式を提案し,CDCモデルのアプローチをデコーダネットワークで拡張する。 CDCと比較した場合,LPIPSとFIDの知覚スコアを比較検討しながら,最大2dBPSNRの忠実度向上を実現した。
論文参考訳（メタデータ） (2025-05-19T14:13:14Z)
Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文参考訳（メタデータ） (2025-03-27T09:08:39Z)
SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文参考訳（メタデータ） (2025-03-16T12:32:11Z)
Diffusion-based Extreme Image Compression with Compressed Feature Initialization [29.277211609920155]
Relay Residual Diffusion Extreme Image Compression (RDEIC)を提案する。まず, 純雑音ではなく, 付加雑音を付加した画像の圧縮潜時特徴を出発点として, 復調過程の不要な初期段階を除去する。提案手法は,最先端の視覚的品質を達成し,既存の拡散に基づく極端画像圧縮手法よりも忠実度と効率性が優れていることを示す。
論文参考訳（メタデータ） (2024-10-03T16:24:20Z)
Correcting Diffusion-Based Perceptual Image Compression with Privileged End-to-End Decoder [49.01721042973929]
本稿では,特権付きエンド・ツー・エンド・エンド・デコーダ・モデルを用いた拡散型画像圧縮法を提案する。従来の知覚圧縮法と比較して,歪みと知覚の両方において,本手法の優位性を示す実験を行った。
論文参考訳（メタデータ） (2024-04-07T10:57:54Z)
End-to-End Optimized Image Compression with the Frequency-Oriented Transform [8.27145506280741]
本稿では,周波数指向変換により最適化された画像圧縮モデルを提案する。このモデルは任意の周波数成分を選択的に伝送することでスケーラブルな符号化を可能にする。次世代標準H.266/VVCを含む従来のコーデックをMS-SSIMで比較した。
論文参考訳（メタデータ） (2024-01-16T08:16:10Z)
Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文参考訳（メタデータ） (2023-06-01T03:08:28Z)
Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。本稿では,階層型統合拡散モデル(HI-Diff)を提案する。人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文参考訳（メタデータ） (2023-05-22T12:18:20Z)
Denoising Diffusion Models for Plug-and-Play Image Restoration [135.6359475784627]
本稿では,従来のプラグアンドプレイ方式を拡散サンプリングフレームワークに統合したDiffPIRを提案する。 DiffPIRは、差別的なガウスのデノイザーに依存するプラグアンドプレイIR法と比較して、拡散モデルの生成能力を継承することが期待されている。
論文参考訳（メタデータ） (2023-05-15T20:24:38Z)
Q-Diffusion: Quantizing Diffusion Models [52.978047249670276]
ポストトレーニング量子化(PTQ)は、他のタスクに対するゴーツー圧縮法であると考えられている。本稿では,一意なマルチステップパイプラインとモデルアーキテクチャに適した新しいPTQ手法を提案する。提案手法は,完全精度の非条件拡散モデルを同等の性能を維持しつつ4ビットに定量化できることを示す。
論文参考訳（メタデータ） (2023-02-08T19:38:59Z)
Lossy Compression with Gaussian Diffusion [28.930398810600504]
非条件拡散生成モデルに基づく新しい損失圧縮手法DiffCについて述べる。エンコーダ変換の欠如にもかかわらず、概念実証を実装し、驚くほどうまく機能することを発見した。流れに基づく再構築は,祖先サンプリングよりも高頻度で3dBのゲインを達成できることを示す。
論文参考訳（メタデータ） (2022-06-17T16:46:31Z)
Learning Scalable $\ell_\infty$-constrained Near-lossless Image Compression via Joint Lossy Image and Residual Compression [118.89112502350177]
本稿では,$ell_infty$-constrained near-lossless image compressionを学習するための新しいフレームワークを提案する。元の残差の学習確率モデルを定量化し、量子化残差の確率モデルを導出する。
論文参考訳（メタデータ） (2021-03-31T11:53:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。