論文の概要: HDCompression: Hybrid-Diffusion Image Compression for Ultra-Low Bitrates
- arxiv url: http://arxiv.org/abs/2502.07160v1
- Date: Tue, 11 Feb 2025 00:56:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 14:06:36.826061
- Title: HDCompression: Hybrid-Diffusion Image Compression for Ultra-Low Bitrates
- Title(参考訳): HD圧縮:超低速度ビットレートのハイブリッド拡散画像圧縮
- Authors: Lei Lu, Yize Li, Yanzhi Wang, Wei Wang, Wei Jiang,
- Abstract要約: ハイブリッド拡散画像圧縮(Hybrid-Diffusion Image Compression、HDCompression)は、VQモデルと拡散モデルの両方を利用するデュアルストリームフレームワークである。
実験の結果,HDCompression は従来の lic, 生成型VQ-modeling, およびハイブリッドフレームワークよりも優れていた。
- 参考スコア(独自算出の注目度): 35.28538714213459
- License:
- Abstract: Image compression under ultra-low bitrates remains challenging for both conventional learned image compression (LIC) and generative vector-quantized (VQ) modeling. Conventional LIC suffers from severe artifacts due to heavy quantization, while generative VQ modeling gives poor fidelity due to the mismatch between learned generative priors and specific inputs. In this work, we propose Hybrid-Diffusion Image Compression (HDCompression), a dual-stream framework that utilizes both generative VQ-modeling and diffusion models, as well as conventional LIC, to achieve both high fidelity and high perceptual quality. Different from previous hybrid methods that directly use pre-trained LIC models to generate low-quality fidelity-preserving information from heavily quantized latent, we use diffusion models to extract high-quality complimentary fidelity information from the ground-truth input, which can enhance the system performance in several aspects: improving indices map prediction, enhancing the fidelity-preserving output of the LIC stream, and refining conditioned image reconstruction with VQ-latent correction. In addition, our diffusion model is based on a dense representative vector (DRV), which is lightweight with very simple sampling schedulers. Extensive experiments demonstrate that our HDCompression outperforms the previous conventional LIC, generative VQ-modeling, and hybrid frameworks in both quantitative metrics and qualitative visualization, providing balanced robust compression performance at ultra-low bitrates.
- Abstract(参考訳): 超低ビットレートでの画像圧縮は、従来の学習画像圧縮(lic)と生成ベクトル量子化(VQ)モデリングの両方において困難である。
一方、生成VQモデリングは、学習された生成前と特定の入力とのミスマッチにより、忠実度が低下する。
本稿では,VQモデルと拡散モデルの両方を利用する2重ストリームフレームワークであるHybrid-Diffusion Image Compression(HDCompression)を提案する。
事前学習したlicモデルを直接使用して高量子化潜水から低品質のフィデリティ保存情報を生成する従来のハイブリッド手法とは異なり、拡散モデルを用いて高品質な補完フィデリティ情報を接地トラス入力から抽出し、インデックスマップ予測の改善、licストリームのフィデリティ保存出力の向上、VQ遅延補正による条件付き画像再構成などのシステム性能を向上させることができる。
さらに,この拡散モデルは,非常に単純なサンプリングスケジューラで軽量な高密度代表ベクトル(DRV)に基づいている。
広汎な実験により,HDCompressionは,従来の標準,生成型VQモデリング,ハイブリッドフレームワークにおいて,定量化と定性的可視化の両方において優れた性能を示し,超低ビットレートでのロバスト圧縮性能を実現している。
関連論文リスト
- Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis [62.06970466554273]
本稿では,非自己回帰型マスク画像モデリング(MIM)をSDXLのような最先端拡散モデルに匹敵するレベルまで高めるMeissonicを提案する。
高品質なトレーニングデータを活用し、人間の嗜好スコアから得られるマイクロ条件を統合し、特徴圧縮層を用いる。
我々のモデルは、高画質の高精細画像を生成する際に、SDXLのような既存のモデルに適合するだけでなく、しばしば性能を上回ります。
論文 参考訳(メタデータ) (2024-10-10T17:59:17Z) - High Frequency Matters: Uncertainty Guided Image Compression with Wavelet Diffusion [35.168244436206685]
ウェーブレット拡散(UGDiff)を用いた不確実性誘導画像圧縮手法を提案する。
本稿では,ウェーブレット変換による高周波圧縮に着目した。
2つのベンチマークデータセットに関する総合的な実験は、UGDiffの有効性を検証する。
論文 参考訳(メタデータ) (2024-07-17T13:21:31Z) - Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption [52.82508784748278]
本稿では,制御生成画像圧縮フレームワークである制御-GICを提案する。
制御-GICは、高忠実度と一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
符号化符号に従って歴史的多粒度表現を検索できる条件デコーダを開発し、条件付き確率の形式化において階層的特徴を再構築する。
論文 参考訳(メタデータ) (2024-06-02T14:22:09Z) - Unifying Generation and Compression: Ultra-low bitrate Image Coding Via
Multi-stage Transformer [35.500720262253054]
本稿では,新しい画像生成圧縮(UIGC)パラダイムを導入し,生成と圧縮のプロセスを統合する。
UIGCフレームワークの重要な特徴は、トークン化にベクトル量子化(VQ)イメージモデルを採用することである。
実験では、既存のコーデックよりも知覚品質と人間の知覚において、提案されたUIGCフレームワークが優れていることを示した。
論文 参考訳(メタデータ) (2024-03-06T14:27:02Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - A Residual Diffusion Model for High Perceptual Quality Codec
Augmentation [1.868930790098705]
拡散確率モデルは最近、高品質の画像とビデオデータの生成において顕著な成功を収めている。
本研究では,この生成モデルに基づいて,高解像度画像の損失圧縮手法を提案する。
拡散確率モデルからのサンプリングは高額であることが知られているが, 圧縮設定では, ステップ数を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2023-01-13T11:27:26Z) - High-Fidelity Variable-Rate Image Compression via Invertible Activation
Transformation [24.379052026260034]
Invertible Activation Transformation (IAT) モジュールを提案する。
IATとQLevelは、画像圧縮モデルに、画像の忠実さを良く保ちながら、細かな可変レート制御能力を与える。
提案手法は,特に複数再符号化後に,最先端の可変レート画像圧縮法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2022-09-12T07:14:07Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Early Exit or Not: Resource-Efficient Blind Quality Enhancement for
Compressed Images [54.40852143927333]
ロスシー画像圧縮は、通信帯域を節約するために広範に行われ、望ましくない圧縮アーティファクトをもたらす。
圧縮画像に対する資源効率の高いブラインド品質向上手法(RBQE)を提案する。
提案手法は, 評価された画像の品質に応じて, 自動的にエンハンスメントを終了するか, 継続するかを決定することができる。
論文 参考訳(メタデータ) (2020-06-30T07:38:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。