論文の概要: HDCompression: Hybrid-Diffusion Image Compression for Ultra-Low Bitrates
- arxiv url: http://arxiv.org/abs/2502.07160v2
- Date: Wed, 19 Feb 2025 03:43:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-20 15:43:06.293765
- Title: HDCompression: Hybrid-Diffusion Image Compression for Ultra-Low Bitrates
- Title(参考訳): HD圧縮:超低速度ビットレートのハイブリッド拡散画像圧縮
- Authors: Lei Lu, Yize Li, Yanzhi Wang, Wei Wang, Wei Jiang,
- Abstract要約: ハイブリッド拡散画像圧縮(Hybrid-Diffusion Image Compression、HDCompression)は、VQモデルと拡散モデルの両方を利用するデュアルストリームフレームワークである。
実験の結果,HDCompression は従来の lic, 生成型VQ-modeling, およびハイブリッドフレームワークよりも優れていた。
- 参考スコア(独自算出の注目度): 35.28538714213459
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image compression under ultra-low bitrates remains challenging for both conventional learned image compression (LIC) and generative vector-quantized (VQ) modeling. Conventional LIC suffers from severe artifacts due to heavy quantization, while generative VQ modeling gives poor fidelity due to the mismatch between learned generative priors and specific inputs. In this work, we propose Hybrid-Diffusion Image Compression (HDCompression), a dual-stream framework that utilizes both generative VQ-modeling and diffusion models, as well as conventional LIC, to achieve both high fidelity and high perceptual quality. Different from previous hybrid methods that directly use pre-trained LIC models to generate low-quality fidelity-preserving information from heavily quantized latent, we use diffusion models to extract high-quality complimentary fidelity information from the ground-truth input, which can enhance the system performance in several aspects: improving indices map prediction, enhancing the fidelity-preserving output of the LIC stream, and refining conditioned image reconstruction with VQ-latent correction. In addition, our diffusion model is based on a dense representative vector (DRV), which is lightweight with very simple sampling schedulers. Extensive experiments demonstrate that our HDCompression outperforms the previous conventional LIC, generative VQ-modeling, and hybrid frameworks in both quantitative metrics and qualitative visualization, providing balanced robust compression performance at ultra-low bitrates.
- Abstract(参考訳): 超低ビットレートでの画像圧縮は、従来の学習画像圧縮(lic)と生成ベクトル量子化(VQ)モデリングの両方において困難である。
一方、生成VQモデリングは、学習された生成前と特定の入力とのミスマッチにより、忠実度が低下する。
本稿では,VQモデルと拡散モデルの両方を利用する2重ストリームフレームワークであるHybrid-Diffusion Image Compression(HDCompression)を提案する。
事前学習したlicモデルを直接使用して高量子化潜水から低品質のフィデリティ保存情報を生成する従来のハイブリッド手法とは異なり、拡散モデルを用いて高品質な補完フィデリティ情報を接地トラス入力から抽出し、インデックスマップ予測の改善、licストリームのフィデリティ保存出力の向上、VQ遅延補正による条件付き画像再構成などのシステム性能を向上させることができる。
さらに,この拡散モデルは,非常に単純なサンプリングスケジューラで軽量な高密度代表ベクトル(DRV)に基づいている。
広汎な実験により,HDCompressionは,従来の標準,生成型VQモデリング,ハイブリッドフレームワークにおいて,定量化と定性的可視化の両方において優れた性能を示し,超低ビットレートでのロバスト圧縮性能を実現している。
関連論文リスト
- HPGN: Hybrid Priors-Guided Network for Compressed Low-Light Image Enhancement [5.93853008544606]
圧縮低照度画像を改善するために,HPGN(Hybrid priors-guided Network)を提案する。
提案手法では、JPEG品質係数(QF)とDCT量子化行列(QM)をフル活用して、効率的なジョイントタスクプラグアンドプレイモジュールの設計を指導する。
論文 参考訳(メタデータ) (2025-04-03T08:06:24Z) - Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - Progressive Compression with Universally Quantized Diffusion Models [35.199627388957566]
プログレッシブコーディングのための拡散モデルの可能性を探り、インクリメンタルに伝送および復号化が可能なビット列を導出する。
ガウス拡散モデルや条件付き拡散モデルに基づく先行研究とは異なり、前処理における一様雑音を伴う新しい拡散モデルを提案する。
画像圧縮において有望な第一結果が得られ、単一のモデルで幅広いビットレートで競合速度歪みとレートリアリズムが達成される。
論文 参考訳(メタデータ) (2024-12-14T19:06:01Z) - High Frequency Matters: Uncertainty Guided Image Compression with Wavelet Diffusion [35.168244436206685]
ウェーブレット拡散(UGDiff)を用いた不確実性誘導画像圧縮手法を提案する。
本稿では,ウェーブレット変換による高周波圧縮に着目した。
2つのベンチマークデータセットに関する総合的な実験は、UGDiffの有効性を検証する。
論文 参考訳(メタデータ) (2024-07-17T13:21:31Z) - Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption [52.82508784748278]
本稿では,制御生成画像圧縮フレームワークである制御-GICを提案する。
制御-GICは、高忠実度と一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
符号化符号に従って歴史的多粒度表現を検索できる条件デコーダを開発し、条件付き確率の形式化において階層的特徴を再構築する。
論文 参考訳(メタデータ) (2024-06-02T14:22:09Z) - Unifying Generation and Compression: Ultra-low bitrate Image Coding Via
Multi-stage Transformer [35.500720262253054]
本稿では,新しい画像生成圧縮(UIGC)パラダイムを導入し,生成と圧縮のプロセスを統合する。
UIGCフレームワークの重要な特徴は、トークン化にベクトル量子化(VQ)イメージモデルを採用することである。
実験では、既存のコーデックよりも知覚品質と人間の知覚において、提案されたUIGCフレームワークが優れていることを示した。
論文 参考訳(メタデータ) (2024-03-06T14:27:02Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - A Residual Diffusion Model for High Perceptual Quality Codec
Augmentation [1.868930790098705]
拡散確率モデルは最近、高品質の画像とビデオデータの生成において顕著な成功を収めている。
本研究では,この生成モデルに基づいて,高解像度画像の損失圧縮手法を提案する。
拡散確率モデルからのサンプリングは高額であることが知られているが, 圧縮設定では, ステップ数を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2023-01-13T11:27:26Z) - Lossy Image Compression with Conditional Diffusion Models [25.158390422252097]
本稿では,拡散生成モデルを用いた画像圧縮のエンドツーエンド最適化について概説する。
VAEベースのニューラル圧縮とは対照的に、(平均)デコーダは決定論的ニューラルネットワークであり、私たちのデコーダは条件付き拡散モデルである。
提案手法では,GANモデルよりもFIDスコアが強く,VAEモデルとの競合性能も高い。
論文 参考訳(メタデータ) (2022-09-14T21:53:27Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Early Exit or Not: Resource-Efficient Blind Quality Enhancement for
Compressed Images [54.40852143927333]
ロスシー画像圧縮は、通信帯域を節約するために広範に行われ、望ましくない圧縮アーティファクトをもたらす。
圧縮画像に対する資源効率の高いブラインド品質向上手法(RBQE)を提案する。
提案手法は, 評価された画像の品質に応じて, 自動的にエンハンスメントを終了するか, 継続するかを決定することができる。
論文 参考訳(メタデータ) (2020-06-30T07:38:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。