論文の概要: Turbo-DDCM: Fast and Flexible Zero-Shot Diffusion-Based Image Compression
- arxiv url: http://arxiv.org/abs/2511.06424v1
- Date: Sun, 09 Nov 2025 15:41:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.93688
- Title: Turbo-DDCM: Fast and Flexible Zero-Shot Diffusion-Based Image Compression
- Title(参考訳): Turbo-DDCM:高速でフレキシブルなゼロショット拡散画像圧縮
- Authors: Amit Vaisman, Guy Ohayon, Hila Manor, Michael Elad, Tomer Michaeli,
- Abstract要約: 本稿では,既存の手法よりも高速に動作する効率的なゼロショット拡散圧縮法を提案する。
提案手法は,最近提案されたDenoising Diffusion Codebook Models (DDCM) 圧縮方式に基づいている。
ユーザが指定した領域を優先する優先度対応型であるTurbo-DDCMと、ターゲットのBPPではなくターゲットのPSNRに基づいて画像を圧縮する歪み制御型である。
- 参考スコア(独自算出の注目度): 54.1069581766925
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While zero-shot diffusion-based compression methods have seen significant progress in recent years, they remain notoriously slow and computationally demanding. This paper presents an efficient zero-shot diffusion-based compression method that runs substantially faster than existing methods, while maintaining performance that is on par with the state-of-the-art techniques. Our method builds upon the recently proposed Denoising Diffusion Codebook Models (DDCMs) compression scheme. Specifically, DDCM compresses an image by sequentially choosing the diffusion noise vectors from reproducible random codebooks, guiding the denoiser's output to reconstruct the target image. We modify this framework with Turbo-DDCM, which efficiently combines a large number of noise vectors at each denoising step, thereby significantly reducing the number of required denoising operations. This modification is also coupled with an improved encoding protocol. Furthermore, we introduce two flexible variants of Turbo-DDCM, a priority-aware variant that prioritizes user-specified regions and a distortion-controlled variant that compresses an image based on a target PSNR rather than a target BPP. Comprehensive experiments position Turbo-DDCM as a compelling, practical, and flexible image compression scheme.
- Abstract(参考訳): ゼロショット拡散に基づく圧縮法は近年顕著な進歩を遂げているが、それらは依然として遅く、計算的に要求される。
本稿では,最先端技術に匹敵する性能を維持しつつ,既存の手法よりも大幅に高速に動作する効率的なゼロショット拡散圧縮手法を提案する。
提案手法は,最近提案されたDenoising Diffusion Codebook Models (DDCM) 圧縮方式に基づいている。
具体的には、DDCMは、再現可能なランダムコードブックから拡散ノイズベクトルを順次選択して画像を圧縮し、デノイザの出力を誘導して対象画像を再構成する。
このフレームワークをTurbo-DDCMで修正し、各デノナイジングステップで多数のノイズベクトルを効率よく組み合わせ、必要なデノナイジング操作数を著しく削減する。
この修正は、改良された符号化プロトコルと結合される。
さらに,Turbo-DDCMの2つのフレキシブルな変種を導入し,ユーザが指定した領域を優先する優先度対応変種と,ターゲットのBPPではなくターゲットのPSNRに基づいて画像を圧縮する歪み制御変種を紹介する。
総合的な実験により、Turbo-DDCMは魅力的で実用的で柔軟な画像圧縮スキームとして位置づけられる。
関連論文リスト
- Steering One-Step Diffusion Model with Fidelity-Rich Decoder for Fast Image Compression [36.10674664089876]
SODECは単一ステップ拡散に基づく画像圧縮モデルである。
遺伝子前駆体への過度な依存から生じる忠実性を改善する。
既存の手法よりも優れており、より優れたレート・歪み・知覚性能を実現している。
論文 参考訳(メタデータ) (2025-08-07T02:24:03Z) - Single-step Diffusion for Image Compression at Ultra-Low Bitrates [19.76457078979179]
超低速度で高い知覚品質と高速デコードを実現する画像圧縮のための単一ステップ拡散モデルを提案する。
このアプローチには2つの重要なイノベーションが含まれている。 (i) ベクトル量子残留(VQ-Residual)トレーニング。
圧縮性能は最先端の手法に匹敵し,デコード速度を約50倍向上させる。
論文 参考訳(メタデータ) (2025-06-19T19:53:27Z) - Ultra Lowrate Image Compression with Semantic Residual Coding and Compression-aware Diffusion [28.61304513668606]
ResULICは残留誘導型超低レート画像圧縮システムである。
残差信号は意味検索と拡散に基づく生成プロセスの両方に組み込む。
最先端拡散法に比べて客観的・主観的性能に優れる。
論文 参考訳(メタデータ) (2025-05-13T06:51:23Z) - Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - PSC: Posterior Sampling-Based Compression [34.50287066865267]
Posterior Sampling-based Compression (PSC) は、学習前の拡散モデルを唯一のニューラルネットワークコンポーネントとして利用するゼロショット圧縮法である。
PSCは画像に適応した変換を構成する。
我々はPSCの性能が、レート、歪み、知覚品質の点で確立されたトレーニングベースの手法に匹敵することを示した。
論文 参考訳(メタデータ) (2024-07-13T14:24:22Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。