論文の概要: One-Step Diffusion for Perceptual Image Compression
- arxiv url: http://arxiv.org/abs/2602.01570v1
- Date: Mon, 02 Feb 2026 03:04:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.859646
- Title: One-Step Diffusion for Perceptual Image Compression
- Title(参考訳): 知覚画像圧縮のためのワンステップ拡散
- Authors: Yiwen Jia, Hao Wei, Yanhui Zhou, Chenyang Ge,
- Abstract要約: 拡散に基づく画像圧縮法は, 高い知覚品質を低速で実現し, 顕著な進歩を遂げた。
しかし、彼らの実践的なデプロイメントは、大きな推論遅延と重い計算オーバーヘッドによって妨げられている。
本稿では,単段階拡散プロセスのみを必要とする拡散に基づく画像圧縮手法を提案し,推論速度を大幅に向上させる。
- 参考スコア(独自算出の注目度): 5.566830428533433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion-based image compression methods have achieved notable progress, delivering high perceptual quality at low bitrates. However, their practical deployment is hindered by significant inference latency and heavy computational overhead, primarily due to the large number of denoising steps required during decoding. To address this problem, we propose a diffusion-based image compression method that requires only a single-step diffusion process, significantly improving inference speed. To enhance the perceptual quality of reconstructed images, we introduce a discriminator that operates on compact feature representations instead of raw pixels, leveraging the fact that features better capture high-level texture and structural details. Experimental results show that our method delivers comparable compression performance while offering a 46$\times$ faster inference speed compared to recent diffusion-based approaches. The source code and models are available at https://github.com/cheesejiang/OSDiff.
- Abstract(参考訳): 拡散に基づく画像圧縮法は顕著な進歩を遂げ、低ビットレートで高い知覚品質を実現する。
しかし、それらの実践的なデプロイメントは、大きな推論遅延と重い計算オーバーヘッドによって妨げられている。
この問題に対処するため,単段階拡散プロセスのみを必要とする拡散画像圧縮手法を提案し,推論速度を大幅に改善する。
再構成画像の知覚的品質を高めるために,高レベルのテクスチャや構造的細部をよりよく捉えることを利用して,原画素の代わりにコンパクトな特徴表現を演算する識別器を導入する。
実験結果から,近年の拡散型手法と比較して46$\times$高速な推論速度が得られた。
ソースコードとモデルはhttps://github.com/cheesejiang/OSDiffで公開されている。
関連論文リスト
- Turbo-DDCM: Fast and Flexible Zero-Shot Diffusion-Based Image Compression [54.1069581766925]
本稿では,既存の手法よりも高速に動作する効率的なゼロショット拡散圧縮法を提案する。
提案手法は,最近提案されたDenoising Diffusion Codebook Models (DDCM) 圧縮方式に基づいている。
ユーザが指定した領域を優先する優先度対応型であるTurbo-DDCMと、ターゲットのBPPではなくターゲットのPSNRに基づいて画像を圧縮する歪み制御型である。
論文 参考訳(メタデータ) (2025-11-09T15:41:27Z) - SODiff: Semantic-Oriented Diffusion Model for JPEG Compression Artifacts Removal [50.90827365790281]
SODiffはJPEGアーティファクト削除のためのセマンティック指向のワンステップ拡散モデルである。
我々の中核的な考え方は、効果的な復元ヒンジは、事前訓練された拡散モデルに対する意味指向的なガイダンスを提供することである。
SAIPEは、低品質(LQ)画像からリッチな特徴を抽出し、テキストエンコーダとセマンティックに整合した埋め込み空間に投影する。
論文 参考訳(メタデータ) (2025-08-10T13:48:07Z) - Steering One-Step Diffusion Model with Fidelity-Rich Decoder for Fast Image Compression [36.10674664089876]
SODECは単一ステップ拡散に基づく画像圧縮モデルである。
遺伝子前駆体への過度な依存から生じる忠実性を改善する。
既存の手法よりも優れており、より優れたレート・歪み・知覚性能を実現している。
論文 参考訳(メタデータ) (2025-08-07T02:24:03Z) - Single-step Diffusion for Image Compression at Ultra-Low Bitrates [19.76457078979179]
超低速度で高い知覚品質と高速デコードを実現する画像圧縮のための単一ステップ拡散モデルを提案する。
このアプローチには2つの重要なイノベーションが含まれている。 (i) ベクトル量子残留(VQ-Residual)トレーニング。
圧縮性能は最先端の手法に匹敵し,デコード速度を約50倍向上させる。
論文 参考訳(メタデータ) (2025-06-19T19:53:27Z) - OSCAR: One-Step Diffusion Codec Across Multiple Bit-rates [39.746866725267516]
事前訓練された潜伏拡散モデルでは、画像圧縮が失われる可能性が強い。
我々はOSCARと呼ばれる複数のビットレートにまたがる1ステップ拡散を提案する。
実験により、OSCARは量的および視覚的品質の指標において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-05-22T00:14:12Z) - Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - Towards Extreme Image Compression with Latent Feature Guidance and Diffusion Prior [8.772652777234315]
本稿では,事前学習した拡散モデルの強力な生成能力を生かした,新しい2段階の極端画像圧縮フレームワークを提案する。
本手法は, 視覚的性能を極端に低め, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-04-29T16:02:38Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。