Fugu-MT 論文翻訳(概要): Single-step Diffusion for Image Compression at Ultra-Low Bitrates

論文の概要: Single-step Diffusion for Image Compression at Ultra-Low Bitrates

arxiv url: http://arxiv.org/abs/2506.16572v2
Date: Mon, 22 Sep 2025 12:02:52 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-23 18:58:15.654082
Title: Single-step Diffusion for Image Compression at Ultra-Low Bitrates
Title（参考訳）: 超低ビットレートにおける画像圧縮のための単一ステップ拡散
Authors: Chanung Park, Joo Chan Lee, Jong Hwan Ko,
Abstract要約: 超低速度で高い知覚品質と高速デコードを実現する画像圧縮のための単一ステップ拡散モデルを提案する。このアプローチには2つの重要なイノベーションが含まれている。 (i) ベクトル量子残留(VQ-Residual)トレーニング。圧縮性能は最先端の手法に匹敵し,デコード速度を約50倍向上させる。
参考スコア（独自算出の注目度）: 19.76457078979179
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Although there have been significant advancements in image compression techniques, such as standard and learned codecs, these methods still suffer from severe quality degradation at extremely low bits per pixel. While recent diffusion-based models provided enhanced generative performance at low bitrates, they often yields limited perceptual quality and prohibitive decoding latency due to multiple denoising steps. In this paper, we propose the single-step diffusion model for image compression that delivers high perceptual quality and fast decoding at ultra-low bitrates. Our approach incorporates two key innovations: (i) Vector-Quantized Residual (VQ-Residual) training, which factorizes a structural base code and a learned residual in latent space, capturing both global geometry and high-frequency details; and (ii) rate-aware noise modulation, which tunes denoising strength to match the desired bitrate. Extensive experiments show that ours achieves comparable compression performance to state-of-the-art methods while improving decoding speed by about 50x compared to prior diffusion-based methods, greatly enhancing the practicality of generative codecs.
Abstract（参考訳）: 標準コーデックや学習コーデックなどの画像圧縮技術には大きな進歩があったが、これらの手法は1ピクセルあたりの超低ビットで深刻な品質劣化に悩まされている。近年の拡散モデルでは、低ビットレートで生成性能が向上しているが、複数のデノナイジングステップによって知覚品質が制限され、復号遅延が禁じられている場合が多い。本稿では,超低ビットレートで高い知覚品質と高速デコードを実現する画像圧縮のための単一ステップ拡散モデルを提案する。私たちのアプローチには2つの重要なイノベーションがあります。一構造ベースコード及び学習残差を潜在空間に分解し、大域的幾何と高周波的詳細の両方を捉えたベクトル量子残留(VQ残留)訓練 (II)所望のビットレートに合うように強みを調整したレートアウェアノイズ変調。その結果,従来の拡散法に比べてデコード速度を約50倍向上させ,生成コーデックの実用性を大幅に向上させることができた。

関連論文リスト

One-Step Diffusion for Perceptual Image Compression [5.566830428533433]
拡散に基づく画像圧縮法は, 高い知覚品質を低速で実現し, 顕著な進歩を遂げた。しかし、彼らの実践的なデプロイメントは、大きな推論遅延と重い計算オーバーヘッドによって妨げられている。本稿では,単段階拡散プロセスのみを必要とする拡散に基づく画像圧縮手法を提案し,推論速度を大幅に向上させる。
論文参考訳（メタデータ） (2026-02-02T03:04:08Z)
Ultra-Low Bitrate Perceptual Image Compression with Shallow Encoder [41.0853762937392]
本稿では, シンプルさとデコード品質を同時に符号化する非対称なエクストリーム画像圧縮(AEIC)フレームワークを提案する。 AEICは中程度のあるいは浅いエンコーダネットワークを使用し、一方の拡散デコーダを利用して高忠実性と高現実性を維持する。 AEICは、Ultra-lowsでのレート歪み知覚性能の既存の手法よりも優れているだけでなく、1080Pの入力画像上で35.8FPSの符号化効率も優れていることを示した。
論文参考訳（メタデータ） (2025-12-13T07:59:48Z)
Turbo-DDCM: Fast and Flexible Zero-Shot Diffusion-Based Image Compression [54.1069581766925]
本稿では,既存の手法よりも高速に動作する効率的なゼロショット拡散圧縮法を提案する。提案手法は,最近提案されたDenoising Diffusion Codebook Models (DDCM) 圧縮方式に基づいている。ユーザが指定した領域を優先する優先度対応型であるTurbo-DDCMと、ターゲットのBPPではなくターゲットのPSNRに基づいて画像を圧縮する歪み制御型である。
論文参考訳（メタデータ） (2025-11-09T15:41:27Z)
Steering One-Step Diffusion Model with Fidelity-Rich Decoder for Fast Image Compression [36.10674664089876]
SODECは単一ステップ拡散に基づく画像圧縮モデルである。遺伝子前駆体への過度な依存から生じる忠実性を改善する。既存の手法よりも優れており、より優れたレート・歪み・知覚性能を実現している。
論文参考訳（メタデータ） (2025-08-07T02:24:03Z)
StableCodec: Taming One-Step Diffusion for Extreme Image Compression [19.69733852050049]
拡散に基づく画像圧縮は、高いリアリズムで超低符号化(1ピクセルあたり0.05ビット未満)を達成するという驚くべき可能性を示している。現在のアプローチでは、極端な制約の下で現実的な結果を生成するために、デコーダの多数のデノナイズステップが必要となる。本稿では,高忠実度・高現実性画像圧縮のための一段階拡散を可能にするStableCodecを紹介する。
論文参考訳（メタデータ） (2025-06-27T07:39:21Z)
Generative Latent Coding for Ultra-Low Bitrate Image and Video Compression [61.500904231491596]
画像圧縮とビデオ圧縮のほとんどの手法は、画素空間における変換符号化を行い、冗長性を低減する。画像とビデオの圧縮, GLCイメージ, GLC-Video のための textbfGenerative textbfLatent textbfGLC (textbfGLC) モデルを提案する。
論文参考訳（メタデータ） (2025-05-22T03:31:33Z)
OSCAR: One-Step Diffusion Codec for Image Compression Across Multiple Bit-rates [52.65036099944483]
事前訓練された潜伏拡散モデルでは、画像圧縮が失われる可能性が強い。既存の手法のほとんどは、ランダムノイズから反復的にデノイングすることで、イメージを再構成する。我々はOSCARと呼ばれる複数のビットレートにまたがる1ステップ拡散を提案する。
論文参考訳（メタデータ） (2025-05-22T00:14:12Z)
Higher fidelity perceptual image and video compression with a latent conditioned residual denoising diffusion model [55.2480439325792]
本稿では,認知品質に最適化されたハイブリッド圧縮方式を提案し,CDCモデルのアプローチをデコーダネットワークで拡張する。 CDCと比較した場合,LPIPSとFIDの知覚スコアを比較検討しながら,最大2dBPSNRの忠実度向上を実現した。
論文参考訳（メタデータ） (2025-05-19T14:13:14Z)
DDT: Decoupled Diffusion Transformer [51.84206763079382]
拡散変換器はノイズの多い入力を符号化し、意味成分を抽出し、同じモジュールで高い周波数をデコードする。 textbfcolorddtDecoupled textbfcolorddtTransformer(textbfcolorddtDDT) textbfcolorddtTransformer(textbfcolorddtDDT) textbfcolorddtTransformer(textbfcolorddtDDT)
論文参考訳（メタデータ） (2025-04-08T07:17:45Z)
Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文参考訳（メタデータ） (2025-03-27T09:08:39Z)
Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文参考訳（メタデータ） (2024-05-10T09:18:17Z)
HybridFlow: Infusing Continuity into Masked Codebook for Extreme Low-Bitrate Image Compression [51.04820313355164]
HyrbidFlowは、連続的な機能ベースのストリームとコードブックベースのストリームを組み合わせることで、極めて低い条件下で高い知覚品質と高い忠実性を実現する。実験の結果、超低速で複数のデータセットにまたがる優れた性能が示された。
論文参考訳（メタデータ） (2024-04-20T13:19:08Z)
Enhancing the Rate-Distortion-Perception Flexibility of Learned Image Codecs with Conditional Diffusion Decoders [7.485128109817576]
本研究では,デコーダとして使用する場合,条件拡散モデルが生成圧縮タスクにおいて有望な結果をもたらすことを示す。本稿では,デコーダとして使用する場合,条件拡散モデルが生成圧縮タスクにおいて有望な結果をもたらすことを示す。
論文参考訳（メタデータ） (2024-03-05T11:48:35Z)
Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。 VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文参考訳（メタデータ） (2023-07-17T06:14:19Z)
Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文参考訳（メタデータ） (2022-01-27T20:20:03Z)
Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文参考訳（メタデータ） (2020-03-25T09:04:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。