論文の概要: Generalized Denoising Diffusion Codebook Models (gDDCM): Tokenizing images using a pre-trained diffusion model
- arxiv url: http://arxiv.org/abs/2511.13387v2
- Date: Tue, 18 Nov 2025 04:36:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 13:59:16.88997
- Title: Generalized Denoising Diffusion Codebook Models (gDDCM): Tokenizing images using a pre-trained diffusion model
- Title(参考訳): 一般化拡散コードブックモデル(gDDCM):事前学習拡散モデルによる画像のトークン化
- Authors: Fei Kong,
- Abstract要約: 近年,Denoising Diffusion Codebook Models (DDCM) が提案されている。
本稿では,一般化デノイング拡散圧縮モデル(gDDCM)を提案する。
実験により, DDCMのモデルへの一般化に成功し, 性能向上を実現した。
- 参考スコア(独自算出の注目度): 2.82184437499528
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, the Denoising Diffusion Codebook Models (DDCM) was proposed. DDCM leverages the Denoising Diffusion Probabilistic Model (DDPM) and replaces the random noise in the backward process with noise sampled from specific sets according to a predefined rule, thereby enabling image compression. However, DDCM cannot be applied to methods other than DDPM. In this paper, we propose the generalized Denoising Diffusion Compression Model (gDDCM), which extends DDCM to mainstream diffusion models and their variants, including DDPM, Score-Based Models, Consistency Models, and Rectified Flow. We evaluate our method on CIFAR-10 and LSUN Bedroom datasets. Experimental results demonstrate that our approach successfully generalizes DDCM to the aforementioned models and achieves improved performance.
- Abstract(参考訳): 近年,Denoising Diffusion Codebook Models (DDCM) が提案されている。
DDCMは、Denoising Diffusion Probabilistic Model (DDPM)を活用し、後方プロセスのランダムノイズを、予め定義されたルールに従って特定のセットからサンプリングされたノイズに置き換え、画像圧縮を可能にする。
しかし、DDCMはDDPM以外の方法には適用できない。
本稿では, DDCMを主流拡散モデルやDDPM, Score-based Models, Consistency Models, Rectified Flowに拡張した一般化デノイング拡散圧縮モデル(gDDCM)を提案する。
CIFAR-10とLSUN Bedroomのデータセットを用いて本手法の評価を行った。
実験により, DDCMのモデルへの一般化に成功し, 性能向上を実現した。
関連論文リスト
- Constrained Diffusion Implicit Models [26.177111846501457]
本稿では,事前学習した拡散モデルを用いて,雑音の多い線形逆問題の解法を提案する。
様々なタスクやメトリクスにわたる実験は、CDIMの強い性能を示し、非制約DDIMと類似の推論加速度を示す。
我々は,超解像,デノイング,インペインティング,デブロアリング,3次元点雲再構成など,多くの問題に対するアプローチの汎用性を実証する。
論文 参考訳(メタデータ) (2024-11-01T04:51:24Z) - Denoising Diffusion Bridge Models [54.87947768074036]
拡散モデルは、プロセスを使用してデータにノイズをマッピングする強力な生成モデルである。
画像編集のような多くのアプリケーションでは、モデル入力はランダムノイズではない分布から来る。
本研究では, DDBM(Denoising Diffusion Bridge Models)を提案する。
論文 参考訳(メタデータ) (2023-09-29T03:24:24Z) - Soft Mixture Denoising: Beyond the Expressive Bottleneck of Diffusion
Models [76.46246743508651]
我々は,現在の拡散モデルが後方認知において表現力のあるボトルネックを持っていることを示した。
本稿では,後方復調のための表現的かつ効率的なモデルであるソフトミキシング・デノナイジング(SMD)を導入する。
論文 参考訳(メタデータ) (2023-09-25T12:03:32Z) - SDDM: Score-Decomposed Diffusion Models on Manifolds for Unpaired
Image-to-Image Translation [96.11061713135385]
本研究は,画像生成時の絡み合った分布を明示的に最適化する,新しいスコア分解拡散モデルを提案する。
我々は、スコア関数の精製部分とエネルギー誘導を等しくし、多様体上の多目的最適化を可能にする。
SDDMは既存のSBDMベースの手法よりも優れており、I2Iベンチマークでは拡散ステップがはるかに少ない。
論文 参考訳(メタデータ) (2023-08-04T06:21:57Z) - PartDiff: Image Super-resolution with Partial Diffusion Models [3.8435187580887717]
拡散確率モデル(DDPM)は,様々な画像生成タスクにおいて顕著な性能を達成している。
DDPMは、ランダムノイズから反復的にデノイングすることで、新しいデータを生成する。
しかし、拡散に基づく生成モデルは、多くのデノナイジングステップのために高い計算コストに悩まされる。
本稿では,部分拡散モデル (PartDiff) を提案する。
論文 参考訳(メタデータ) (2023-07-21T22:11:23Z) - Semi-Implicit Denoising Diffusion Models (SIDDMs) [50.30163684539586]
Denoising Diffusion Probabilistic Models (DDPM)のような既存のモデルは、高品質で多様なサンプルを提供するが、本質的に多くの反復的なステップによって遅くなる。
暗黙的要因と明示的要因を一致させることにより、この問題に対処する新しいアプローチを導入する。
提案手法は拡散モデルに匹敵する生成性能と,少数のサンプリングステップを持つモデルに比較して非常に優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2023-06-21T18:49:22Z) - Insights into Closed-form IPM-GAN Discriminator Guidance for Diffusion Modeling [11.68361062474064]
本稿では,GAN判別器がLangevinに基づくサンプリングに与える影響を理論的に解析する枠組みを提案する。
提案手法は既存の加速拡散技術と組み合わせて潜在空間画像生成を改善することができることを示す。
論文 参考訳(メタデータ) (2023-06-02T16:24:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。