論文の概要: Few-step Generative Models as Lossy Compression
- arxiv url: http://arxiv.org/abs/2606.10450v1
- Date: Tue, 09 Jun 2026 05:56:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.341086
- Title: Few-step Generative Models as Lossy Compression
- Title(参考訳): 損失圧縮としての数段階生成モデル
- Authors: Fuma Kimishima, Jinjia Zhou,
- Abstract要約: 逆チャネル符号化フレームワークにおいて,数ステップの生成モデルをコーデックとしてキャストできるかどうかを検討する。
速度パラメタライゼーションと拡散型デノナイジングパラメタライゼーションの等価性を用いてRCCに必要な量を導出する。
これにより概念確率的定式化の証明が得られ、事前学習された数段階の生成モデルで再学習することなく圧縮できる。
- 参考スコア(独自算出の注目度): 5.427608760413566
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: DiffC provides a principled way to reuse pre-trained diffusion models for lossy compression, but its encoding and decoding procedures remain slow because they require many discretized forward and reverse steps. We study whether few-step generative models -- Rectified Flow, Consistency Trajectory Models (CTM), and MeanFlow -- can be cast as codecs within the same reverse channel coding (RCC) framework. The main challenge is that RCC requires posterior and shared distribution parameters, whereas these models do not explicitly parameterize intermediate conditional distributions. For Rectified Flow and MeanFlow, we use the equivalence between velocity parameterization and diffusion-style denoising parameterization to derive the quantities required by RCC. For CTM, which is distilled from EDM, we adopt the EDM noise parameterization together with local Gaussian approximations of the sender and shared distributions at intermediate states. This yields a proof-of-concept probabilistic formulation that enables compression with pre-trained few-step generative models without retraining. On low-resolution benchmarks, the resulting codecs reduce encoding and decoding time and improve realism in the low-bit-rate regime.
- Abstract(参考訳): DiffCは、学習済みの拡散モデルを、損失圧縮のために再利用する原則的な方法を提供しているが、その符号化と復号手順は、多くの離散化された前方ステップと逆ステップを必要とするため、遅いままである。
我々は、CTM(Rectified Flow)、CTM(Consistency Trajectory Model)、MeanFlow(MeanFlow)といった少数の生成モデルを、同一のリバースチャネル符号化(RCC)フレームワーク内でコーデックとしてキャストできるかどうかを検討する。
主な課題はRCCが後続および共有分布パラメータを必要とするのに対して、これらのモデルは中間条件分布を明示的にパラメータ化しないことである。
Rectified Flow と Mean Flow では,速度パラメータ化と拡散型デノナイジングパラメータ化の等価性を用いて,RCC が必要とする量を導出する。
EDMから蒸留したCTMでは,EDMノイズパラメータ化と送信者の局所ガウス近似と中間状態における共有分布を併用する。
これにより概念確率的定式化の証明が得られ、事前学習された数段階の生成モデルで再学習することなく圧縮できる。
低解像度のベンチマークでは、結果のコーデックは符号化時間と復号時間を削減し、低ビットレートのレギュレーションにおけるリアリズムを改善する。
関連論文リスト
- ReDi: Rectified Discrete Flow [17.72385262464804]
条件付きトータル相関(TC)を用いた分解近似誤差の解析
本稿では,因子分解誤差を低減させる新しい反復法であるRectified Discrete Flow (ReDi)を提案する。
経験的に、ReDiはConditional TCを大幅に削減し、数ステップ生成を可能にします。
論文 参考訳(メタデータ) (2025-07-21T01:18:44Z) - Accelerating Diffusion LLMs via Adaptive Parallel Decoding [60.407727995313074]
並列にサンプリングされたトークンの数を動的に調整する新しい手法であるアダプティブ並列復号法(APD)を導入する。
APDは、ダウンストリームベンチマークで最小限の品質劣化を伴って、非常に高いスループットを提供する。
論文 参考訳(メタデータ) (2025-05-31T06:10:10Z) - RDPM: Solve Diffusion Probabilistic Models via Recurrent Token Prediction [17.005198258689035]
拡散確率モデル(DPM)は、高忠実度画像合成のデファクトアプローチとして登場した。
本稿では, 再帰的拡散確率モデル(RDPM, Recurrent Diffusion Probabilistic Model)を提案する。
論文 参考訳(メタデータ) (2024-12-24T12:28:19Z) - Diffusion-Driven Semantic Communication for Generative Models with Bandwidth Constraints [66.63250537475973]
本稿では,帯域制限付き生成モデルのための,高度なVAEベースの圧縮を用いた拡散駆動型セマンティック通信フレームワークを提案する。
実験の結果,ピーク信号対雑音比 (PSNR) などの画素レベルの指標と,LPIPS (Learning Perceptual Image patch similarity) のような意味的指標が大幅に改善された。
論文 参考訳(メタデータ) (2024-07-26T02:34:25Z) - Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文 参考訳(メタデータ) (2023-10-01T05:07:17Z) - Online Probabilistic Model Identification using Adaptive Recursive MCMC [8.465242072268019]
適応再帰的マルコフ連鎖モンテカルロ法(ARMCMC)を提案する。
モデルパラメータの確率密度関数全体を計算しながら、従来のオンライン手法の欠点を解消する。
本研究では,ソフト曲げアクチュエータとハント・クロスリー動的モデルを用いてパラメータ推定を行った。
論文 参考訳(メタデータ) (2022-10-23T02:06:48Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。