論文の概要: Coarse-Grained Kullback--Leibler Control of Diffusion-Based Generative AI
- arxiv url: http://arxiv.org/abs/2601.01045v2
- Date: Tue, 06 Jan 2026 03:40:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 13:14:29.374408
- Title: Coarse-Grained Kullback--Leibler Control of Diffusion-Based Generative AI
- Title(参考訳): 粗粒Kullback-拡散に基づく生成AIのレベル制御
- Authors: Tatsuaki Tsuruyama,
- Abstract要約: ポテンシャルVデルタにより投影される逆拡散スキーム(Vデルタ投影逆拡散と呼ばれる)を提案する。
提案手法はブロック質量誤差とリーク耐性電位を所定の許容範囲内に保持する。
本研究は, 生成サンプリングをノイズからデータへの情報ポテンシャルの低下として再解釈し, 粗粒度を明示的に制御した逆拡散過程の設計原理を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models and score-based generative models provide a powerful framework for synthesizing high-quality images from noise. However, there is still no satisfactory theory that describes how coarse-grained quantities, such as blockwise intensity or class proportions after partitioning an image into spatial blocks, are preserved and evolve along the reverse diffusion dynamics. In previous work, the author introduced an information-theoretic Lyapunov function V for non-ergodic Markov processes on a state space partitioned into blocks, defined as the minimal Kullback-Leibler divergence to the set of stationary distributions reachable from a given initial condition, and showed that a leak-tolerant potential V-delta with a prescribed tolerance for block masses admits a closed-form expression as a scaling-and-clipping operation on block masses. In this paper, I transplant this framework to the reverse diffusion process in generative models and propose a reverse diffusion scheme that is projected by the potential V-delta (referred to as the V-delta projected reverse diffusion). I extend the monotonicity of V to time-inhomogeneous block-preserving Markov kernels and show that, under small leakage and the V-delta projection, V-delta acts as an approximate Lyapunov function. Furthermore, using a toy model consisting of block-constant images and a simplified reverse kernel, I numerically demonstrate that the proposed method keeps the block-mass error and the leak-tolerant potential within the prescribed tolerance, while achieving pixel-wise accuracy and visual quality comparable to the non-projected dynamics. This study reinterprets generative sampling as a decrease of an information potential from noise to data, and provides a design principle for reverse diffusion processes with explicit control of coarse-grained quantities.
- Abstract(参考訳): 拡散モデルとスコアベース生成モデルは、ノイズから高品質な画像を合成するための強力なフレームワークを提供する。
しかし、画像が空間的ブロックに分割された後のブロックワイド強度やクラス比例のような粗い粒度が、逆拡散力学に沿ってどのように保存され、進化するかを記述する十分な理論はいまだ存在しない。
前報では、ブロックに分割された状態空間上の非エルゴードマルコフ過程に対する情報理論のリャプノフ関数 V を導入し、与えられた初期条件から到達可能な定常分布の集合への最小のクルバック・リーバー分岐として定義し、ブロック質量に対する所定の許容値を持つリーク耐性電位 V-デルタがブロック質量上のスケーリングおよびクリッピング演算として閉形式表現を許容することを示した。
本稿では、この枠組みを生成モデルにおける逆拡散過程に移植し、ポテンシャルVデルタにより投影される逆拡散スキーム(Vデルタ投影逆拡散)を提案する。
私は、Vの単調性を時間的不均一なブロック保存マルコフ核に拡張し、小さなリークとV-デルタ射影の下では、V-デルタが近似リャプノフ函数として作用することを示す。
さらに,ブロックコンスタント画像と簡易逆カーネルからなる玩具モデルを用いて,提案手法がブロック質量誤差とリーク耐性電位を所定の許容範囲内に保持し,非投影ダイナミックスに匹敵する画素精度と視覚的品質を達成できることを数値的に示す。
本研究は, 生成サンプリングをノイズからデータへの情報ポテンシャルの低下として再解釈し, 粗粒度を明示的に制御した逆拡散過程の設計原理を提供する。
関連論文リスト
- FlowDPS: Flow-Driven Posterior Sampling for Inverse Problems [51.99765487172328]
逆問題解決のための後部サンプリングは,フローを用いて効果的に行うことができる。
Flow-Driven Posterior Smpling (FlowDPS) は最先端の代替手段よりも優れています。
論文 参考訳(メタデータ) (2025-03-11T07:56:14Z) - DeltaDiff: Reality-Driven Diffusion with AnchorResiduals for Faithful SR [10.790771977682763]
拡散過程を制約する新しいフレーム・ワークであるDeltaDiffを提案する。
提案手法は最先端のモデルを超え,忠実度を向上した再侮辱を生成する。
この研究は、画像再構成タスクに拡散モデルを適用するための、新しい低ランク制約パラパラダイムを確立する。
論文 参考訳(メタデータ) (2025-02-18T06:07:14Z) - G2D2: Gradient-Guided Discrete Diffusion for Inverse Problem Solving [83.56510119503267]
本稿では,従来の離散拡散に基づく生成モデルを活用することによって,線形逆問題に対処する新しい手法を提案する。
我々は、従来の離散拡散モデルの欠点を吸収状態で緩和するために、星型ノイズプロセスを用いる。
論文 参考訳(メタデータ) (2024-10-09T06:18:25Z) - A Variational Perspective on Solving Inverse Problems with Diffusion
Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。
しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。
そこで我々は,真の後続分布を近似する設計手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T23:00:47Z) - Diffusion Models Generate Images Like Painters: an Analytical Theory of Outline First, Details Later [1.8416014644193066]
画像生成の基盤となる逆拡散過程には,以下の特性がある。
個々の軌道は低次元であり、2次元回転に似ている」。
本手法は,事前学習したモデルに対する画像生成の初期フェーズを正確に記述する。
論文 参考訳(メタデータ) (2023-03-04T20:08:57Z) - ShiftDDPMs: Exploring Conditional Diffusion Models by Shifting Diffusion
Trajectories [144.03939123870416]
本稿では,前処理に条件を導入することで,新しい条件拡散モデルを提案する。
いくつかのシフト規則に基づいて各条件に対して排他的拡散軌跡を割り当てるために、余剰潜在空間を用いる。
我々は textbfShiftDDPMs と呼ぶメソッドを定式化し、既存のメソッドの統一的な視点を提供する。
論文 参考訳(メタデータ) (2023-02-05T12:48:21Z) - A Variational Perspective on Diffusion-Based Generative Models and Score
Matching [8.93483643820767]
連続時間生成拡散の確率推定のための変分フレームワークを導出する。
本研究は,プラグイン逆SDEの可能性の低い境界を最大化することと,スコアマッチング損失の最小化が等価であることを示す。
論文 参考訳(メタデータ) (2021-06-05T05:50:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。