論文の概要: U-Turn Diffusion
- arxiv url: http://arxiv.org/abs/2308.07421v1
- Date: Mon, 14 Aug 2023 19:21:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 15:00:03.423351
- Title: U-Turn Diffusion
- Title(参考訳): uターン拡散
- Authors: Hamidreza Behjoo, Michael Chertkov
- Abstract要約: 本稿では,合成画像を生成するためのAIのスコアベース拡散モデルについて包括的に検討する。
生成した合成画像の品質向上を目的として,U-Turn Diffusionという手法を提案する。
前方、Uターン、逆過程を組み合わせたこのU-Turn拡散法は、独立で同一に分布した(d.d.)サンプルを近似した合成画像を生成する。
- 参考スコア(独自算出の注目度): 0.5348370085388683
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a comprehensive examination of score-based diffusion models of AI
for generating synthetic images. These models hinge upon a dynamic auxiliary
time mechanism driven by stochastic differential equations, wherein the score
function is acquired from input images. Our investigation unveils a criterion
for evaluating efficiency of the score-based diffusion models: the power of the
generative process depends on the ability to de-construct fast correlations
during the reverse/de-noising phase. To improve the quality of the produced
synthetic images, we introduce an approach coined "U-Turn Diffusion". The
U-Turn Diffusion technique starts with the standard forward diffusion process,
albeit with a condensed duration compared to conventional settings.
Subsequently, we execute the standard reverse dynamics, initialized with the
concluding configuration from the forward process. This U-Turn Diffusion
procedure, combining forward, U-turn, and reverse processes, creates a
synthetic image approximating an independent and identically distributed
(i.i.d.) sample from the probability distribution implicitly described via
input samples. To analyze relevant time scales we employ various analytical
tools, including auto-correlation analysis, weighted norm of the score-function
analysis, and Kolmogorov-Smirnov Gaussianity test. The tools guide us to
establishing that the Kernel Intersection Distance, a metric comparing the
quality of synthetic samples with real data samples, is minimized at the
optimal U-turn time.
- Abstract(参考訳): 本稿では,合成画像生成のためのaiのスコアベース拡散モデルの包括的検討を行う。
これらのモデルは確率微分方程式によって駆動される動的補助時間機構にヒンジし、入力画像からスコア関数を取得する。
生成過程のパワーは、逆/逆ノイズ化フェーズにおいて高速な相関を分解する能力に依存する。
生成した合成画像の品質を向上させるために,「uターン拡散」という手法を導入する。
U-Turn拡散法は標準の前方拡散プロセスから始まり、従来の設定に比べて凝縮期間が長い。
その後、私たちは標準リバースダイナミクスを実行し、フォワードプロセスからコンクショディング設定で初期化します。
前方、Uターン、逆過程を組み合わせたU-Turn拡散法は、入力サンプルを介して暗黙的に記述された確率分布から独立で同一に分布した(d)サンプルを近似する合成画像を生成する。
関連する時間スケールを分析するには,自動相関解析,スコア関数解析の重み付けノルム,Kolmogorov-Smirnov Gaussianity testなど,さまざまな分析ツールを用いる。
このツールは, 実データと合成試料の品質を比較した指標であるカーネル区間距離が, 最適なUターン時間で最小化されていることを示すのに役立つ。
関連論文リスト
- Enhancing Diffusion Posterior Sampling for Inverse Problems by Integrating Crafted Measurements [45.70011319850862]
拡散モデルは視覚生成のための強力な基礎モデルとして登場してきた。
現在の後方サンプリングに基づく手法では、測定結果を後方サンプリングに取り込み、対象データの分布を推定する。
本研究は, 早期に高周波情報を早期に導入し, より大きい推定誤差を生じさせることを示す。
工芸品計測を取り入れた新しい拡散後サンプリング手法DPS-CMを提案する。
論文 参考訳(メタデータ) (2024-11-15T00:06:57Z) - Boosting Diffusion Models with Moving Average Sampling in Frequency Domain [101.43824674873508]
拡散モデルは、現在のサンプルに頼って次のサンプルをノイズ化し、おそらく不安定化を引き起こす。
本稿では,反復的復調過程をモデル最適化として再解釈し,移動平均機構を利用して全ての先行サンプルをアンサンブルする。
周波数領域における平均サンプリング(MASF)の動作」という完全なアプローチを命名する。
論文 参考訳(メタデータ) (2024-03-26T16:57:55Z) - Data Attribution for Diffusion Models: Timestep-induced Bias in Influence Estimation [53.27596811146316]
拡散モデルは、以前の文脈における瞬間的な入出力関係ではなく、一連のタイムステップで操作する。
本稿では、この時間的ダイナミクスを取り入れた拡散トラクInについて、サンプルの損失勾配ノルムが時間ステップに大きく依存していることを確認する。
そこで我々はDiffusion-ReTracを再正規化適応として導入し、興味のあるサンプルを対象にしたトレーニングサンプルの検索を可能にする。
論文 参考訳(メタデータ) (2024-01-17T07:58:18Z) - Interpreting and Improving Diffusion Models from an Optimization Perspective [4.5993996573872185]
我々はこの観測を用いて、ユークリッド距離関数に適用された近似勾配勾配勾配として拡散モデルを解釈する。
本稿では,理論結果からの洞察を用いてDDIMを一般化した新しい勾配推定サンプリング手法を提案する。
論文 参考訳(メタデータ) (2023-06-08T00:56:33Z) - Blackout Diffusion: Generative Diffusion Models in Discrete-State Spaces [0.0]
前方拡散過程における任意の離散状態マルコフ過程の理論的定式化を開発する。
例えばBlackout Diffusion'は、ノイズからではなく、空のイメージからサンプルを生成することを学習する。
論文 参考訳(メタデータ) (2023-05-18T16:24:12Z) - A Variational Perspective on Solving Inverse Problems with Diffusion
Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。
しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。
そこで我々は,真の後続分布を近似する設計手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T23:00:47Z) - Restoration-Degradation Beyond Linear Diffusions: A Non-Asymptotic
Analysis For DDIM-Type Samplers [90.45898746733397]
本研究では拡散生成モデルに用いる決定論的サンプリング器の非漸近解析のためのフレームワークを開発する。
確率フローODEに沿った1ステップは,1) 条件付き対数線上を無限に先行して上昇する回復ステップ,2) 雑音を現在の勾配に向けて前向きに進行する劣化ステップの2段階で表すことができる。
論文 参考訳(メタデータ) (2023-03-06T18:59:19Z) - Fast Sampling of Diffusion Models via Operator Learning [74.37531458470086]
我々は,拡散モデルのサンプリング過程を高速化するために,確率フロー微分方程式の効率的な解法であるニューラル演算子を用いる。
シーケンシャルな性質を持つ他の高速サンプリング手法と比較して、並列復号法を最初に提案する。
本稿では,CIFAR-10では3.78、ImageNet-64では7.83の最先端FIDを1モデル評価環境で達成することを示す。
論文 参考訳(メタデータ) (2022-11-24T07:30:27Z) - How Much is Enough? A Study on Diffusion Times in Score-based Generative
Models [76.76860707897413]
現在のベストプラクティスは、フォワードダイナミクスが既知の単純なノイズ分布に十分に近づくことを確実にするために大きなTを提唱している。
本稿では, 理想とシミュレーションされたフォワードダイナミクスのギャップを埋めるために補助モデルを用いて, 標準的な逆拡散過程を導出する方法について述べる。
論文 参考訳(メタデータ) (2022-06-10T15:09:46Z) - Come-Closer-Diffuse-Faster: Accelerating Conditional Diffusion Models
for Inverse Problems through Stochastic Contraction [31.61199061999173]
拡散モデルには重要な欠点がある。純粋なガウスノイズから画像を生成するために数千ステップの反復を必要とするため、サンプリングが本質的に遅い。
ガウスノイズから始めることは不要であることを示す。代わりに、より優れた初期化を伴う単一前方拡散から始めると、逆条件拡散におけるサンプリングステップの数を大幅に減少させる。
ComeCloser-DiffuseFaster (CCDF)と呼ばれる新しいサンプリング戦略は、逆問題に対する既存のフィードフォワードニューラルネットワークアプローチが拡散モデルと相乗的に組み合わせられる方法について、新たな洞察を明らかにしている。
論文 参考訳(メタデータ) (2021-12-09T04:28:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。