論文の概要: U-Turn Diffusion
- arxiv url: http://arxiv.org/abs/2308.07421v1
- Date: Mon, 14 Aug 2023 19:21:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 15:00:03.423351
- Title: U-Turn Diffusion
- Title(参考訳): uターン拡散
- Authors: Hamidreza Behjoo, Michael Chertkov
- Abstract要約: 本稿では,合成画像を生成するためのAIのスコアベース拡散モデルについて包括的に検討する。
生成した合成画像の品質向上を目的として,U-Turn Diffusionという手法を提案する。
前方、Uターン、逆過程を組み合わせたこのU-Turn拡散法は、独立で同一に分布した(d.d.)サンプルを近似した合成画像を生成する。
- 参考スコア(独自算出の注目度): 0.5348370085388683
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a comprehensive examination of score-based diffusion models of AI
for generating synthetic images. These models hinge upon a dynamic auxiliary
time mechanism driven by stochastic differential equations, wherein the score
function is acquired from input images. Our investigation unveils a criterion
for evaluating efficiency of the score-based diffusion models: the power of the
generative process depends on the ability to de-construct fast correlations
during the reverse/de-noising phase. To improve the quality of the produced
synthetic images, we introduce an approach coined "U-Turn Diffusion". The
U-Turn Diffusion technique starts with the standard forward diffusion process,
albeit with a condensed duration compared to conventional settings.
Subsequently, we execute the standard reverse dynamics, initialized with the
concluding configuration from the forward process. This U-Turn Diffusion
procedure, combining forward, U-turn, and reverse processes, creates a
synthetic image approximating an independent and identically distributed
(i.i.d.) sample from the probability distribution implicitly described via
input samples. To analyze relevant time scales we employ various analytical
tools, including auto-correlation analysis, weighted norm of the score-function
analysis, and Kolmogorov-Smirnov Gaussianity test. The tools guide us to
establishing that the Kernel Intersection Distance, a metric comparing the
quality of synthetic samples with real data samples, is minimized at the
optimal U-turn time.
- Abstract(参考訳): 本稿では,合成画像生成のためのaiのスコアベース拡散モデルの包括的検討を行う。
これらのモデルは確率微分方程式によって駆動される動的補助時間機構にヒンジし、入力画像からスコア関数を取得する。
生成過程のパワーは、逆/逆ノイズ化フェーズにおいて高速な相関を分解する能力に依存する。
生成した合成画像の品質を向上させるために,「uターン拡散」という手法を導入する。
U-Turn拡散法は標準の前方拡散プロセスから始まり、従来の設定に比べて凝縮期間が長い。
その後、私たちは標準リバースダイナミクスを実行し、フォワードプロセスからコンクショディング設定で初期化します。
前方、Uターン、逆過程を組み合わせたU-Turn拡散法は、入力サンプルを介して暗黙的に記述された確率分布から独立で同一に分布した(d)サンプルを近似する合成画像を生成する。
関連する時間スケールを分析するには,自動相関解析,スコア関数解析の重み付けノルム,Kolmogorov-Smirnov Gaussianity testなど,さまざまな分析ツールを用いる。
このツールは, 実データと合成試料の品質を比較した指標であるカーネル区間距離が, 最適なUターン時間で最小化されていることを示すのに役立つ。
関連論文リスト
- Outsourced diffusion sampling: Efficient posterior inference in latent spaces of generative models [65.71506381302815]
本稿では、$p(mathbfxmidmathbfy) propto p_theta(mathbfx)$ という形式の後続分布からサンプリングするコストを償却する。
多くのモデルと関心の制約に対して、ノイズ空間の後方はデータ空間の後方よりも滑らかであり、そのような償却推論に対してより快適である。
論文 参考訳(メタデータ) (2025-02-10T19:49:54Z) - IT$^3$: Idempotent Test-Time Training [95.78053599609044]
本稿では,分散シフトの課題に対処する新しいアプローチであるIdempotent Test-Time Training (IT$3$)を紹介する。
IT$3$は、イデオロジェンスの普遍性に基づいている。
画像分類の劣化など,様々なタスクにまたがるアプローチの汎用性を実証する。
論文 参考訳(メタデータ) (2024-10-05T15:39:51Z) - A Sharp Convergence Theory for The Probability Flow ODEs of Diffusion Models [45.60426164657739]
拡散型サンプリング器の非漸近収束理論を開発する。
我々は、$d/varepsilon$がターゲット分布を$varepsilon$トータル偏差距離に近似するのに十分であることを証明した。
我々の結果は、$ell$のスコア推定誤差がデータ生成プロセスの品質にどのように影響するかも特徴付ける。
論文 参考訳(メタデータ) (2024-08-05T09:02:24Z) - Consistency Model is an Effective Posterior Sample Approximation for Diffusion Inverse Solvers [28.678613691787096]
過去の近似は後続の手段に依存しており、画像分布の支持には当てはまらない可能性がある。
本稿では,画像分布支援において有効なサンプルを生成することを保証する,後部近似のための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-02-09T02:23:47Z) - Model-adapted Fourier sampling for generative compressed sensing [7.130302992490975]
測定行列が一意行列からランダムにサブサンプリングされたとき, 生成的圧縮センシングについて検討した。
我々は,textitO(kd| boldsymbolalpha|_22)$の測定精度を改良したモデル適応サンプリング戦略を構築した。
論文 参考訳(メタデータ) (2023-10-08T03:13:16Z) - Simulation-free Schr\"odinger bridges via score and flow matching [89.4231207928885]
シミュレーションフリースコアとフローマッチング([SF]$2$M)を提案する。
本手法は,拡散モデルのトレーニングに使用するスコアマッチング損失と,連続流のトレーニングに使用されるフローマッチング損失の両方を一般化する。
特に、[SF]$2$Mは、高次元の細胞動態を正確にモデル化し、既知の遺伝子制御ネットワークをシミュレートする最初の方法である。
論文 参考訳(メタデータ) (2023-07-07T15:42:35Z) - Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative
Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。
従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文 参考訳(メタデータ) (2023-06-15T16:30:08Z) - Towards Sample-Optimal Compressive Phase Retrieval with Sparse and
Generative Priors [59.33977545294148]
O(k log L)$サンプルは振幅に基づく経験損失関数を最小化する任意のベクトルに信号が近いことを保証するのに十分であることを示す。
この結果はスパース位相検索に適応し、基底信号が$s$-sparseおよび$n$-dimensionalである場合、$O(s log n)$サンプルは同様の保証に十分であることを示す。
論文 参考訳(メタデータ) (2021-06-29T12:49:54Z) - Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and
Variance Reduction [63.41789556777387]
非同期Q-ラーニングはマルコフ決定過程(MDP)の最適行動値関数(またはQ-関数)を学習することを目的としている。
Q-関数の入出力$varepsilon$-正確な推定に必要なサンプルの数は、少なくとも$frac1mu_min (1-gamma)5varepsilon2+ fract_mixmu_min (1-gamma)$の順である。
論文 参考訳(メタデータ) (2020-06-04T17:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。