論文の概要: U-Turn Diffusion
- arxiv url: http://arxiv.org/abs/2308.07421v1
- Date: Mon, 14 Aug 2023 19:21:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 15:00:03.423351
- Title: U-Turn Diffusion
- Title(参考訳): uターン拡散
- Authors: Hamidreza Behjoo, Michael Chertkov
- Abstract要約: 本稿では,合成画像を生成するためのAIのスコアベース拡散モデルについて包括的に検討する。
生成した合成画像の品質向上を目的として,U-Turn Diffusionという手法を提案する。
前方、Uターン、逆過程を組み合わせたこのU-Turn拡散法は、独立で同一に分布した(d.d.)サンプルを近似した合成画像を生成する。
- 参考スコア(独自算出の注目度): 0.5348370085388683
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a comprehensive examination of score-based diffusion models of AI
for generating synthetic images. These models hinge upon a dynamic auxiliary
time mechanism driven by stochastic differential equations, wherein the score
function is acquired from input images. Our investigation unveils a criterion
for evaluating efficiency of the score-based diffusion models: the power of the
generative process depends on the ability to de-construct fast correlations
during the reverse/de-noising phase. To improve the quality of the produced
synthetic images, we introduce an approach coined "U-Turn Diffusion". The
U-Turn Diffusion technique starts with the standard forward diffusion process,
albeit with a condensed duration compared to conventional settings.
Subsequently, we execute the standard reverse dynamics, initialized with the
concluding configuration from the forward process. This U-Turn Diffusion
procedure, combining forward, U-turn, and reverse processes, creates a
synthetic image approximating an independent and identically distributed
(i.i.d.) sample from the probability distribution implicitly described via
input samples. To analyze relevant time scales we employ various analytical
tools, including auto-correlation analysis, weighted norm of the score-function
analysis, and Kolmogorov-Smirnov Gaussianity test. The tools guide us to
establishing that the Kernel Intersection Distance, a metric comparing the
quality of synthetic samples with real data samples, is minimized at the
optimal U-turn time.
- Abstract(参考訳): 本稿では,合成画像生成のためのaiのスコアベース拡散モデルの包括的検討を行う。
これらのモデルは確率微分方程式によって駆動される動的補助時間機構にヒンジし、入力画像からスコア関数を取得する。
生成過程のパワーは、逆/逆ノイズ化フェーズにおいて高速な相関を分解する能力に依存する。
生成した合成画像の品質を向上させるために,「uターン拡散」という手法を導入する。
U-Turn拡散法は標準の前方拡散プロセスから始まり、従来の設定に比べて凝縮期間が長い。
その後、私たちは標準リバースダイナミクスを実行し、フォワードプロセスからコンクショディング設定で初期化します。
前方、Uターン、逆過程を組み合わせたU-Turn拡散法は、入力サンプルを介して暗黙的に記述された確率分布から独立で同一に分布した(d)サンプルを近似する合成画像を生成する。
関連する時間スケールを分析するには,自動相関解析,スコア関数解析の重み付けノルム,Kolmogorov-Smirnov Gaussianity testなど,さまざまな分析ツールを用いる。
このツールは, 実データと合成試料の品質を比較した指標であるカーネル区間距離が, 最適なUターン時間で最小化されていることを示すのに役立つ。
関連論文リスト
- Iterated Denoising Energy Matching for Sampling from Boltzmann Densities [111.90150190668555]
反復Denoising Energy Matching (iDEM)
iDEMは,拡散型サンプリング装置から高モデル密度のサンプリング領域を (I) 交換し, (II) それらのサンプルをマッチング目的に使用した。
提案手法は,全測定値の最先端性能を達成し,2~5倍の速さでトレーニングを行う。
論文 参考訳(メタデータ) (2024-02-09T01:11:23Z) - Deep Equilibrium Diffusion Restoration with Parallel Sampling [120.15039525209106]
拡散モデルに基づく画像復元(IR)は、拡散モデルを用いて劣化した画像から高品質な(本社)画像を復元し、有望な性能を達成することを目的としている。
既存のほとんどの手法では、HQイメージをステップバイステップで復元するために長いシリアルサンプリングチェーンが必要であるため、高価なサンプリング時間と高い計算コストがかかる。
本研究では,拡散モデルに基づくIRモデルを異なる視点,すなわちDeqIRと呼ばれるDeQ(Deep equilibrium)固定点系で再考することを目的とする。
論文 参考訳(メタデータ) (2023-11-20T08:27:56Z) - Blackout Diffusion: Generative Diffusion Models in Discrete-State Spaces [0.0]
前方拡散過程における任意の離散状態マルコフ過程の理論的定式化を開発する。
例えばBlackout Diffusion'は、ノイズからではなく、空のイメージからサンプルを生成することを学習する。
論文 参考訳(メタデータ) (2023-05-18T16:24:12Z) - A Variational Perspective on Solving Inverse Problems with Diffusion
Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。
しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。
そこで我々は,真の後続分布を近似する設計手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T23:00:47Z) - Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。
提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文 参考訳(メタデータ) (2023-04-10T17:54:38Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - How Much is Enough? A Study on Diffusion Times in Score-based Generative
Models [76.76860707897413]
現在のベストプラクティスは、フォワードダイナミクスが既知の単純なノイズ分布に十分に近づくことを確実にするために大きなTを提唱している。
本稿では, 理想とシミュレーションされたフォワードダイナミクスのギャップを埋めるために補助モデルを用いて, 標準的な逆拡散過程を導出する方法について述べる。
論文 参考訳(メタデータ) (2022-06-10T15:09:46Z) - Come-Closer-Diffuse-Faster: Accelerating Conditional Diffusion Models
for Inverse Problems through Stochastic Contraction [31.61199061999173]
拡散モデルには重要な欠点がある。純粋なガウスノイズから画像を生成するために数千ステップの反復を必要とするため、サンプリングが本質的に遅い。
ガウスノイズから始めることは不要であることを示す。代わりに、より優れた初期化を伴う単一前方拡散から始めると、逆条件拡散におけるサンプリングステップの数を大幅に減少させる。
ComeCloser-DiffuseFaster (CCDF)と呼ばれる新しいサンプリング戦略は、逆問題に対する既存のフィードフォワードニューラルネットワークアプローチが拡散モデルと相乗的に組み合わせられる方法について、新たな洞察を明らかにしている。
論文 参考訳(メタデータ) (2021-12-09T04:28:41Z) - Score-based diffusion models for accelerated MRI [35.3148116010546]
本研究では,画像中の逆問題を容易に解けるような条件分布からデータをサンプリングする方法を提案する。
我々のモデルは、訓練のためにのみ等級画像を必要とするが、複雑な値のデータを再構成することができ、さらに並列画像まで拡張できる。
論文 参考訳(メタデータ) (2021-10-08T08:42:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。