論文の概要: Image generation with shortest path diffusion
- arxiv url: http://arxiv.org/abs/2306.00501v1
- Date: Thu, 1 Jun 2023 09:53:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 17:13:14.468673
- Title: Image generation with shortest path diffusion
- Title(参考訳): 最短経路拡散による画像生成
- Authors: Ayan Das, Stathi Fotiadis, Anil Batra, Farhang Nabiei, FengTing Liao,
Sattar Vakili, Da-shan Shiu, Alberto Bernacchia
- Abstract要約: 最短経路拡散(SPD)が汚職の全体構造を決定することを示す。
画像のぼかしに基づいて,SPDは時間的調整を一切行わず,強いベースラインを改良し,従来の拡散モデルよりも優れていることを示す。
我々の研究は、最近の研究における観察に新たな光を当て、画像やその他の種類のデータの拡散モデルを改善するための新しいアプローチを提供する。
- 参考スコア(独自算出の注目度): 10.041144269046693
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The field of image generation has made significant progress thanks to the
introduction of Diffusion Models, which learn to progressively reverse a given
image corruption. Recently, a few studies introduced alternative ways of
corrupting images in Diffusion Models, with an emphasis on blurring. However,
these studies are purely empirical and it remains unclear what is the optimal
procedure for corrupting an image. In this work, we hypothesize that the
optimal procedure minimizes the length of the path taken when corrupting an
image towards a given final state. We propose the Fisher metric for the path
length, measured in the space of probability distributions. We compute the
shortest path according to this metric, and we show that it corresponds to a
combination of image sharpening, rather than blurring, and noise deblurring.
While the corruption was chosen arbitrarily in previous work, our Shortest Path
Diffusion (SPD) determines uniquely the entire spatiotemporal structure of the
corruption. We show that SPD improves on strong baselines without any
hyperparameter tuning, and outperforms all previous Diffusion Models based on
image blurring. Furthermore, any small deviation from the shortest path leads
to worse performance, suggesting that SPD provides the optimal procedure to
corrupt images. Our work sheds new light on observations made in recent works
and provides a new approach to improve diffusion models on images and other
types of data.
- Abstract(参考訳): 画像生成の分野は拡散モデルの導入によって大きく進歩し、与えられた画像の腐敗を徐々に反転させることを学んでいる。
最近、いくつかの研究が拡散モデルにおける画像の劣化の代替方法を導入し、ぼやけに重点を置いている。
しかし、これらの研究は純粋に経験的であり、画像の劣化に最適な手順が何かは定かではない。
本研究では,与えられた最終状態に対して像を腐敗させる際の経路長を最小化する最適手順を仮定する。
本研究では,確率分布の空間で測定した経路長のフィッシャー計量を提案する。
この測定値に従って最も短いパスを計算し、画像のシャープ化とノイズのデブラリングの組み合わせに対応していることを示す。
汚職は以前の研究で任意に選ばれたが、我々の最短経路拡散(SPD)は汚職の時空間構造を一意に決定する。
SPDは、ハイパーパラメータチューニングなしで強いベースラインを改良し、画像のぼかしに基づいて従来の拡散モデルよりも優れていることを示す。
さらに、最短経路からの小さな偏差は性能を悪化させ、SPDが画像の劣化を最適に行うことを示唆している。
我々の研究は、近年の成果に新たな光を当て、画像やその他の種類のデータの拡散モデルを改善するための新しいアプローチを提供する。
関連論文リスト
- Fast constrained sampling in pre-trained diffusion models [77.21486516041391]
拡散モデルは、大規模な生成画像モデルの分野を支配してきた。
本研究では,大規模な事前学習拡散モデルにおける高速拘束サンプリングのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-24T14:52:38Z) - CODE: Confident Ordinary Differential Editing [62.83365660727034]
CODE(Confident Ordinary Differential Editing)は、OoD(Out-of-Distribution)ガイダンスイメージを効果的に処理する画像合成のための新しいアプローチである。
CODEは、確率フロー正規微分方程式(ODE)軌道に沿ったスコアベースの更新によって画像を強化する。
本手法は完全に盲目的に動作し,事前学習した生成モデルにのみ依存する。
論文 参考訳(メタデータ) (2024-08-22T14:12:20Z) - Blind Image Restoration via Fast Diffusion Inversion [17.139433082780037]
Blind Image Restoration via fast Diffusion (BIRD) は、劣化モデルパラメータと復元画像の協調最適化を行うブラインド赤外線法である。
提案手法の鍵となる考え方は、初期ノイズがサンプリングされると、逆サンプリングを変更すること、すなわち、中間潜水剤を全て変更しないことである。
画像復元作業におけるBIRDの有効性を実験的に検証し,それらすべてに対して,その成果が得られたことを示す。
論文 参考訳(メタデータ) (2024-05-29T23:38:12Z) - Efficient Diffusion-Driven Corruption Editor for Test-Time Adaptation [37.67328706787212]
テスト時間適応(TTA)は、テスト時間中に発生する予期せぬ分散シフトに対処する。
本稿では,遅延拡散モデル(LDM)に基づく画像編集モデルを利用した新しいTTA手法を提案する。
我々のモデルは拡散ベースベースラインよりも100倍高速なランタイムで最高の性能を達成する。
論文 参考訳(メタデータ) (2024-03-16T12:18:20Z) - Ambient Diffusion Posterior Sampling: Solving Inverse Problems with
Diffusion Models trained on Corrupted Data [56.81246107125692]
Ambient Diffusion Posterior Smpling (A-DPS) は、ある種類の腐敗に対して事前訓練された生成モデルである。
A-DPSは、いくつかの画像復元タスクにおいて、クリーンなデータで訓練されたモデルよりも、速度と性能の両方で優れていることが示される。
我々はAmbient Diffusionフレームワークを拡張して、FourierサブサンプルのマルチコイルMRI測定にのみアクセスしてMRIモデルをトレーニングする。
論文 参考訳(メタデータ) (2024-03-13T17:28:20Z) - Fast Diffusion EM: a diffusion model for blind inverse problems with
application to deconvolution [0.0]
現在の手法では、劣化が知られており、復元と多様性の点で印象的な結果をもたらすと仮定している。
本研究では、これらのモデルの効率を活用し、復元された画像と未知のパラメータを共同で推定する。
本手法は,拡散モデルから抽出したサンプルを用いて,問題の対数類似度を近似し,未知のモデルパラメータを推定する方法とを交互に比較する。
論文 参考訳(メタデータ) (2023-09-01T06:47:13Z) - Masked Images Are Counterfactual Samples for Robust Fine-tuning [77.82348472169335]
微調整の深層学習モデルは、分布内(ID)性能と分布外(OOD)堅牢性の間のトレードオフにつながる可能性がある。
そこで本研究では,マスク付き画像を対物サンプルとして用いて,ファインチューニングモデルのロバスト性を向上させる新しいファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T11:51:28Z) - Soft Diffusion: Score Matching for General Corruptions [84.26037497404195]
我々は,任意の線形汚職過程のスコア関数を確実に学習するSoft Score Matchingと呼ばれる新しい目的を提案する。
本研究の目的は, 汚職過程の家族に対して, 適正な規則性条件下での確率の勾配を学習することである。
提案手法はCelebA-64上でのFIDスコアを1.85ドルで達成し,従来の線形拡散モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-09-12T17:45:03Z) - Perceptual Image Restoration with High-Quality Priori and Degradation
Learning [28.93489249639681]
本モデルは,復元画像と劣化画像の類似度を測定するのに有効であることを示す。
同時修復・拡張フレームワークは,実世界の複雑な分解型によく一般化する。
論文 参考訳(メタデータ) (2021-03-04T13:19:50Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。