論文の概要: SDEdit: Image Synthesis and Editing with Stochastic Differential
Equations
- arxiv url: http://arxiv.org/abs/2108.01073v1
- Date: Mon, 2 Aug 2021 17:59:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:36:42.203301
- Title: SDEdit: Image Synthesis and Editing with Stochastic Differential
Equations
- Title(参考訳): sdedit:確率微分方程式による画像合成と編集
- Authors: Chenlin Meng, Yang Song, Jiaming Song, Jiajun Wu, Jun-Yan Zhu, and
Stefano Ermon
- Abstract要約: 微分方程式を用いた最近の生成モデルに基づく微分編集(SDEdit)を導入する。
ユーザが編集した入力画像が与えられたら、まずSDEに従って入力にノイズを付加し、その後、逆SDEをシミュレートして、その確率を前より徐々に増加させます。
GANインバージョンに基づく最近の画像編集手法において重要な要素であるタスク固有損失関数の設計は不要である。
- 参考スコア(独自算出の注目度): 113.35735935347465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a new image editing and synthesis framework, Stochastic
Differential Editing (SDEdit), based on a recent generative model using
stochastic differential equations (SDEs). Given an input image with user edits
(e.g., hand-drawn color strokes), we first add noise to the input according to
an SDE, and subsequently denoise it by simulating the reverse SDE to gradually
increase its likelihood under the prior. Our method does not require
task-specific loss function designs, which are critical components for recent
image editing methods based on GAN inversion. Compared to conditional GANs, we
do not need to collect new datasets of original and edited images for new
applications. Therefore, our method can quickly adapt to various editing tasks
at test time without re-training models. Our approach achieves strong
performance on a wide range of applications, including image synthesis and
editing guided by stroke paintings and image compositing.
- Abstract(参考訳): 本稿では、確率微分方程式(SDE)を用いた最近の生成モデルに基づいて、新しい画像編集合成フレームワーク、Stochastic Differential Editing (SDEdit)を導入する。
ユーザが編集した入力画像(例えば手書きカラーストローク)が与えられた場合、まずSDEに従って入力にノイズを加え、その後、逆SDEをシミュレートしてノイズを消音し、その確率を事前に徐々に増加させる。
GANインバージョンに基づく最近の画像編集手法において重要な要素であるタスク固有損失関数の設計は不要である。
条件付きGANと比較して、新しいアプリケーションのために、原画像と編集画像の新しいデータセットを収集する必要はない。
そこで本手法は,モデルを再学習することなく,テスト時に様々な編集タスクに迅速に適応することができる。
本手法は,ストローク絵画による画像合成や編集,画像合成など,幅広い用途において高い性能を発揮する。
関連論文リスト
- Stable Flow: Vital Layers for Training-Free Image Editing [74.52248787189302]
拡散モデルはコンテンツ合成と編集の分野に革命をもたらした。
最近のモデルでは、従来のUNetアーキテクチャをDiffusion Transformer (DiT)に置き換えている。
画像形成に欠かせないDiT内の「硝子層」を自動同定する手法を提案する。
次に、実画像編集を可能にするために、フローモデルのための改良された画像反転手法を提案する。
論文 参考訳(メタデータ) (2024-11-21T18:59:51Z) - CODE: Confident Ordinary Differential Editing [62.83365660727034]
CODE(Confident Ordinary Differential Editing)は、OoD(Out-of-Distribution)ガイダンスイメージを効果的に処理する画像合成のための新しいアプローチである。
CODEは、確率フロー正規微分方程式(ODE)軌道に沿ったスコアベースの更新によって画像を強化する。
本手法は完全に盲目的に動作し,事前学習した生成モデルにのみ依存する。
論文 参考訳(メタデータ) (2024-08-22T14:12:20Z) - Diffusion Model-Based Image Editing: A Survey [46.244266782108234]
様々な画像生成や編集作業のための強力なツールとして,拡散モデルが登場している。
本稿では,画像編集のための拡散モデルを用いた既存手法の概要について述べる。
テキスト誘導画像編集アルゴリズムの性能を更に評価するために,系統的なベンチマークであるEditEvalを提案する。
論文 参考訳(メタデータ) (2024-02-27T14:07:09Z) - Collaborative Score Distillation for Consistent Visual Synthesis [70.29294250371312]
コラボレーティブスコア蒸留 (CSD) は, 定常変分勾配Descence (SVGD) に基づく。
本研究では,パノラマ画像,ビデオ,3Dシーンの視覚的編集を含む,様々な作業におけるCDDの有効性を示す。
本研究は,サンプル間の整合性を向上し,テキスト・画像拡散モデルの適用性を高めるための汎用手法として,CDDの能力について述べる。
論文 参考訳(メタデータ) (2023-07-04T17:31:50Z) - Image Restoration with Mean-Reverting Stochastic Differential Equations [9.245782611878752]
本稿では,汎用画像復元のための微分方程式(SDE)を提案する。
対応する逆時間SDEをシミュレートすることにより、低画質画像の起源を復元することができる。
実験の結果,提案手法は画像の劣化, 劣化, 騒音の定量的比較において, 高い競争性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-01-27T13:20:48Z) - Delta-GAN-Encoder: Encoding Semantic Changes for Explicit Image Editing,
using Few Synthetic Samples [2.348633570886661]
本稿では,事前学習したGANの潜伏空間において,任意の属性を制御できる新しい手法を提案する。
我々は最小限のサンプルを頼りにSim2Real学習を行い、連続的な正確な編集を無制限に行う。
論文 参考訳(メタデータ) (2021-11-16T12:42:04Z) - Score-Based Generative Modeling through Stochastic Differential
Equations [114.39209003111723]
複素データ分布を雑音を注入することによって既知の事前分布に変換する微分方程式を提案する。
対応する逆時間SDEは、ノイズを緩やかに除去し、先行分布をデータ分布に戻す。
スコアベース生成モデリングの進歩を活用することで、これらのスコアをニューラルネットワークで正確に推定することができる。
スコアベース生成モデルから1024×1024画像の高忠実度生成を初めて示す。
論文 参考訳(メタデータ) (2020-11-26T19:39:10Z) - Semantic Photo Manipulation with a Generative Image Prior [86.01714863596347]
GANは、ユーザスケッチ、テキスト、セマンティックラベルなどの入力に条件付きイメージを合成することができる。
GANが入力画像を正確に再現することは困難である。
本稿では,GANが以前に学んだイメージを個々の画像の統計に適応させることにより,これらの問題に対処する。
提案手法は,入力画像の外観と一致して,入力画像を正確に再構成し,新たなコンテンツを合成することができる。
論文 参考訳(メタデータ) (2020-05-15T18:22:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。