論文の概要: BBDM: Image-to-image Translation with Brownian Bridge Diffusion Models
- arxiv url: http://arxiv.org/abs/2205.07680v2
- Date: Thu, 23 Mar 2023 08:29:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-24 18:47:07.851704
- Title: BBDM: Image-to-image Translation with Brownian Bridge Diffusion Models
- Title(参考訳): BBDM:ブラウン橋拡散モデルによる画像から画像への変換
- Authors: Bo Li, Kaitao Xue, Bin Liu, Yu-Kun Lai
- Abstract要約: BBDM(Brownian Bridge Diffusion Model)に基づく画像から画像への変換手法を提案する。
我々の知る限りでは、画像から画像への変換のためのブラウン橋拡散プロセスを提案する最初の作品である。
- 参考スコア(独自算出の注目度): 50.39417112077254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image-to-image translation is an important and challenging problem in
computer vision and image processing. Diffusion models (DM) have shown great
potentials for high-quality image synthesis, and have gained competitive
performance on the task of image-to-image translation. However, most of the
existing diffusion models treat image-to-image translation as conditional
generation processes, and suffer heavily from the gap between distinct domains.
In this paper, a novel image-to-image translation method based on the Brownian
Bridge Diffusion Model (BBDM) is proposed, which models image-to-image
translation as a stochastic Brownian bridge process, and learns the translation
between two domains directly through the bidirectional diffusion process rather
than a conditional generation process. To the best of our knowledge, it is the
first work that proposes Brownian Bridge diffusion process for image-to-image
translation. Experimental results on various benchmarks demonstrate that the
proposed BBDM model achieves competitive performance through both visual
inspection and measurable metrics.
- Abstract(参考訳): 画像間の変換はコンピュータビジョンと画像処理において重要かつ困難な問題である。
拡散モデル(DM)は高品質な画像合成に大きな可能性を示し、画像から画像への変換のタスクにおいて競争力を発揮している。
しかし、既存の拡散モデルの多くは、画像から画像への変換を条件付き生成プロセスとして扱い、異なる領域間のギャップに苦しむ。
本稿では,Branian Bridge Diffusion Model (BBDM) に基づく新しい画像・画像変換法を提案し,画像・画像変換を確率的Branian Bridgeプロセスとしてモデル化し,条件生成プロセスではなく,双方向拡散プロセスを通じて2つの領域間の変換を直接学習する。
我々の知る限りでは、画像から画像への変換のためのブラウン橋拡散プロセスを提案する最初の作品である。
様々なベンチマークによる実験結果から,提案したBBDMモデルが視覚検査と測定可能な測定値の両面から競合性能を実現することが示された。
関連論文リスト
- EBDM: Exemplar-guided Image Translation with Brownian-bridge Diffusion Models [42.55874233756394]
我々は,B Brownian-Bridge Diffusion Models (EBDM) を用いたExemplar-Guided Image Translation という新しい手法を提案する。
提案手法は, 所定の初期点を有する拡散過程を構造制御としてブラウンブリッジプロセスとして定式化し, 与えられた模範画像のみに条件付けしながら, 対応するフォトリアリスティック画像に変換する。
論文 参考訳(メタデータ) (2024-10-13T11:10:34Z) - Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model [101.65105730838346]
離散的かつ連続的なデータに対してマルチモーダルモデルをトレーニングするためのレシピであるTransfusionを紹介する。
我々はテキストと画像の混合データに基づいて,テキストから最大7Bパラメータまでの複数のTransfusionモデルを事前訓練する。
実験の結果,Transfusionは画像の定量化や個別画像トークンによる言語モデルの訓練よりも,はるかに優れたスケールを実現していることがわかった。
論文 参考訳(メタデータ) (2024-08-20T17:48:20Z) - Improving Diffusion-based Image Translation using Asymmetric Gradient
Guidance [51.188396199083336]
非対称勾配法の適用により拡散サンプリングの逆過程を導出する手法を提案する。
我々のモデルの適応性は、画像融合モデルと潜時拡散モデルの両方で実装できる。
実験により,本手法は画像翻訳タスクにおいて,様々な最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-06-07T12:56:56Z) - LLM-grounded Diffusion: Enhancing Prompt Understanding of Text-to-Image
Diffusion Models with Large Language Models [62.75006608940132]
本研究は,テキストから画像への拡散モデルにおいて,迅速な理解能力を高めることを提案する。
提案手法は,新たな2段階プロセスにおいて,事前訓練された大規模言語モデルを用いてグラウンドド生成を行う。
提案手法は,画像の正確な生成において,ベース拡散モデルといくつかの強いベースラインを著しく上回る。
論文 参考訳(メタデータ) (2023-05-23T03:59:06Z) - Dual Diffusion Implicit Bridges for Image-to-Image Translation [104.59371476415566]
画像と画像の共通翻訳法は、ソースドメインとターゲットドメインの両方のデータに対する共同トレーニングに依存している。
本稿では拡散モデルに基づく画像変換法であるDual Diffusion Implicit Bridges (DDIBs)を提案する。
DDIBは任意のソースターゲットドメイン間の変換を可能にし、それぞれのドメイン上で独立に訓練された拡散モデルを与える。
論文 参考訳(メタデータ) (2022-03-16T04:10:45Z) - UNIT-DDPM: UNpaired Image Translation with Denoising Diffusion
Probabilistic Models [19.499490172426427]
そこで本研究では, 拡散確率モデルを用いた非対比画像・画像変換手法を提案する。
拡散確率モデル(UNIT-DDPM)を用いたUnpaired Image Translation with Denoising Diffusion Probabilistic Models (UNT-DDPM) は,両領域の画像の共同分布をマルコフ鎖として推定する生成モデルを訓練する。
論文 参考訳(メタデータ) (2021-04-12T11:22:56Z) - Unsupervised Image-to-Image Translation via Pre-trained StyleGAN2
Network [73.5062435623908]
本稿では,一連のモデル変換によって対象領域に新たなモデルを生成する新しいI2I翻訳手法を提案する。
潜在ベクトルを生成されたモデルに入力することで、ソースドメインとターゲットドメインの間でI2I翻訳を行うことができる。
論文 参考訳(メタデータ) (2020-10-12T13:51:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。