論文の概要: Bidirectional Diffusion Bridge Models
- arxiv url: http://arxiv.org/abs/2502.09655v1
- Date: Wed, 12 Feb 2025 04:43:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-17 14:47:38.143819
- Title: Bidirectional Diffusion Bridge Models
- Title(参考訳): 双方向拡散ブリッジモデル
- Authors: Duc Kieu, Kien Do, Toan Nguyen, Dang Nguyen, Thin Nguyen,
- Abstract要約: 拡散ブリッジは、イメージ・ツー・イメージ(I2I)翻訳タスクにおいてポテンシャルを示す。
既存の手法はその一方向の性質によって制限され、前と逆の翻訳のために別々のモデルを必要とする。
2つの結合分布間の双方向変換を容易にするスケーラブルなアプローチである双方向拡散ブリッジモデル(BDBM)を導入する。
- 参考スコア(独自算出の注目度): 14.789137197695654
- License:
- Abstract: Diffusion bridges have shown potential in paired image-to-image (I2I) translation tasks. However, existing methods are limited by their unidirectional nature, requiring separate models for forward and reverse translations. This not only doubles the computational cost but also restricts their practicality. In this work, we introduce the Bidirectional Diffusion Bridge Model (BDBM), a scalable approach that facilitates bidirectional translation between two coupled distributions using a single network. BDBM leverages the Chapman-Kolmogorov Equation for bridges, enabling it to model data distribution shifts across timesteps in both forward and backward directions by exploiting the interchangeability of the initial and target timesteps within this framework. Notably, when the marginal distribution given endpoints is Gaussian, BDBM's transition kernels in both directions possess analytical forms, allowing for efficient learning with a single network. We demonstrate the connection between BDBM and existing bridge methods, such as Doob's h-transform and variational approaches, and highlight its advantages. Extensive experiments on high-resolution I2I translation tasks demonstrate that BDBM not only enables bidirectional translation with minimal additional cost but also outperforms state-of-the-art bridge models. Our source code is available at [https://github.com/kvmduc/BDBM||https://github.com/kvmduc/BDBM].
- Abstract(参考訳): 拡散ブリッジは、イメージ・ツー・イメージ(I2I)翻訳タスクにおいてポテンシャルを示す。
しかし、既存の手法はその一方向の性質によって制限されており、前と逆の翻訳には別のモデルが必要である。
これは計算コストを2倍にするだけでなく、実用性も制限する。
本研究では, 双方向拡散ブリッジモデル (BDBM) を提案する。これは, 単一ネットワークを用いた2つの結合分布間の双方向変換を容易にするスケーラブルなアプローチである。
BDBMは橋梁のChapman-Kolmogorov方程式を利用して、このフレームワーク内の初期および目標のタイムステップの交換性を活用することにより、前方および後方方向のタイムステップ間のデータ分散シフトをモデル化する。
特に、与えられた端点の限界分布がガウス的であるとき、BDBMの両方向の遷移カーネルは解析的な形式を持ち、単一のネットワークで効率的に学習することができる。
本稿では,BDBM と既存の橋梁法,例えば Doob の h-transform と変分的アプローチの関連性を実証し,その利点を浮き彫りにする。
高分解能I2I翻訳タスクに関する大規模な実験により、BDBMは最小追加コストで双方向翻訳を可能にするだけでなく、最先端のブリッジモデルよりも優れていることが示された。
私たちのソースコードは[https://github.com/kvmduc/BDBM||https://github.com/kvmduc/BDBM]で入手可能です。
関連論文リスト
- Inverse Bridge Matching Distillation [69.479483488685]
拡散ブリッジモデル(DBMs)は、画像から画像への変換に応用するための拡散モデルの有望な拡張である。
本稿では, 逆橋整合式に基づく新しい蒸留技術を提案し, 実際に解決するための抽出可能な目的を導出する。
我々は,超解像,JPEG復元,スケッチ・トゥ・イメージ,その他のタスクを含む,広範囲のセットアップにおいて,条件付きおよび非条件付きブリッジマッチングのアプローチを評価する。
論文 参考訳(メタデータ) (2025-02-03T13:56:03Z) - Latent Schrodinger Bridge: Prompting Latent Diffusion for Fast Unpaired Image-to-Image Translation [58.19676004192321]
ノイズからの画像生成とデータからの逆変換の両方を可能にする拡散モデル (DM) は、強力な未ペア画像対イメージ(I2I)翻訳アルゴリズムにインスピレーションを与えている。
我々は、最小輸送コストの分布間の微分方程式(SDE)であるSchrodinger Bridges (SBs) を用いてこの問題に取り組む。
この観測に触発されて,SB ODE を予め訓練した安定拡散により近似する潜在シュロディンガー橋 (LSB) を提案する。
提案アルゴリズムは,従来のDMのコストをわずかに抑えながら,教師なし環境での競合的I2I翻訳を実現していることを示す。
論文 参考訳(メタデータ) (2024-11-22T11:24:14Z) - Consistency Diffusion Bridge Models [25.213664260896103]
拡散ブリッジモデル(DDBM)は、参照拡散プロセスに基づいて、固定データエンドポイント間でプロセスを構築する。
DDBMのサンプリングプロセスは通常、良好な性能を達成するために何百ものネットワーク評価を必要とする。
本稿では, DDBMに適用可能な整合性ブリッジ蒸留と整合性ブリッジ訓練の2つのパラダイムを提案する。
論文 参考訳(メタデータ) (2024-10-30T02:04:23Z) - BM$^2$: Coupled Schrödinger Bridge Matching [4.831663144935879]
ニューラルネットワークを用いたSchr"odingerブリッジの学習における非定性アプローチを提案する。
BM$2$の収束特性に関する予備的理論的解析を行い、数値実験で裏付ける。
論文 参考訳(メタデータ) (2024-09-14T08:57:46Z) - Diffusion Bridge Implicit Models [25.213664260896103]
分散ブリッジモデル(DDBM)は、2つの任意の対の分布を補間するための拡散モデルの強力な変種である。
我々は,拡散モデルで確立されたレシピに動機づけられた,余分な訓練を伴わないDDBMの高速サンプリングの第一歩を踏み出す。
我々は、高次数値解法を誘導する、新しい、単純で洞察に富んだ常微分方程式(ODE)を誘導する。
論文 参考訳(メタデータ) (2024-05-24T19:08:30Z) - Unpaired Image-to-Image Translation via Neural Schr\"odinger Bridge [70.79973551604539]
本稿では,SB問題を表すUnpaired Neural Schr"odinger Bridge (UNSB)を提案する。
UNSBはスケーラブルで、様々な未ペアI2I翻訳タスクをうまく解決する。
論文 参考訳(メタデータ) (2023-05-24T12:05:24Z) - On the Role of Bidirectionality in Language Model Pre-Training [85.14614350372004]
本研究では,次のトークン予測,テキスト入力,ゼロショットプライミング,微調整における双方向性の役割について検討する。
最大6.7Bのパラメータを持つモデルをトレーニングし、スケールで一貫性のある相違点を見つけます。
論文 参考訳(メタデータ) (2022-05-24T02:25:05Z) - BBDM: Image-to-image Translation with Brownian Bridge Diffusion Models [50.39417112077254]
BBDM(Brownian Bridge Diffusion Model)に基づく画像から画像への変換手法を提案する。
我々の知る限りでは、画像から画像への変換のためのブラウン橋拡散プロセスを提案する最初の作品である。
論文 参考訳(メタデータ) (2022-05-16T13:47:02Z) - Dual Diffusion Implicit Bridges for Image-to-Image Translation [104.59371476415566]
画像と画像の共通翻訳法は、ソースドメインとターゲットドメインの両方のデータに対する共同トレーニングに依存している。
本稿では拡散モデルに基づく画像変換法であるDual Diffusion Implicit Bridges (DDIBs)を提案する。
DDIBは任意のソースターゲットドメイン間の変換を可能にし、それぞれのドメイン上で独立に訓練された拡散モデルを与える。
論文 参考訳(メタデータ) (2022-03-16T04:10:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。