論文の概要: Bidirectional Diffusion Bridge Models
- arxiv url: http://arxiv.org/abs/2502.09655v2
- Date: Thu, 27 Feb 2025 12:54:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-28 15:15:46.434092
- Title: Bidirectional Diffusion Bridge Models
- Title(参考訳): 双方向拡散ブリッジモデル
- Authors: Duc Kieu, Kien Do, Toan Nguyen, Dang Nguyen, Thin Nguyen,
- Abstract要約: 拡散ブリッジは、イメージ・ツー・イメージ(I2I)翻訳タスクにおいてポテンシャルを示す。
既存の手法はその一方向の性質によって制限され、前と逆の翻訳のために別々のモデルを必要とする。
2つの結合分布間の双方向変換を容易にするスケーラブルなアプローチである双方向拡散ブリッジモデル(BDBM)を導入する。
- 参考スコア(独自算出の注目度): 14.789137197695654
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion bridges have shown potential in paired image-to-image (I2I) translation tasks. However, existing methods are limited by their unidirectional nature, requiring separate models for forward and reverse translations. This not only doubles the computational cost but also restricts their practicality. In this work, we introduce the Bidirectional Diffusion Bridge Model (BDBM), a scalable approach that facilitates bidirectional translation between two coupled distributions using a single network. BDBM leverages the Chapman-Kolmogorov Equation for bridges, enabling it to model data distribution shifts across timesteps in both forward and backward directions by exploiting the interchangeability of the initial and target timesteps within this framework. Notably, when the marginal distribution given endpoints is Gaussian, BDBM's transition kernels in both directions possess analytical forms, allowing for efficient learning with a single network. We demonstrate the connection between BDBM and existing bridge methods, such as Doob's h-transform and variational approaches, and highlight its advantages. Extensive experiments on high-resolution I2I translation tasks demonstrate that BDBM not only enables bidirectional translation with minimal additional cost but also outperforms state-of-the-art bridge models. Our source code is available at [https://github.com/kvmduc/BDBM||https://github.com/kvmduc/BDBM].
- Abstract(参考訳): 拡散ブリッジは、イメージ・ツー・イメージ(I2I)翻訳タスクにおいてポテンシャルを示す。
しかし、既存の手法はその一方向の性質によって制限されており、前と逆の翻訳には別のモデルが必要である。
これは計算コストを2倍にするだけでなく、実用性も制限する。
本研究では, 双方向拡散ブリッジモデル (BDBM) を提案する。これは, 単一ネットワークを用いた2つの結合分布間の双方向変換を容易にするスケーラブルなアプローチである。
BDBMは橋梁のChapman-Kolmogorov方程式を利用して、このフレームワーク内の初期および目標のタイムステップの交換性を活用することにより、前方および後方方向のタイムステップ間のデータ分散シフトをモデル化する。
特に、与えられた端点の限界分布がガウス的であるとき、BDBMの両方向の遷移カーネルは解析的な形式を持ち、単一のネットワークで効率的に学習することができる。
本稿では,BDBM と既存の橋梁法,例えば Doob の h-transform と変分的アプローチの関連性を実証し,その利点を浮き彫りにする。
高分解能I2I翻訳タスクに関する大規模な実験により、BDBMは最小追加コストで双方向翻訳を可能にするだけでなく、最先端のブリッジモデルよりも優れていることが示された。
私たちのソースコードは[https://github.com/kvmduc/BDBM||https://github.com/kvmduc/BDBM]で入手可能です。
関連論文リスト
- Single-Step Bidirectional Unpaired Image Translation Using Implicit Bridge Consistency Distillation [55.45188329646137]
Implicit Bridge Consistency Distillation (IBCD) は、対向損失を使わずに、単段階の双方向無ペア翻訳を可能にする。
IBCDは、ベンチマークデータセットの最先端のパフォーマンスを1世代で達成する。
論文 参考訳(メタデータ) (2025-03-19T09:48:04Z) - Latent Schrodinger Bridge: Prompting Latent Diffusion for Fast Unpaired Image-to-Image Translation [58.19676004192321]
ノイズからの画像生成とデータからの逆変換の両方を可能にする拡散モデル (DM) は、強力な未ペア画像対イメージ(I2I)翻訳アルゴリズムにインスピレーションを与えている。
我々は、最小輸送コストの分布間の微分方程式(SDE)であるSchrodinger Bridges (SBs) を用いてこの問題に取り組む。
この観測に触発されて,SB ODE を予め訓練した安定拡散により近似する潜在シュロディンガー橋 (LSB) を提案する。
提案アルゴリズムは,従来のDMのコストをわずかに抑えながら,教師なし環境での競合的I2I翻訳を実現していることを示す。
論文 参考訳(メタデータ) (2024-11-22T11:24:14Z) - Discrete Diffusion Schrödinger Bridge Matching for Graph Transformation [1.8257739595540863]
任意の分布間の任意の分布の移動は、生成的モデリングの基本的な目標である。
高次元離散状態空間におけるSB問題の解法として,連続時間マルコフ連鎖を用いた新しいフレームワークを提案する。
我々は,分子の性質を最小限のグラフ変換で効果的に最適化できることを示す。
論文 参考訳(メタデータ) (2024-10-02T12:51:25Z) - Diffusion Bridge Implicit Models [25.213664260896103]
分散ブリッジモデル(DDBM)は、2つの任意の対の分布を補間するための拡散モデルの強力な変種である。
我々は,拡散モデルで確立されたレシピに動機づけられた,余分な訓練を伴わないDDBMの高速サンプリングの第一歩を踏み出す。
我々は、高次数値解法を誘導する、新しい、単純で洞察に富んだ常微分方程式(ODE)を誘導する。
論文 参考訳(メタデータ) (2024-05-24T19:08:30Z) - Unpaired Image-to-Image Translation via Neural Schr\"odinger Bridge [70.79973551604539]
本稿では,SB問題を表すUnpaired Neural Schr"odinger Bridge (UNSB)を提案する。
UNSBはスケーラブルで、様々な未ペアI2I翻訳タスクをうまく解決する。
論文 参考訳(メタデータ) (2023-05-24T12:05:24Z) - On the Role of Bidirectionality in Language Model Pre-Training [85.14614350372004]
本研究では,次のトークン予測,テキスト入力,ゼロショットプライミング,微調整における双方向性の役割について検討する。
最大6.7Bのパラメータを持つモデルをトレーニングし、スケールで一貫性のある相違点を見つけます。
論文 参考訳(メタデータ) (2022-05-24T02:25:05Z) - BBDM: Image-to-image Translation with Brownian Bridge Diffusion Models [50.39417112077254]
BBDM(Brownian Bridge Diffusion Model)に基づく画像から画像への変換手法を提案する。
我々の知る限りでは、画像から画像への変換のためのブラウン橋拡散プロセスを提案する最初の作品である。
論文 参考訳(メタデータ) (2022-05-16T13:47:02Z) - Dual Diffusion Implicit Bridges for Image-to-Image Translation [104.59371476415566]
画像と画像の共通翻訳法は、ソースドメインとターゲットドメインの両方のデータに対する共同トレーニングに依存している。
本稿では拡散モデルに基づく画像変換法であるDual Diffusion Implicit Bridges (DDIBs)を提案する。
DDIBは任意のソースターゲットドメイン間の変換を可能にし、それぞれのドメイン上で独立に訓練された拡散モデルを与える。
論文 参考訳(メタデータ) (2022-03-16T04:10:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。