論文の概要: DBMSolver: A Training-free Diffusion Bridge Sampler for High-Quality Image-to-Image Translation
- arxiv url: http://arxiv.org/abs/2605.05889v1
- Date: Thu, 07 May 2026 08:59:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.645663
- Title: DBMSolver: A Training-free Diffusion Bridge Sampler for High-Quality Image-to-Image Translation
- Title(参考訳): DBMSolver: 高品質画像-画像変換のためのトレーニング不要拡散ブリッジサンプリング
- Authors: Sankarshana Venugopal, Mohammad Mostafavi, Jonghyun Choi,
- Abstract要約: 拡散に基づく画像画像画像変換(I2I)は高忠実度生成に優れるが、最先端DBMのサンプリングが遅い。
我々はDBMの基盤となるSDEとODEの半線形構造を利用するトレーニング不要なサンプルラーであるolverを紹介した。
これにより、NFEは5倍まで低下し、品質が向上する。
- 参考スコア(独自算出の注目度): 21.779024754526322
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion-based image-to-image (I2I) translation excels in high-fidelity generation but suffers from slow sampling in state-of-the-art Diffusion Bridge Models (DBMs), often requiring dozens of function evaluations (NFEs). We introduce DBMSolver, a training-free sampler that exploits the semi-linear structure of DBM's underlying SDE and ODE via exponential integrators, yielding highly-efficient 1st- and 2nd-order solutions. This reduces NFEs by up to 5x while boosting quality (e.g., FID drops 53% on DIODE at 20 NFEs vs. 2nd-order baseline). Experiments on inpainting, stylization, and semantics-to-image tasks across resolutions up to 256x256 show DBMSolver sets new SOTA efficiency-quality tradeoffs, enabling real-world applicability. Our code is publicly available at https://github.com/snumprlab/dbmsolver.
- Abstract(参考訳): 拡散に基づくイメージ・トゥ・イメージ(I2I)変換は高忠実度生成に優れるが、最先端の拡散ブリッジモデル(DBM)のサンプリングが遅いため、数十の関数評価(NFE)を必要とすることが多い。
本稿では,DBM の基礎となる SDE と ODE の半線形構造を指数積分器を用いて利用し,高効率な 1st と 2nd の解を求める。
これにより、品質を向上しながら、NFEを最大5倍削減できる(例えば、FIDは、20 NFEs対2次ベースラインでDIODEに53%低下する)。
256x256までの解像度でのインペイント、スタイリゼーション、セマンティックス・トゥ・イメージのタスクの実験では、DBMSolverは新しいSOTA効率品質のトレードオフを設定し、現実の応用を可能にする。
私たちのコードはhttps://github.com/snumprlab/dbmsolver.comで公開されています。
関連論文リスト
- Distilling Parallel Gradients for Fast ODE Solvers of Diffusion Models [53.087070073434845]
拡散モデル(DM)は、最先端の生成性能を達成したが、シーケンシャルなデノナイジング特性のため、高いサンプリング遅延に悩まされている。
既存のソルバベースの加速度法では、低レイテンシの予算で画像品質が劣化することが多い。
本稿では、各ODEステップに複数の並列勾配評価を組み込むことで、トランケーションエラーを軽減する新しいODEソルバであるEnsemble Parallel Direction Solutionrを提案する。
論文 参考訳(メタデータ) (2025-07-20T03:08:06Z) - Inverse Bridge Matching Distillation [69.479483488685]
拡散ブリッジモデル(DBMs)は、画像から画像への変換に応用するための拡散モデルの有望な拡張である。
本稿では, 逆橋整合式に基づく新しい蒸留技術を提案し, 実際に解決するための抽出可能な目的を導出する。
我々は,超解像,JPEG復元,スケッチ・トゥ・イメージ,その他のタスクを含む,広範囲のセットアップにおいて,条件付きおよび非条件付きブリッジマッチングのアプローチを評価する。
論文 参考訳(メタデータ) (2025-02-03T13:56:03Z) - Enhancing and Accelerating Diffusion-Based Inverse Problem Solving through Measurements Optimization [66.17291150498276]
textbfMeasurements textbfOptimization (MO)は,逆問題解決プロセスの各ステップで計測情報を統合するための,より効率的なプラグイン・アンド・プレイモジュールである。
MOを使用することで、複数のタスクにまたがる最新技術(SOTA)のパフォーマンスを確立することができ、大きな利点があります。
論文 参考訳(メタデータ) (2024-12-05T07:44:18Z) - Consistency Diffusion Bridge Models [25.213664260896103]
拡散ブリッジモデル(DDBM)は、参照拡散プロセスに基づいて、固定データエンドポイント間でプロセスを構築する。
DDBMのサンプリングプロセスは通常、良好な性能を達成するために何百ものネットワーク評価を必要とする。
本稿では, DDBMに適用可能な整合性ブリッジ蒸留と整合性ブリッジ訓練の2つのパラダイムを提案する。
論文 参考訳(メタデータ) (2024-10-30T02:04:23Z) - Adversarial Score identity Distillation: Rapidly Surpassing the Teacher in One Step [64.53013367995325]
生成品質と蒸留効率を向上させるSiDA(SiD with Adversarial Loss)を導入する。
SiDAは実画像と敵対的損失を取り入れており、実画像とSiDによって生成された画像を区別することができる。
SiDAは、スクラッチから蒸留した場合、前者よりもかなり早く収束する。
論文 参考訳(メタデータ) (2024-10-19T00:33:51Z) - SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models [4.232258232565518]
テキスト・ツー・イメージ拡散モデル(SD)は、広範な計算資源を必要とする一方で、大幅な進歩を示す。
LCM-LoRAは、様々なモデルで一度トレーニング可能で、普遍性を提供するが、アクセラレーション前後で生成されたコンテンツの一貫性を確保することはめったにない。
本稿では,革新的アクセラレーションモジュールであるSpeedUpNet(SUN)を提案し,普遍性と一貫性の課題に対処する。
論文 参考訳(メタデータ) (2023-12-13T09:42:04Z) - I$^2$SB: Image-to-Image Schr\"odinger Bridge [87.43524087956457]
Image-to-Image Schr"odinger Bridge (I$2$SB) は条件拡散モデルの新しいクラスである。
I$2$SB は、2つの与えられた分布間の非線形拡散過程を直接学習する。
I$2$SBは、より解釈可能な生成過程を持つ標準条件拡散モデルを超えることを示す。
論文 参考訳(メタデータ) (2023-02-12T08:35:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。