論文の概要: DPBridge: Latent Diffusion Bridge for Dense Prediction
- arxiv url: http://arxiv.org/abs/2412.20506v1
- Date: Sun, 29 Dec 2024 15:50:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:06:17.470489
- Title: DPBridge: Latent Diffusion Bridge for Dense Prediction
- Title(参考訳): DPBridge - 密度予測のための潜伏拡散橋
- Authors: Haorui Ji, Taojun Lin, Hongdong Li,
- Abstract要約: 拡散モデルは密度予測問題において顕著な成功を収めた。
画像条件付き生成問題として高密度予測タスクを定式化する生成フレームワーク DPBridge を提案する。
- 参考スコア(独自算出の注目度): 49.1574468325115
- License:
- Abstract: Diffusion models have demonstrated remarkable success in dense prediction problems, which aims to model per-pixel relationship between RGB images and dense signal maps, thanks to their ability to effectively capture complex data distributions. However, initiating the reverse sampling trajectory from uninformative noise prior introduces limitations such as degraded performance and slow inference speed. In this work, we propose DPBridge, a generative framework that formulates dense prediction tasks as image-conditioned generation problems and establishes a direct mapping between input image and its corresponding dense map based on fully-tractable diffusion bridge process. This approach addresses aforementioned limitations in conventional diffusion-based solutions. In addition, we introduce finetuning strategies to adapt our model from pretrained image diffusion backbone, leveraging its rich visual prior knowledge to facilitate both efficient training and robust generalization ability. Experimental results shows that our DPBridge can achieve competitive performance compared to both feed-forward and diffusion-based approaches across various benchmarks, highlighting its effectiveness and adaptability.
- Abstract(参考訳): 拡散モデルは、複雑なデータ分布を効果的に捉える能力により、RGB画像と高密度信号マップの間の画素ごとの関係をモデル化することを目的として、高密度予測問題において顕著に成功した。
しかし、不定形雑音から逆サンプリング軌道を開始すると、劣化性能や低速推論速度などの制限が生じる。
本研究では,高次予測タスクを画像条件付き生成問題として定式化し,完全トラクタブルな拡散ブリッジプロセスに基づいて,入力画像とその対応する高次写像を直接マッピングする生成フレームワーク DPBridge を提案する。
このアプローチは、従来の拡散型解における上記の制限に対処する。
さらに、事前訓練された画像拡散バックボーンからモデルに適応するための微調整戦略を導入し、その豊富な視覚的事前知識を活用して、効率的なトレーニングと堅牢な一般化能力を両立させる。
実験結果から, DPBridgeは, フィードフォワードと拡散に基づくアプローチの双方と比較して, 競争性能が向上し, 有効性と適応性を強調した。
関連論文リスト
- Arbitrary-steps Image Super-resolution via Diffusion Inversion [68.78628844966019]
本研究では,拡散インバージョンに基づく新しい画像超解像(SR)手法を提案する。
本研究では,拡散モデルの中間状態を構築するための部分雑音予測戦略を設計する。
トレーニングが完了すると、このノイズ予測器を使用して、拡散軌道に沿ってサンプリングプロセスを部分的に初期化し、望ましい高分解能結果を生成する。
論文 参考訳(メタデータ) (2024-12-12T07:24:13Z) - A Wavelet Diffusion GAN for Image Super-Resolution [7.986370916847687]
拡散モデルは,高忠実度画像生成のためのGAN(Generative Adversarial Network)の優れた代替品として登場した。
しかし、そのリアルタイム実現性は、遅いトレーニングと推論速度によって妨げられている。
本研究では,ウェーブレットを用いた単一画像超解法のための条件拡散GANスキームを提案する。
論文 参考訳(メタデータ) (2024-10-23T15:34:06Z) - Diffusion Priors for Variational Likelihood Estimation and Image Denoising [10.548018200066858]
本稿では,現実の雑音に対処するために,逆拡散過程における適応的確率推定とMAP推定を提案する。
実世界の多様なデータセットの実験と分析により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-10-23T02:52:53Z) - Taming Diffusion Prior for Image Super-Resolution with Domain Shift SDEs [36.65594293655289]
DoSSRは、事前訓練された拡散モデルの生成力を生かしたドメインシフト拡散に基づくSRモデルである。
このアプローチの核となるのは、既存の拡散モデルとシームレスに統合されるドメインシフト方程式です。
提案手法は, 合成および実世界のデータセットに対して, 5つのサンプリングステップしか必要とせず, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-09-26T12:16:11Z) - Distilling Diffusion Models into Conditional GANs [90.76040478677609]
複雑な多段階拡散モデルを1段階条件付きGAN学生モデルに蒸留する。
E-LatentLPIPSは,拡散モデルの潜在空間で直接動作する知覚的損失である。
我々は, 最先端の1ステップ拡散蒸留モデルよりも優れた1ステップ発生器を実証した。
論文 参考訳(メタデータ) (2024-05-09T17:59:40Z) - JoReS-Diff: Joint Retinex and Semantic Priors in Diffusion Model for Low-light Image Enhancement [69.6035373784027]
低照度画像強調(LLIE)は条件付き拡散モデルを用いて有望な性能を実現している。
従来手法は、タスク固有の条件戦略の十分な定式化の重要性を無視するものであった。
本稿では,Retinex および semantic-based pre-processing condition を付加した新しいアプローチである JoReS-Diff を提案する。
論文 参考訳(メタデータ) (2023-12-20T08:05:57Z) - Variational Bayesian Imaging with an Efficient Surrogate Score-based Prior [7.155937118886449]
不完全, 雑音の計測により, クリーンな画像後部を狙う不完全な逆画像問題について考察する。
最近の研究は、スコアベースの拡散モデルを、不適切な画像問題を解くための原則化された先行モデルに変えた。
提案するサロゲート先行法は, スコアベース拡散モデルの低境界に基づくものである。
論文 参考訳(メタデータ) (2023-09-05T04:55:10Z) - ACDMSR: Accelerated Conditional Diffusion Models for Single Image
Super-Resolution [84.73658185158222]
本稿では,ACDMSRと呼ばれる拡散モデルに基づく超解像法を提案する。
提案手法は, 決定論的反復分解過程を通じて超解像を行うために, 標準拡散モデルに適応する。
提案手法は,低解像度画像に対してより視覚的に現実的な表現を生成し,現実的なシナリオにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2023-07-03T06:49:04Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。