論文の概要: DPBridge: Latent Diffusion Bridge for Dense Prediction
- arxiv url: http://arxiv.org/abs/2412.20506v2
- Date: Wed, 19 Mar 2025 06:20:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-20 15:20:06.404976
- Title: DPBridge: Latent Diffusion Bridge for Dense Prediction
- Title(参考訳): DPBridge - 密度予測のための潜伏拡散橋
- Authors: Haorui Ji, Taojun Lin, Hongdong Li,
- Abstract要約: DPBridgeは、入力されたRGB画像と高密度信号マップとの直接マッピングを、トラクタブルブリッジプロセスに基づいて確立する生成フレームワークである。
実験により, DPBridgeはフィードフォワードと拡散ベースの両方と比較して, 競争性能が向上することが示された。
- 参考スコア(独自算出の注目度): 49.1574468325115
- License:
- Abstract: Diffusion models have shown remarkable capabilities in modeling complex data distributions by transforming noise into structured data through stochastic processes. However, when applied to dense prediction tasks whose goal is to capture per-pixel relationships between RGB images and dense signal maps, starting the sampling process from an uninformative Gaussian noise often leads to inefficient sampling and long latency. To overcome these challenges, we propose DPBridge, a generative framework that establishes direct mapping between input RGB images and dense signal maps based on a tractable bridge process. Furthermore, we introduce finetuning strategies to leverage a pretrained large-scale image diffusion backbone, enjoying its rich visual prior knowledge to enable both efficient training and robust generalization. Experiments show that DPBridge achieves competitive performance compared to both feed-forward and diffusion-based approaches across various benchmarks, validating its effectiveness and adaptability.
- Abstract(参考訳): 拡散モデルは、確率過程を通じてノイズを構造化データに変換することによって、複雑なデータ分布をモデル化する際、顕著な能力を示した。
しかし、RGB画像と高密度信号マップ間の画素間関係を捉えることを目的とした高密度予測タスクに適用すると、非形式的なガウスノイズからサンプリングプロセスを開始すると、非効率なサンプリングと長時間のレイテンシが発生する。
これらの課題を克服するために,入力RGB画像と高密度信号マップの直接マッピングをトラクタブルブリッジプロセスに基づいて構築する生成フレームワークであるDPBridgeを提案する。
さらに,事前訓練された大規模画像拡散バックボーンを活用するための微調整戦略を導入し,その豊富な視覚的事前知識を活かして,効率的なトレーニングと堅牢な一般化を実現する。
DPBridgeは様々なベンチマークでフィードフォワードと拡散ベースのアプローチを比較検討し、その有効性と適応性を検証した。
関連論文リスト
- Arbitrary-steps Image Super-resolution via Diffusion Inversion [68.78628844966019]
本研究では,拡散インバージョンに基づく新しい画像超解像(SR)手法を提案する。
本研究では,拡散モデルの中間状態を構築するための部分雑音予測戦略を設計する。
トレーニングが完了すると、このノイズ予測器を使用して、拡散軌道に沿ってサンプリングプロセスを部分的に初期化し、望ましい高分解能結果を生成する。
論文 参考訳(メタデータ) (2024-12-12T07:24:13Z) - A Wavelet Diffusion GAN for Image Super-Resolution [7.986370916847687]
拡散モデルは,高忠実度画像生成のためのGAN(Generative Adversarial Network)の優れた代替品として登場した。
しかし、そのリアルタイム実現性は、遅いトレーニングと推論速度によって妨げられている。
本研究では,ウェーブレットを用いた単一画像超解法のための条件拡散GANスキームを提案する。
論文 参考訳(メタデータ) (2024-10-23T15:34:06Z) - Diffusion Priors for Variational Likelihood Estimation and Image Denoising [10.548018200066858]
本稿では,現実の雑音に対処するために,逆拡散過程における適応的確率推定とMAP推定を提案する。
実世界の多様なデータセットの実験と分析により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-10-23T02:52:53Z) - Taming Diffusion Prior for Image Super-Resolution with Domain Shift SDEs [36.65594293655289]
DoSSRは、事前訓練された拡散モデルの生成力を生かしたドメインシフト拡散に基づくSRモデルである。
このアプローチの核となるのは、既存の拡散モデルとシームレスに統合されるドメインシフト方程式です。
提案手法は, 合成および実世界のデータセットに対して, 5つのサンプリングステップしか必要とせず, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-09-26T12:16:11Z) - Distilling Diffusion Models into Conditional GANs [90.76040478677609]
複雑な多段階拡散モデルを1段階条件付きGAN学生モデルに蒸留する。
E-LatentLPIPSは,拡散モデルの潜在空間で直接動作する知覚的損失である。
我々は, 最先端の1ステップ拡散蒸留モデルよりも優れた1ステップ発生器を実証した。
論文 参考訳(メタデータ) (2024-05-09T17:59:40Z) - JoReS-Diff: Joint Retinex and Semantic Priors in Diffusion Model for Low-light Image Enhancement [69.6035373784027]
低照度画像強調(LLIE)は条件付き拡散モデルを用いて有望な性能を実現している。
従来手法は、タスク固有の条件戦略の十分な定式化の重要性を無視するものであった。
本稿では,Retinex および semantic-based pre-processing condition を付加した新しいアプローチである JoReS-Diff を提案する。
論文 参考訳(メタデータ) (2023-12-20T08:05:57Z) - Variational Bayesian Imaging with an Efficient Surrogate Score-based Prior [7.155937118886449]
不完全, 雑音の計測により, クリーンな画像後部を狙う不完全な逆画像問題について考察する。
最近の研究は、スコアベースの拡散モデルを、不適切な画像問題を解くための原則化された先行モデルに変えた。
提案するサロゲート先行法は, スコアベース拡散モデルの低境界に基づくものである。
論文 参考訳(メタデータ) (2023-09-05T04:55:10Z) - ACDMSR: Accelerated Conditional Diffusion Models for Single Image
Super-Resolution [84.73658185158222]
本稿では,ACDMSRと呼ばれる拡散モデルに基づく超解像法を提案する。
提案手法は, 決定論的反復分解過程を通じて超解像を行うために, 標準拡散モデルに適応する。
提案手法は,低解像度画像に対してより視覚的に現実的な表現を生成し,現実的なシナリオにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2023-07-03T06:49:04Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。