論文の概要: Semi-supervised Image Dehazing via Expectation-Maximization and Bidirectional Brownian Bridge Diffusion Models
- arxiv url: http://arxiv.org/abs/2508.11165v1
- Date: Fri, 15 Aug 2025 02:33:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.714792
- Title: Semi-supervised Image Dehazing via Expectation-Maximization and Bidirectional Brownian Bridge Diffusion Models
- Title(参考訳): 予測最大化と双方向ブラウン橋拡散モデルによる半教師付き画像デハジング
- Authors: Bing Liu, Le Wang, Mingming Liu, Hao Liu, Rui Yao, Yong Zhou, Peng Liu, Tongqiang Xia,
- Abstract要約: 既存のデハジング手法は、特に濃厚なヘイズシーンの難易度で現実世界のヘイズ画像を扱う。
本稿では,2段階学習方式による予測最大化と双方向ブラウン橋拡散モデル(EM-B3DM)を用いた半教師付き画像デハージング手法を提案する。
- 参考スコア(独自算出の注目度): 29.360740391829935
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing dehazing methods deal with real-world haze images with difficulty, especially scenes with thick haze. One of the main reasons is the lack of real-world paired data and robust priors. To avoid the costly collection of paired hazy and clear images, we propose an efficient semi-supervised image dehazing method via Expectation-Maximization and Bidirectional Brownian Bridge Diffusion Models (EM-B3DM) with a two-stage learning scheme. In the first stage, we employ the EM algorithm to decouple the joint distribution of paired hazy and clear images into two conditional distributions, which are then modeled using a unified Brownian Bridge diffusion model to directly capture the structural and content-related correlations between hazy and clear images. In the second stage, we leverage the pre-trained model and large-scale unpaired hazy and clear images to further improve the performance of image dehazing. Additionally, we introduce a detail-enhanced Residual Difference Convolution block (RDC) to capture gradient-level information, significantly enhancing the model's representation capability. Extensive experiments demonstrate that our EM-B3DM achieves superior or at least comparable performance to state-of-the-art methods on both synthetic and real-world datasets.
- Abstract(参考訳): 既存のデハジング手法は、特に濃厚なヘイズシーンの難易度で現実世界のヘイズ画像を扱う。
主な理由の1つは、実世界のペアデータと堅牢な事前データがないことである。
そこで本研究では,2段階学習方式による予測最大化と双方向ブラウン橋拡散モデル(EM-B3DM)を用いた半教師付き画像デハージング手法を提案する。
第1段階では,2つの条件分布に2つの条件分布を分割するためにEMアルゴリズムを用い,これをブラウン橋拡散モデルを用いてモデル化し,ハジー画像とクリア画像間の構造的および内容的相関を直接捉える。
第2段階では、事前訓練されたモデルと大規模な未ペア画像と鮮明な画像を活用して、画像デハージングの性能をさらに向上する。
さらに、勾配レベルの情報を取得するための詳細強化されたResidual Difference Convolution Block (RDC)を導入し、モデルの表現能力を著しく向上させる。
我々のEM-B3DMは、合成と実世界の両方のデータセットにおける最先端の手法よりも優れているか、少なくとも同等のパフォーマンスを達成している。
関連論文リスト
- Residual-based Efficient Bidirectional Diffusion Model for Image Dehazing and Haze Generation [17.043633726365233]
現在のディープデヘイズ法は、ヘイズフリー画像とヘイズフリー画像の翻訳能力に欠け、ヘイズ画像からヘイズを除去することのみに焦点を当てている。
本研究では, 残差に基づく効率的な双方向拡散モデル (RBDM) を提案し, 脱ハジングとヘイズ生成の両方の条件分布をモデル化する。
RBDMは,15ステップのサンプリングで,ヘイズフリー画像とヘイズ画像の双方向化を実現することに成功した。
論文 参考訳(メタデータ) (2025-08-15T01:00:15Z) - A Simple Combination of Diffusion Models for Better Quality Trade-Offs in Image Denoising [43.44633086975204]
本稿では,事前学習した拡散モデルを活用するための直感的な手法を提案する。
次に,提案する線形結合拡散デノイザについて紹介する。
LCDDは最先端のパフォーマンスを達成し、制御され、よく機能するトレードオフを提供する。
論文 参考訳(メタデータ) (2025-03-18T19:02:19Z) - LDM-ISP: Enhancing Neural ISP for Low Light with Latent Diffusion Models [54.93010869546011]
本稿では,事前学習した潜伏拡散モデルを用いて,超低照度画像の高精細化のためのニューラルISPを実現することを提案する。
具体的には、RAWドメイン上で動作するために事前訓練された潜在拡散モデルを調整するために、軽量なテーミングモジュールのセットをトレーニングする。
遅延拡散モデルにおけるUNet復調と復号化の異なる役割を観察し、低照度画像強調タスクを遅延空間低周波コンテンツ生成と復号位相高周波ディテール保守に分解するきっかけとなる。
論文 参考訳(メタデータ) (2023-12-02T04:31:51Z) - ToddlerDiffusion: Interactive Structured Image Generation with Cascaded Schrödinger Bridge [63.00793292863]
ToddlerDiffusionは、RGB画像生成の複雑なタスクを、よりシンプルで解釈可能なステージに分解するための新しいアプローチである。
提案手法はToddler Diffusionと呼ばれ,それぞれが中間表現を生成する責務を担っている。
ToddlerDiffusionは、常に最先端のメソッドより優れています。
論文 参考訳(メタデータ) (2023-11-24T15:20:01Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。