論文の概要: Frequency Compensated Diffusion Model for Real-scene Dehazing
- arxiv url: http://arxiv.org/abs/2308.10510v2
- Date: Fri, 22 Sep 2023 23:43:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 01:22:06.549826
- Title: Frequency Compensated Diffusion Model for Real-scene Dehazing
- Title(参考訳): リアルタイムデハージングのための周波数補償拡散モデル
- Authors: Jing Wang, Songtao Wu, Kuanhong Xu, and Zhiqiang Yuan
- Abstract要約: 本研究では,実ヘイズへの一般化を改善する条件付き拡散モデルに基づく脱ヘイズフレームワークについて考察する。
提案手法は, 実世界の画像において, 最先端の手法よりも有意に優れていた。
- 参考スコア(独自算出の注目度): 6.105813272271171
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to distribution shift, deep learning based methods for image dehazing
suffer from performance degradation when applied to real-world hazy images. In
this paper, we consider a dehazing framework based on conditional diffusion
models for improved generalization to real haze. First, we find that optimizing
the training objective of diffusion models, i.e., Gaussian noise vectors, is
non-trivial. The spectral bias of deep networks hinders the higher frequency
modes in Gaussian vectors from being learned and hence impairs the
reconstruction of image details. To tackle this issue, we design a network
unit, named Frequency Compensation block (FCB), with a bank of filters that
jointly emphasize the mid-to-high frequencies of an input signal. We
demonstrate that diffusion models with FCB achieve significant gains in both
perceptual and distortion metrics. Second, to further boost the generalization
performance, we propose a novel data synthesis pipeline, HazeAug, to augment
haze in terms of degree and diversity. Within the framework, a solid baseline
for blind dehazing is set up where models are trained on synthetic hazy-clean
pairs, and directly generalize to real data. Extensive evaluations show that
the proposed dehazing diffusion model significantly outperforms
state-of-the-art methods on real-world images. Our code is at
https://github.com/W-Jilly/frequency-compensated-diffusion-model-pytorch.
- Abstract(参考訳): 分布シフトのため、深層学習に基づく画像デハジング手法は、実世界のハジング画像に適用すると性能低下に苦しむ。
本稿では,実ヘイズへの一般化を改善するための条件拡散モデルに基づくデヘイジングフレームワークについて検討する。
まず,拡散モデルの学習目標,すなわちガウス雑音ベクトルの最適化は非自明であることがわかった。
ディープネットワークのスペクトルバイアスは、ガウスベクトルの高周波数モードの学習を妨げるため、画像詳細の再構成を阻害する。
そこで本研究では,入力信号の中~高周波数を協調的に強調するフィルタバンクを用いた,周波数補償ブロック(fcb)と呼ばれるネットワークユニットを設計する。
fcbを用いた拡散モデルが知覚と歪みの指標の両方において有意な利益をもたらすことを実証する。
第2に,一般化性能をさらに向上させるため,HazAugという新たなデータ合成パイプラインを提案し,次数と多様性の観点からヘイズを増強する。
フレームワーク内では、ブラインドデハジングのためのソリッドベースラインが設定され、モデルが合成ハジークリーンペアに基づいてトレーニングされ、実際のデータに直接一般化される。
広範に評価した結果,提案手法は実世界画像の最先端手法を著しく上回ることがわかった。
私たちのコードはhttps://github.com/W-Jilly/ frequency-compensated-diffusion-model-pytorchにあります。
関連論文リスト
- TC-DiffRecon: Texture coordination MRI reconstruction method based on
diffusion model and modified MF-UNet method [2.626378252978696]
本稿では,T-DiffReconという名前の拡散モデルに基づくMRI再構成法を提案する。
また、モデルにより生成されたMRI画像の品質を高めるために、MF-UNetモジュールを組み込むことを提案する。
論文 参考訳(メタデータ) (2024-02-17T13:09:00Z) - Iterative Token Evaluation and Refinement for Real-World
Super-Resolution [77.74289677520508]
実世界の画像超解像(RWSR)は、低品質(LQ)画像が複雑で未同定の劣化を起こすため、長年にわたる問題である。
本稿では,RWSRのための反復的トークン評価・リファインメントフレームワークを提案する。
ITERはGAN(Generative Adversarial Networks)よりも訓練が容易であり,連続拡散モデルよりも効率的であることを示す。
論文 参考訳(メタデータ) (2023-12-09T17:07:32Z) - Recovering high-quality FODs from a reduced number of diffusion-weighted
images using a model-driven deep learning architecture [0.0]
モデル駆動型深層学習FOD再構成アーキテクチャを提案する。
ネットワークが生成する中間および出力FODが、入力されたDWI信号と一致していることを保証する。
モデルに基づくディープラーニングアーキテクチャは,最先端のFOD超解像ネットワークであるFOD-Netと比較して,競争性能が向上することを示す。
論文 参考訳(メタデータ) (2023-07-28T02:47:34Z) - ExposureDiffusion: Learning to Expose for Low-light Image Enhancement [87.08496758469835]
この研究は、拡散モデルと物理ベースの露光モデルとをシームレスに統合することで、この問題に対処する。
提案手法は,バニラ拡散モデルと比較して性能が大幅に向上し,推論時間を短縮する。
提案するフレームワークは、実際のペア付きデータセット、SOTAノイズモデル、および異なるバックボーンネットワークの両方で動作する。
論文 参考訳(メタデータ) (2023-07-15T04:48:35Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - GSURE-Based Diffusion Model Training with Corrupted Data [35.56267114494076]
本稿では, 劣化データのみに基づく生成拡散モデルのための新しいトレーニング手法を提案する。
顔画像と磁気共鳴画像(MRI)の撮影技術について紹介する。
論文 参考訳(メタデータ) (2023-05-22T15:27:20Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - Denoising Diffusion Models for Plug-and-Play Image Restoration [135.6359475784627]
本稿では,従来のプラグアンドプレイ方式を拡散サンプリングフレームワークに統合したDiffPIRを提案する。
DiffPIRは、差別的なガウスのデノイザーに依存するプラグアンドプレイIR法と比較して、拡散モデルの生成能力を継承することが期待されている。
論文 参考訳(メタデータ) (2023-05-15T20:24:38Z) - Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。
提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文 参考訳(メタデータ) (2023-04-10T17:54:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。