論文の概要: Reconstruct-and-Generate Diffusion Model for Detail-Preserving Image
Denoising
- arxiv url: http://arxiv.org/abs/2309.10714v1
- Date: Tue, 19 Sep 2023 16:01:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 13:44:01.194548
- Title: Reconstruct-and-Generate Diffusion Model for Detail-Preserving Image
Denoising
- Title(参考訳): ディテール保存画像の再構成・生成拡散モデル
- Authors: Yujin Wang, Lingen Li, Tianfan Xue, Jinwei Gu
- Abstract要約: 再構成・生成拡散モデル(Reconstruct-and-Generate Diffusion Model, RnG)と呼ばれる新しい手法を提案する。
提案手法は, 再構成型復調ネットワークを利用して, 基礎となるクリーン信号の大半を復元する。
拡散アルゴリズムを用いて残留する高周波の詳細を生成し、視覚的品質を向上させる。
- 参考スコア(独自算出の注目度): 16.43285056788183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image denoising is a fundamental and challenging task in the field of
computer vision. Most supervised denoising methods learn to reconstruct clean
images from noisy inputs, which have intrinsic spectral bias and tend to
produce over-smoothed and blurry images. Recently, researchers have explored
diffusion models to generate high-frequency details in image restoration tasks,
but these models do not guarantee that the generated texture aligns with real
images, leading to undesirable artifacts. To address the trade-off between
visual appeal and fidelity of high-frequency details in denoising tasks, we
propose a novel approach called the Reconstruct-and-Generate Diffusion Model
(RnG). Our method leverages a reconstructive denoising network to recover the
majority of the underlying clean signal, which serves as the initial estimation
for subsequent steps to maintain fidelity. Additionally, it employs a diffusion
algorithm to generate residual high-frequency details, thereby enhancing visual
quality. We further introduce a two-stage training scheme to ensure effective
collaboration between the reconstructive and generative modules of RnG. To
reduce undesirable texture introduced by the diffusion model, we also propose
an adaptive step controller that regulates the number of inverse steps applied
by the diffusion model, allowing control over the level of high-frequency
details added to each patch as well as saving the inference computational cost.
Through our proposed RnG, we achieve a better balance between perception and
distortion. We conducted extensive experiments on both synthetic and real
denoising datasets, validating the superiority of the proposed approach.
- Abstract(参考訳): 画像の認知はコンピュータビジョンの分野における基本的な課題である。
ほとんどの教師付き遮音法は、固有のスペクトルバイアスを持つノイズの多い入力からクリーンなイメージを再構築し、過度に滑らかでぼやけた画像を生成する傾向がある。
近年,画像復元作業において高頻度の詳細を生成する拡散モデルが検討されているが,これらのモデルでは生成したテクスチャが実際の画像と一致していることは保証されていない。
視覚刺激と高頻度ディテールの忠実性とのトレードオフに対処するため,再構成・生成拡散モデル(rng)と呼ばれる新しい手法を提案する。
提案手法では, 再構成型雑音化ネットワークを用いて, 基礎となるクリーン信号の大部分を復元し, 忠実性を維持するための初期推定を行う。
さらに、拡散アルゴリズムを使用して、残高周波詳細を生成し、視覚品質を向上させる。
さらに、RnGの再構成モジュールと生成モジュール間の効果的な協調を保証するための2段階のトレーニングスキームを導入する。
また,拡散モデルによって導入された望ましくないテクスチャを低減するために,拡散モデルが適用する逆ステップの数を調整し,各パッチに付加される高周波の詳細のレベルを制御し,推論計算コストを削減できる適応ステップ制御器を提案する。
提案したRnGにより,知覚と歪みのバランスが良くなる。
提案手法の優位性を検証するため,合成データと実データの両方について広範な実験を行った。
関連論文リスト
- Spatial-and-Frequency-aware Restoration method for Images based on
Diffusion Models [7.947387272047602]
画像復元のための空間・周波数対応拡散モデルSaFaRIを提案する。
本モデルでは,空間領域と周波数領域の両領域において画像の忠実度を保ち,再現性の向上を図っている。
我々の徹底的な評価は、SaFaRIがImageNetデータセットとFFHQデータセットの両方で最先端のパフォーマンスを実現していることを示している。
論文 参考訳(メタデータ) (2024-01-31T07:11:01Z) - Towards High-quality HDR Deghosting with Conditional Diffusion Models [88.83729417524823]
高ダイナミックレンジ(LDR)画像は、既存のディープニューラルネットワーク(DNN)技術により、複数の低ダイナミックレンジ(LDR)画像から復元することができる。
DNNは、LDR画像が飽和度と大きな動きを持つ場合、ゴーストアーティファクトを生成する。
拡散モデルの条件としてLDR特徴を利用する画像生成としてHDRデゴースト問題を定式化する。
論文 参考訳(メタデータ) (2023-11-02T01:53:55Z) - Diffusion Reconstruction of Ultrasound Images with Informative
Uncertainty [5.375425938215277]
超音波画像の品質を高めるには、コントラスト、解像度、スペックル保存といった同時的な要因のバランスを取る必要がある。
拡散モデルの進歩を生かしたハイブリッドアプローチを提案する。
シミュレーション,in-vitro,in-vivoデータの総合的な実験を行い,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2023-10-31T16:51:40Z) - Gradpaint: Gradient-Guided Inpainting with Diffusion Models [71.47496445507862]
Denoising Diffusion Probabilistic Models (DDPM) は近年,条件付きおよび非条件付き画像生成において顕著な成果を上げている。
我々はGradPaintを紹介し、グローバルな一貫性のあるイメージに向けて世代を操る。
我々は、様々なデータセットで訓練された拡散モデルによく適応し、現在最先端の教師付きおよび教師なしの手法を改善している。
論文 参考訳(メタデータ) (2023-09-18T09:36:24Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - CurvPnP: Plug-and-play Blind Image Restoration with Deep Curvature
Denoiser [7.442030347967277]
既存のプラグアンドプレイ画像復元法は、非盲検に設計されている。
本稿では,より複雑な画像復元問題に対処できる,視覚障害者のための新しい枠組みを提案する。
本モデルでは,ノイズレベルが異なる場合でも,微細な構造を再現できることが示されている。
論文 参考訳(メタデータ) (2022-11-14T11:30:24Z) - SAR Despeckling using a Denoising Diffusion Probabilistic Model [52.25981472415249]
スペックルの存在は画像品質を劣化させ、SAR画像理解アプリケーションの性能に悪影響を及ぼす。
本稿では,SAR脱種のための拡散確率モデルであるSAR-DDPMを紹介する。
提案手法は, 最先端の切り離し法と比較して, 定量化と定性化の両面で有意な改善を実現している。
論文 参考訳(メタデータ) (2022-06-09T14:00:26Z) - Unsupervised Denoising of Retinal OCT with Diffusion Probabilistic Model [0.2578242050187029]
本稿では,信号の代わりにノイズから学習するための拡散確率モデルを提案する。
本手法は,簡単な作業パイプラインと少量のトレーニングデータを用いて,画像品質を著しく向上させることができる。
論文 参考訳(メタデータ) (2022-01-27T19:02:38Z) - High-Frequency aware Perceptual Image Enhancement [0.08460698440162888]
マルチスケール解析に適した新しいディープニューラルネットワークを導入し,効率的なモデルに依存しない手法を提案する。
本モデルは,デノイング,デブロアリング,単一画像超解像などのマルチスケール画像強調問題に適用できる。
論文 参考訳(メタデータ) (2021-05-25T07:33:14Z) - Dual Adversarial Network: Toward Real-world Noise Removal and Noise
Generation [52.75909685172843]
実世界の画像ノイズ除去は、コンピュータビジョンにおける長年の課題である。
本稿では,ノイズ除去およびノイズ発生タスクに対処する新しい統合フレームワークを提案する。
本手法はクリーンノイズ画像対の連成分布を学習する。
論文 参考訳(メタデータ) (2020-07-12T09:16:06Z) - Variational Denoising Network: Toward Blind Noise Modeling and Removal [59.36166491196973]
ブラインド画像のデノイングはコンピュータビジョンにおいて重要な問題であるが、非常に難しい問題である。
本稿では,ノイズ推定と画像デノーミングを併用した新しい変分推論手法を提案する。
論文 参考訳(メタデータ) (2019-08-29T15:54:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。