論文の概要: Reconstruct-and-Generate Diffusion Model for Detail-Preserving Image
Denoising
- arxiv url: http://arxiv.org/abs/2309.10714v1
- Date: Tue, 19 Sep 2023 16:01:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 13:44:01.194548
- Title: Reconstruct-and-Generate Diffusion Model for Detail-Preserving Image
Denoising
- Title(参考訳): ディテール保存画像の再構成・生成拡散モデル
- Authors: Yujin Wang, Lingen Li, Tianfan Xue, Jinwei Gu
- Abstract要約: 再構成・生成拡散モデル(Reconstruct-and-Generate Diffusion Model, RnG)と呼ばれる新しい手法を提案する。
提案手法は, 再構成型復調ネットワークを利用して, 基礎となるクリーン信号の大半を復元する。
拡散アルゴリズムを用いて残留する高周波の詳細を生成し、視覚的品質を向上させる。
- 参考スコア(独自算出の注目度): 16.43285056788183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image denoising is a fundamental and challenging task in the field of
computer vision. Most supervised denoising methods learn to reconstruct clean
images from noisy inputs, which have intrinsic spectral bias and tend to
produce over-smoothed and blurry images. Recently, researchers have explored
diffusion models to generate high-frequency details in image restoration tasks,
but these models do not guarantee that the generated texture aligns with real
images, leading to undesirable artifacts. To address the trade-off between
visual appeal and fidelity of high-frequency details in denoising tasks, we
propose a novel approach called the Reconstruct-and-Generate Diffusion Model
(RnG). Our method leverages a reconstructive denoising network to recover the
majority of the underlying clean signal, which serves as the initial estimation
for subsequent steps to maintain fidelity. Additionally, it employs a diffusion
algorithm to generate residual high-frequency details, thereby enhancing visual
quality. We further introduce a two-stage training scheme to ensure effective
collaboration between the reconstructive and generative modules of RnG. To
reduce undesirable texture introduced by the diffusion model, we also propose
an adaptive step controller that regulates the number of inverse steps applied
by the diffusion model, allowing control over the level of high-frequency
details added to each patch as well as saving the inference computational cost.
Through our proposed RnG, we achieve a better balance between perception and
distortion. We conducted extensive experiments on both synthetic and real
denoising datasets, validating the superiority of the proposed approach.
- Abstract(参考訳): 画像の認知はコンピュータビジョンの分野における基本的な課題である。
ほとんどの教師付き遮音法は、固有のスペクトルバイアスを持つノイズの多い入力からクリーンなイメージを再構築し、過度に滑らかでぼやけた画像を生成する傾向がある。
近年,画像復元作業において高頻度の詳細を生成する拡散モデルが検討されているが,これらのモデルでは生成したテクスチャが実際の画像と一致していることは保証されていない。
視覚刺激と高頻度ディテールの忠実性とのトレードオフに対処するため,再構成・生成拡散モデル(rng)と呼ばれる新しい手法を提案する。
提案手法では, 再構成型雑音化ネットワークを用いて, 基礎となるクリーン信号の大部分を復元し, 忠実性を維持するための初期推定を行う。
さらに、拡散アルゴリズムを使用して、残高周波詳細を生成し、視覚品質を向上させる。
さらに、RnGの再構成モジュールと生成モジュール間の効果的な協調を保証するための2段階のトレーニングスキームを導入する。
また,拡散モデルによって導入された望ましくないテクスチャを低減するために,拡散モデルが適用する逆ステップの数を調整し,各パッチに付加される高周波の詳細のレベルを制御し,推論計算コストを削減できる適応ステップ制御器を提案する。
提案したRnGにより,知覚と歪みのバランスが良くなる。
提案手法の優位性を検証するため,合成データと実データの両方について広範な実験を行った。
関連論文リスト
- Gradient-Guided Conditional Diffusion Models for Private Image Reconstruction: Analyzing Adversarial Impacts of Differential Privacy and Denoising [21.30726250408398]
現在の勾配に基づく再構成手法は、計算複雑性と事前知識の要求により、高解像度画像に苦慮している。
本稿では,拡散モデルの生成過程に最小限の変更を必要とする2つの新しい手法を提案し,事前知識の必要性を排除した。
我々は,差分プライバシーノイズが再構成画像の品質に与える影響を総合的に理論的に分析し,雑音の大きさ,攻撃モデルのアーキテクチャ,攻撃者の復元能力との関係を明らかにする。
論文 参考訳(メタデータ) (2024-11-05T12:39:21Z) - Ultrasound Imaging based on the Variance of a Diffusion Restoration Model [7.360352432782388]
本稿では, 線形直列モデルと学習に基づく先行モデルを組み合わせたハイブリッド再構成手法を提案する。
我々は,高品質な画像再構成を実現するための分散イメージング手法の有効性を実証し,合成,in-vitro,in-vivoデータの実験を行った。
論文 参考訳(メタデータ) (2024-03-22T16:10:38Z) - Spatial-and-Frequency-aware Restoration method for Images based on
Diffusion Models [7.947387272047602]
画像復元のための空間・周波数対応拡散モデルSaFaRIを提案する。
本モデルでは,空間領域と周波数領域の両領域において画像の忠実度を保ち,再現性の向上を図っている。
我々の徹底的な評価は、SaFaRIがImageNetデータセットとFFHQデータセットの両方で最先端のパフォーマンスを実現していることを示している。
論文 参考訳(メタデータ) (2024-01-31T07:11:01Z) - Resfusion: Denoising Diffusion Probabilistic Models for Image Restoration Based on Prior Residual Noise [34.65659277870287]
微分拡散モデルの研究は、画像復元の分野への応用を拡大した。
本稿では,残余項を拡散前進過程に組み込むフレームワークであるResfusionを提案する。
Resfusionは, ISTDデータセット, LOLデータセット, Raindropデータセットに対して, わずか5つのサンプリングステップで競合性能を示すことを示す。
論文 参考訳(メタデータ) (2023-11-25T02:09:38Z) - Towards High-quality HDR Deghosting with Conditional Diffusion Models [88.83729417524823]
高ダイナミックレンジ(LDR)画像は、既存のディープニューラルネットワーク(DNN)技術により、複数の低ダイナミックレンジ(LDR)画像から復元することができる。
DNNは、LDR画像が飽和度と大きな動きを持つ場合、ゴーストアーティファクトを生成する。
拡散モデルの条件としてLDR特徴を利用する画像生成としてHDRデゴースト問題を定式化する。
論文 参考訳(メタデータ) (2023-11-02T01:53:55Z) - Diffusion Reconstruction of Ultrasound Images with Informative
Uncertainty [5.375425938215277]
超音波画像の品質を高めるには、コントラスト、解像度、スペックル保存といった同時的な要因のバランスを取る必要がある。
拡散モデルの進歩を生かしたハイブリッドアプローチを提案する。
シミュレーション,in-vitro,in-vivoデータの総合的な実験を行い,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2023-10-31T16:51:40Z) - Gradpaint: Gradient-Guided Inpainting with Diffusion Models [71.47496445507862]
Denoising Diffusion Probabilistic Models (DDPM) は近年,条件付きおよび非条件付き画像生成において顕著な成果を上げている。
我々はGradPaintを紹介し、グローバルな一貫性のあるイメージに向けて世代を操る。
我々は、様々なデータセットで訓練された拡散モデルによく適応し、現在最先端の教師付きおよび教師なしの手法を改善している。
論文 参考訳(メタデータ) (2023-09-18T09:36:24Z) - Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.91471250967703]
我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。
このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。
様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文 参考訳(メタデータ) (2023-08-28T08:47:06Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - SAR Despeckling using a Denoising Diffusion Probabilistic Model [52.25981472415249]
スペックルの存在は画像品質を劣化させ、SAR画像理解アプリケーションの性能に悪影響を及ぼす。
本稿では,SAR脱種のための拡散確率モデルであるSAR-DDPMを紹介する。
提案手法は, 最先端の切り離し法と比較して, 定量化と定性化の両面で有意な改善を実現している。
論文 参考訳(メタデータ) (2022-06-09T14:00:26Z) - Dual Adversarial Network: Toward Real-world Noise Removal and Noise
Generation [52.75909685172843]
実世界の画像ノイズ除去は、コンピュータビジョンにおける長年の課題である。
本稿では,ノイズ除去およびノイズ発生タスクに対処する新しい統合フレームワークを提案する。
本手法はクリーンノイズ画像対の連成分布を学習する。
論文 参考訳(メタデータ) (2020-07-12T09:16:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。