論文の概要: Consistent Diffusion: Denoising Diffusion Model with Data-Consistent Training for Image Restoration
- arxiv url: http://arxiv.org/abs/2412.12550v1
- Date: Tue, 17 Dec 2024 05:21:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 13:58:53.884557
- Title: Consistent Diffusion: Denoising Diffusion Model with Data-Consistent Training for Image Restoration
- Title(参考訳): 一貫性拡散:画像復元のためのデータ一貫性トレーニングを用いた拡散モデル
- Authors: Xinlong Cheng, Tiantian Cao, Guoan Cheng, Bangxuan Huang, Xinghan Tian, Ye Wang, Xiaoyu He, Weixin Li, Tianfan Xue, Xuan Dong,
- Abstract要約: 本稿では,画像復元作業における拡散モデル(DDM)の限界に対処する。
本稿では,DDMがトレーニング中に蓄積した誤りの画像にアクセスできるようにする,データ一貫性トレーニングという新しいトレーニング手法を提案する。
本手法は、歪みを効果的に最小化し、画像の忠実さを保ちながら、最先端の手法よりも大幅に改善されている。
- 参考スコア(独自算出の注目度): 9.745025353708865
- License:
- Abstract: In this work, we address the limitations of denoising diffusion models (DDMs) in image restoration tasks, particularly the shape and color distortions that can compromise image quality. While DDMs have demonstrated a promising performance in many applications such as text-to-image synthesis, their effectiveness in image restoration is often hindered by shape and color distortions. We observe that these issues arise from inconsistencies between the training and testing data used by DDMs. Based on our observation, we propose a novel training method, named data-consistent training, which allows the DDMs to access images with accumulated errors during training, thereby ensuring the model to learn to correct these errors. Experimental results show that, across five image restoration tasks, our method has significant improvements over state-of-the-art methods while effectively minimizing distortions and preserving image fidelity.
- Abstract(参考訳): 本研究では,画像復元作業における拡散モデル(DDM)の限界,特に画像品質を損なう可能性のある形状や色歪みに対処する。
DDMはテキスト・ツー・イメージ合成などの多くのアプリケーションで有望な性能を示したが、画像復元におけるその効果は、形状や色歪みによってしばしば妨げられている。
これらの問題は、DDMが使用するトレーニングデータとテストデータとの整合性から生じる。
そこで本研究では,データ一貫性トレーニング(Data-Consistent Training)と呼ばれる新たなトレーニング手法を提案する。
実験の結果, 5つの画像復元作業において, 歪みを最小化し, 画像の忠実さを保ちながら, 最先端の手法よりも大幅に改善されていることがわかった。
関連論文リスト
- Frequency-Aware Guidance for Blind Image Restoration via Diffusion Models [20.898262207229873]
ブラインド画像復元は、低レベルの視覚タスクにおいて重要な課題である。
誘導拡散モデルは、視覚的画像復元において有望な結果を得た。
本稿では,様々な拡散モデルにプラグイン・アンド・プレイ方式で組み込むことができる新しい周波数対応誘導損失を提案する。
論文 参考訳(メタデータ) (2024-11-19T12:18:16Z) - Learning Diffusion Model from Noisy Measurement using Principled Expectation-Maximization Method [9.173055778539641]
本稿では,任意の破損型を持つ雑音データから拡散モデルを反復的に学習する,原則的予測最大化(EM)フレームワークを提案する。
筆者らはモンテカルロ法を用いて,ノイズ測定からクリーンな画像を正確に推定し,次いで再構成画像を用いて拡散モデルを訓練した。
論文 参考訳(メタデータ) (2024-10-15T03:54:59Z) - PromptFix: You Prompt and We Fix the Photo [84.69812824355269]
言語モデルを備えた拡散モデルは、画像生成タスクにおいて優れた制御性を示す。
多様な命令追跡データの欠如は、モデルの開発を妨げている。
本稿では,人間の指示に従う拡散モデルを実現するフレームワークであるPromptFixを提案する。
論文 参考訳(メタデータ) (2024-05-27T03:13:28Z) - SeNM-VAE: Semi-Supervised Noise Modeling with Hierarchical Variational Autoencoder [13.453138169497903]
SeNM-VAEは、ペアとアンペアの両方のデータセットを利用して、現実的な劣化データを生成する半教師付きノイズモデリング手法である。
実世界の画像認識と超分解能タスクのためのペアトレーニングサンプルを生成するために,本手法を用いた。
提案手法は, 合成劣化画像の品質を, 他の不対とペアのノイズモデリング法と比較して向上させる。
論文 参考訳(メタデータ) (2024-03-26T09:03:40Z) - Gradpaint: Gradient-Guided Inpainting with Diffusion Models [71.47496445507862]
Denoising Diffusion Probabilistic Models (DDPM) は近年,条件付きおよび非条件付き画像生成において顕著な成果を上げている。
我々はGradPaintを紹介し、グローバルな一貫性のあるイメージに向けて世代を操る。
我々は、様々なデータセットで訓練された拡散モデルによく適応し、現在最先端の教師付きおよび教師なしの手法を改善している。
論文 参考訳(メタデータ) (2023-09-18T09:36:24Z) - Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.91471250967703]
我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。
このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。
様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文 参考訳(メタデータ) (2023-08-28T08:47:06Z) - Diffusion Models for Image Restoration and Enhancement -- A
Comprehensive Survey [96.99328714941657]
本稿では,近年の拡散モデルに基づく画像復元手法について概観する。
我々は、赤外線とブラインド/現実世界の両方で拡散モデルを用いて、革新的なデザインを分類し、強調する。
本稿では,拡散モデルに基づくIRの今後の研究に向けた5つの可能性と課題を提案する。
論文 参考訳(メタデータ) (2023-08-18T08:40:38Z) - SinDDM: A Single Image Denoising Diffusion Model [28.51951207066209]
単一画像上でのデノナイズ拡散モデルをトレーニングするためのフレームワークを提案する。
SinDDMを作成した本手法では,マルチスケール拡散プロセスを用いてトレーニング画像の内部統計を学習する。
これは、スタイル転送や調和など、幅広いタスクに適用できる。
論文 参考訳(メタデータ) (2022-11-29T20:44:25Z) - Denoising Diffusion Restoration Models [110.1244240726802]
Denoising Diffusion Restoration Models (DDRM) は効率的で教師なしの後方サンプリング手法である。
DDRMの汎用性を、超高解像度、デブロアリング、インペイント、カラー化のためにいくつかの画像データセットに示す。
論文 参考訳(メタデータ) (2022-01-27T20:19:07Z) - Data augmentation for deep learning based accelerated MRI reconstruction
with limited data [46.44703053411933]
ディープニューラルネットワークは、画像復元と再構成タスクの非常に成功したツールとして登場した。
最先端のパフォーマンスを達成するためには、大規模で多様な画像集合の訓練が重要であると考えられる。
本稿では,MRI画像再構成の高速化のためのデータ拡張のためのパイプラインを提案し,必要なトレーニングデータを削減する上での有効性について検討する。
論文 参考訳(メタデータ) (2021-06-28T19:08:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。