論文の概要: RestoreGrad: Signal Restoration Using Conditional Denoising Diffusion Models with Jointly Learned Prior
- arxiv url: http://arxiv.org/abs/2502.13574v1
- Date: Wed, 19 Feb 2025 09:29:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-20 13:58:39.300448
- Title: RestoreGrad: Signal Restoration Using Conditional Denoising Diffusion Models with Jointly Learned Prior
- Title(参考訳): RestoreGrad: 先行学習条件付き拡散モデルを用いた信号復元
- Authors: Ching-Hua Lee, Chouchang Yang, Jaejin Cho, Yashas Malur Saidutta, Rakshith Sharma Srinivasa, Yilin Shen, Hongxia Jin,
- Abstract要約: 本稿では,信号復元のための条件付きDDPMの改良を,より情報に富んだ先行手法を用いて提案する。
RestoreGradと呼ばれる提案されたフレームワークは、DDPMを可変オートエンコーダフレームワークにシームレスに統合する。
音声と画像の復元タスクにおいて、RestoreGradはより高速な収束(5~10倍のトレーニングステップ)を示し、復元信号のより良い品質を実現する。
- 参考スコア(独自算出の注目度): 42.55917146449122
- License:
- Abstract: Denoising diffusion probabilistic models (DDPMs) can be utilized for recovering a clean signal from its degraded observation(s) by conditioning the model on the degraded signal. The degraded signals are themselves contaminated versions of the clean signals; due to this correlation, they may encompass certain useful information about the target clean data distribution. However, existing adoption of the standard Gaussian as the prior distribution in turn discards such information, resulting in sub-optimal performance. In this paper, we propose to improve conditional DDPMs for signal restoration by leveraging a more informative prior that is jointly learned with the diffusion model. The proposed framework, called RestoreGrad, seamlessly integrates DDPMs into the variational autoencoder framework and exploits the correlation between the degraded and clean signals to encode a better diffusion prior. On speech and image restoration tasks, we show that RestoreGrad demonstrates faster convergence (5-10 times fewer training steps) to achieve better quality of restored signals over existing DDPM baselines, and improved robustness to using fewer sampling steps in inference time (2-2.5 times fewer), advocating the advantages of leveraging jointly learned prior for efficiency improvements in the diffusion process.
- Abstract(参考訳): 拡散確率モデル(DDPM)は、劣化した信号にモデルを条件付けすることにより、その劣化した観測(s)からクリーンな信号を回復するために利用することができる。
劣化した信号は、それ自体が汚染されたクリーン信号のバージョンであり、この相関関係により、ターゲットのクリーンデータ分布に関する有用な情報を含んでいる可能性がある。
しかし、既存の標準ガウシアンを以前の分布として採用すると、そのような情報は捨てられ、結果として準最適性能がもたらされる。
本稿では,拡散モデルと共同で学習したより情報性の高い事前情報を活用することにより,信号復元のための条件付きDDPMを改善することを提案する。
提案したフレームワークはRestoreGradと呼ばれ、DDPMを可変オートエンコーダフレームワークにシームレスに統合し、劣化信号とクリーン信号の相関を利用して、より優れた拡散を符号化する。
音声と画像の復元タスクにおいて、RestoreGradは既存のDDPMベースラインよりも高速な収束(5~10倍のトレーニングステップ)を実現し、推論時間に少ないサンプリングステップ(2~2.5倍の少ないサンプリングステップ)を使用することによるロバスト性を向上し、拡散過程における効率改善のために共同学習された事前活用の利点を提唱する。
関連論文リスト
- RED: Residual Estimation Diffusion for Low-Dose PET Sinogram Reconstruction [8.152999560646371]
残留エスティメーション拡散(RED)という拡散モデルを提案する。
拡散機構の観点からは、REDは拡散過程におけるガウスノイズを置き換えるためにシングラム間の残差を用いる。
実験の結果,REDは低用量シングラムの品質と再建成績を良好に向上させることがわかった。
論文 参考訳(メタデータ) (2024-11-08T06:19:29Z) - LoRID: Low-Rank Iterative Diffusion for Adversarial Purification [3.735798190358]
本研究は拡散に基づく浄化法に関する情報理論的な考察である。
内在的浄化誤差の低い対向摂動を除去する新しい低ランク反復拡散浄化法であるLoRIDを導入する。
LoRIDは、ホワイトボックスとブラックボックスの設定の両方で、CIFAR-10/100、CelebA-HQ、ImageNetデータセットで優れた堅牢性を実現する。
論文 参考訳(メタデータ) (2024-09-12T17:51:25Z) - Integrating Amortized Inference with Diffusion Models for Learning Clean Distribution from Corrupted Images [19.957503854446735]
拡散モデル(DM)は、逆問題を解決するための強力な生成モデルとして登場した。
FlowDiffは条件付き正規化フローモデルを利用して、破損したデータソース上で拡散モデルのトレーニングを容易にする共同トレーニングパラダイムである。
実験の結果,FlowDiffは広範囲の破損したデータソースにわたるクリーンな分布を効果的に学習できることがわかった。
論文 参考訳(メタデータ) (2024-07-15T18:33:20Z) - Latent Diffusion Model-Enabled Low-Latency Semantic Communication in the Presence of Semantic Ambiguities and Wireless Channel Noises [18.539501941328393]
本稿では,ソースデータのアウトレイラを処理するために,遅延拡散モデルを用いたSemComシステムを開発した。
軽量な単層遅延空間変換アダプタは、送信機でのワンショット学習を完了させる。
終端整合蒸留法を用いて, 潜時空間で訓練した拡散模型を蒸留する。
論文 参考訳(メタデータ) (2024-06-09T23:39:31Z) - DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - BlindDiff: Empowering Degradation Modelling in Diffusion Models for Blind Image Super-Resolution [52.47005445345593]
BlindDiff は SISR のブラインド劣化に対処するための DM ベースのブラインドSR 手法である。
BlindDiffはMAPベースの最適化をDMにシームレスに統合する。
合成データセットと実世界のデータセットの両方の実験は、BlindDiffが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2024-03-15T11:21:34Z) - Conditional Denoising Diffusion Probabilistic Models for Data Reconstruction Enhancement in Wireless Communications [12.218161437914118]
無線チャネル上でのデータ伝送と再構成を強化するために,条件付き拡散確率モデル(DDPM)を提案する。
これに触発された鍵となる考え方は、情報信号の「ノイズからクリーン」変換を学ぶ際に、拡散モデルの生成的先行性を活用することである。
提案手法は,情報内容の事前知識が利用可能な通信シナリオに有効である。
論文 参考訳(メタデータ) (2023-10-30T11:33:01Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - Exploiting Diffusion Prior for Real-World Image Super-Resolution [75.5898357277047]
本稿では,事前学習したテキスト・画像拡散モデルにカプセル化された事前知識を視覚的超解像に活用するための新しいアプローチを提案する。
時間認識エンコーダを用いることで、事前学習した合成モデルを変更することなく、有望な復元結果が得られる。
論文 参考訳(メタデータ) (2023-05-11T17:55:25Z) - Dimensionality-Varying Diffusion Process [52.52681373641533]
拡散モデルは、信号破壊プロセスを逆転して新しいデータを生成することを学習する。
信号分解による前方拡散過程の理論的一般化を行う。
FFHQで訓練された拡散モデルのFIDを,52.40から10.46までの1024Times1024$解像度で改善する。
論文 参考訳(メタデータ) (2022-11-29T09:05:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。