Fugu-MT 論文翻訳(概要): ResDiff: Combining CNN and Diffusion Model for Image Super-Resolution

論文の概要: ResDiff: Combining CNN and Diffusion Model for Image Super-Resolution

arxiv url: http://arxiv.org/abs/2303.08714v3
Date: Fri, 2 Feb 2024 10:36:37 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-05 20:41:33.584220
Title: ResDiff: Combining CNN and Diffusion Model for Image Super-Resolution
Title（参考訳）: ResDiff:超解像のためのCNNと拡散モデルの組み合わせ
Authors: Shuyao Shang, Zhengyang Shan, Guangxing Liu, LunQian Wang, XingHua Wang, Zekai Zhang, Jinglin Zhang
Abstract要約: ResDiffはSingle Image Super-Resolution (SISR)のための残差構造に基づく新しい拡散確率モデルである MR画像を直接HR空間へ誘導する拡散に基づく一般的な手法とは対照的に、ResDiffはCNNの初期予測を利用してHR空間とCNN予測空間の間の残留空間へノイズを誘導する。複数のベンチマークデータセットの実験により、ResDiffはモデル収束時間の短縮、生成品質の向上、より多様なサンプルの観点から、従来の拡散に基づく手法よりも優れていることが示された。
参考スコア（独自算出の注目度）: 4.885537700693487
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Adapting the Diffusion Probabilistic Model (DPM) for direct image super-resolution is wasteful, given that a simple Convolutional Neural Network (CNN) can recover the main low-frequency content. Therefore, we present ResDiff, a novel Diffusion Probabilistic Model based on Residual structure for Single Image Super-Resolution (SISR). ResDiff utilizes a combination of a CNN, which restores primary low-frequency components, and a DPM, which predicts the residual between the ground-truth image and the CNN predicted image. In contrast to the common diffusion-based methods that directly use LR images to guide the noise towards HR space, ResDiff utilizes the CNN's initial prediction to direct the noise towards the residual space between HR space and CNN-predicted space, which not only accelerates the generation process but also acquires superior sample quality. Additionally, a frequency-domain-based loss function for CNN is introduced to facilitate its restoration, and a frequency-domain guided diffusion is designed for DPM on behalf of predicting high-frequency details. The extensive experiments on multiple benchmark datasets demonstrate that ResDiff outperforms previous diffusion based methods in terms of shorter model convergence time, superior generation quality, and more diverse samples.
Abstract（参考訳）: 単純な畳み込みニューラルネットワーク(cnn)が主低周波コンテンツを復元できるため、拡散確率モデル(dpm)を直接画像の超解像に適応することは無駄である。そこで,Single Image Super-Resolution (SISR)のための残像構造に基づく拡散確率モデルResDiffを提案する。 ResDiffは、一次低周波成分を復元するCNNと、地上構造画像とCNN予測画像の間の残差を予測するDPMの組み合わせを利用する。 MR画像を直接HR空間へ誘導する拡散法とは対照的に、ResDiffはCNNの初期予測を利用して、HR空間とCNN予測空間の間の残留空間に向けてノイズを誘導し、生成プロセスを加速するだけでなく、優れたサンプル品質を得る。また, 周波数領域に基づくcnnの損失関数を導入し, 復元を容易にするとともに, 周波数領域誘導拡散をdpm向けに設計した。複数のベンチマークデータセットに関する広範な実験により、ResDiffはより短いモデル収束時間、より優れた生成品質、より多様なサンプルの観点から、従来の拡散に基づく手法よりも優れていることが示された。

関連論文リスト

SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文参考訳（メタデータ） (2025-03-16T12:32:11Z)
DeltaDiff: Reality-Driven Diffusion with AnchorResiduals for Faithful SR [10.790771977682763]
拡散過程を制約する新しいフレーム・ワークであるDeltaDiffを提案する。提案手法は最先端のモデルを超え,忠実度を向上した再侮辱を生成する。この研究は、画像再構成タスクに拡散モデルを適用するための、新しい低ランク制約パラパラダイムを確立する。
論文参考訳（メタデータ） (2025-02-18T06:07:14Z)
MaRS: A Fast Sampler for Mean Reverting Diffusion based on ODE and SDE Solvers [12.639167101005695]
平均回帰(MR)拡散は微分方程式(SDE)の構造を直接修飾する現在のトレーニングフリーの高速サンプリング器はMR拡散には直接適用されない。 MR拡散のサンプリングNFEを削減するために,MARS (MR Sampler) という新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-02-11T14:57:33Z)
Effective Diffusion Transformer Architecture for Image Super-Resolution [63.254644431016345]
画像超解像のための効果的な拡散変換器(DiT-SR)を設計する。実際には、DiT-SRは全体のU字型アーキテクチャを活用し、すべての変圧器ブロックに対して均一な等方性設計を採用する。我々は、広く使われているAdaLNの制限を分析し、周波数適応型時間-ステップ条件付けモジュールを提案する。
論文参考訳（メタデータ） (2024-09-29T07:14:16Z)
Timestep-Aware Diffusion Model for Extreme Image Rescaling [47.89362819768323]
本稿では,時間認識拡散モデル(TADM)と呼ばれる,画像再スケーリングのための新しいフレームワークを提案する。 TADMは、事前訓練されたオートエンコーダの潜在空間で再スケーリング操作を行う。これは、事前訓練されたテキスト・ツー・イメージ拡散モデルによって学習された強力な自然画像の先行を効果的に活用する。
論文参考訳（メタデータ） (2024-08-17T09:51:42Z)
Highly Accelerated MRI via Implicit Neural Representation Guided Posterior Sampling of Diffusion Models [2.5412006057370893]
Inlicit Neural representation (INR) は、逆問題を解決するための強力なパラダイムとして登場した。提案するフレームワークは、他の医療画像タスクにおける逆問題を解決するための一般化可能なフレームワークである。
論文参考訳（メタデータ） (2024-07-03T01:37:56Z)
Diffusion-Aided Joint Source Channel Coding For High Realism Wireless Image Transmission [24.372996233209854]
DiffJSCCは条件拡散復調法により高現実性画像を生成する新しいフレームワークである。 768x512ピクセルのコダック画像を3072のシンボルで再現できる。
論文参考訳（メタデータ） (2024-04-27T00:12:13Z)
Ambient Diffusion Posterior Sampling: Solving Inverse Problems with Diffusion Models trained on Corrupted Data [56.81246107125692]
Ambient Diffusion Posterior Smpling (A-DPS) は、ある種類の腐敗に対して事前訓練された生成モデルである。 A-DPSは、いくつかの画像復元タスクにおいて、クリーンなデータで訓練されたモデルよりも、速度と性能の両方で優れていることが示される。我々はAmbient Diffusionフレームワークを拡張して、FourierサブサンプルのマルチコイルMRI測定にのみアクセスしてMRIモデルをトレーニングする。
論文参考訳（メタデータ） (2024-03-13T17:28:20Z)
Resfusion: Denoising Diffusion Probabilistic Models for Image Restoration Based on Prior Residual Noise [34.65659277870287]
微分拡散モデルの研究は、画像復元の分野への応用を拡大した。本稿では,残余項を拡散前進過程に組み込むフレームワークであるResfusionを提案する。 Resfusionは, ISTDデータセット, LOLデータセット, Raindropデータセットに対して, わずか5つのサンプリングステップで競合性能を示すことを示す。
論文参考訳（メタデータ） (2023-11-25T02:09:38Z)
Deep Equilibrium Diffusion Restoration with Parallel Sampling [120.15039525209106]
拡散モデルに基づく画像復元(IR)は、拡散モデルを用いて劣化した画像から高品質な(本社)画像を復元し、有望な性能を達成することを目的としている。既存のほとんどの手法では、HQイメージをステップバイステップで復元するために長いシリアルサンプリングチェーンが必要であるため、高価なサンプリング時間と高い計算コストがかかる。本研究では,拡散モデルに基づくIRモデルを異なる視点,すなわちDeqIRと呼ばれるDeQ(Deep equilibrium)固定点系で再考することを目的とする。
論文参考訳（メタデータ） (2023-11-20T08:27:56Z)
SMRD: SURE-based Robust MRI Reconstruction with Diffusion Models [76.43625653814911]
拡散モデルは、高い試料品質のため、MRIの再生を加速するために人気を博している。推論時に柔軟にフォワードモデルを組み込んだまま、効果的にリッチなデータプリエントとして機能することができる。拡散モデル(SMRD)を用いたSUREに基づくMRI再構成を導入し,テスト時の堅牢性を向上する。
論文参考訳（メタデータ） (2023-10-03T05:05:35Z)
CoreDiff: Contextual Error-Modulated Generalized Diffusion Model for Low-Dose CT Denoising and Generalization [41.64072751889151]
低線量CT(LDCT)画像は光子飢餓と電子ノイズによりノイズやアーティファクトに悩まされる。本稿では,低用量CT (LDCT) 用新しいCOntextual eRror-modulated gEneralized Diffusion Model(CoreDiff)を提案する。
論文参考訳（メタデータ） (2023-04-04T14:13:13Z)
ReDi: Efficient Learning-Free Diffusion Inference via Trajectory Retrieval [68.7008281316644]
ReDiは学習不要なRetrievalベースの拡散サンプリングフレームワークである。 ReDi はモデル推論効率を 2 倍高速化することを示した。
論文参考訳（メタデータ） (2023-02-05T03:01:28Z)
Towards performant and reliable undersampled MR reconstruction via diffusion model sampling [67.73698021297022]
DiffuseReconは拡散モデルに基づく新しいMR再構成法である。観測された信号に基づいて生成過程を導出する。特定の加速因子に関する追加の訓練は必要としない。
論文参考訳（メタデータ） (2022-03-08T02:25:38Z)
iSeeBetter: Spatio-temporal video super-resolution using recurrent generative back-projection networks [0.0]
ビデオ超解像(VSR)に対する新しいGANに基づく構造時間的アプローチiSeeBetterを提案する。 iSeeBetterは、リカレントバックプロジェクションネットワークをジェネレータとして使用して、現在のフレームと隣接するフレームから時空間情報を抽出する。以上の結果から,iSeeBetterはVSRの忠実度に優れ,最先端の性能に勝ることを示した。
論文参考訳（メタデータ） (2020-06-13T01:36:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。