Fugu-MT 論文翻訳(概要): Zero-shot Video Restoration and Enhancement Using Pre-Trained Image Diffusion Model

論文の概要: Zero-shot Video Restoration and Enhancement Using Pre-Trained Image Diffusion Model

arxiv url: http://arxiv.org/abs/2407.01960v1
Date: Tue, 2 Jul 2024 05:31:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-03 16:43:59.587095
Title: Zero-shot Video Restoration and Enhancement Using Pre-Trained Image Diffusion Model
Title（参考訳）: 事前学習画像拡散モデルによるゼロショット映像復元と強調
Authors: Cong Cao, Huanjing Yue, Xin Liu, Jingyu Yang,
Abstract要約: 本稿では,事前学習した画像拡散モデルに基づいて,ゼロショット映像の復元と拡張を行うための第1のフレームワークを提案する。本稿では,時間的整合性誘導,時空間雑音共有,時間的整合性向上のための早期サンプリング戦略を提案する。実験により,より忠実度の高い時間的一貫したビデオの製作において,提案手法の優位性を示した。
参考スコア（独自算出の注目度）: 15.170889156729777
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Diffusion-based zero-shot image restoration and enhancement models have achieved great success in various image restoration and enhancement tasks without training. However, directly applying them to video restoration and enhancement results in severe temporal flickering artifacts. In this paper, we propose the first framework for zero-shot video restoration and enhancement based on a pre-trained image diffusion model. By replacing the self-attention layer with the proposed cross-previous-frame attention layer, the pre-trained image diffusion model can take advantage of the temporal correlation between neighboring frames. We further propose temporal consistency guidance, spatial-temporal noise sharing, and an early stopping sampling strategy for better temporally consistent sampling. Our method is a plug-and-play module that can be inserted into any diffusion-based zero-shot image restoration or enhancement methods to further improve their performance. Experimental results demonstrate the superiority of our proposed method in producing temporally consistent videos with better fidelity.
Abstract（参考訳）: 拡散に基づくゼロショット画像復元・拡張モデルは、訓練なしで様々な画像復元・拡張タスクにおいて大きな成功を収めた。しかし、それらをビデオ修復や強化に直接適用すると、重度の時間的ひび割れが生じる。本稿では,事前学習した画像拡散モデルに基づくゼロショット映像復元・拡張のための第1の枠組みを提案する。自己アテンション層を、提案したクロスフレームアテンション層に置き換えることで、事前学習された画像拡散モデルは、隣接するフレーム間の時間的相関を利用することができる。さらに、時間的整合性誘導、時空間雑音共有、時間的整合性向上のための早期サンプリング戦略を提案する。本手法は,任意の拡散型ゼロショット画像復元法や拡張法に挿入可能なプラグアンドプレイモジュールであり,その性能をさらに向上させることができる。実験により,より忠実度の高い時間的一貫したビデオの製作において,提案手法の優位性を示した。

関連論文リスト

Zero-Shot Video Restoration and Enhancement with Assistance of Video Diffusion Models [23.205162529582747]
本稿では,高速な映像拡散モデルを用いて,時間的整合性を維持するための画像ベース手法を提案する。画像法を補完するヘテロジェネリックテキスト・ビデオ拡散モデルとヘテロジェネリックテキスト・ビデオ拡散モデルの両方を利用するため, 潜伏子融合, 異種潜伏子融合, およびCOTベースの融合比戦略を提案する。本手法はトレーニング不要であり,任意の拡散型画像復元・拡張法に適用可能である。
論文参考訳（メタデータ） (2026-01-29T16:14:07Z)
Improving Temporal Consistency and Fidelity at Inference-time in Perceptual Video Restoration by Zero-shot Image-based Diffusion Models [5.61537470581101]
ゼロショット画像ベース拡散モデルを用いたビデオ再生における時間的コヒーレンス向上の課題に対処する。本稿では,PSG(Perceptual Straightening Guidance)とMPES(Ensemble Sampling)の2つの補完的推論時間戦略を提案する。
論文参考訳（メタデータ） (2025-10-29T11:40:06Z)
Harnessing Diffusion-Yielded Score Priors for Image Restoration [29.788482710572307]
深部画像復元モデルは、劣化した画像空間から自然画像空間へのマッピングを学習することを目的としている。 MSEベース、GANベース、拡散ベースメソッドの3つの主要なクラスが登場した。これらの課題に対処するための新しい手法HYPIRを提案する。
論文参考訳（メタデータ） (2025-07-28T07:55:34Z)
Quick Bypass Mechanism of Zero-Shot Diffusion-Based Image Restoration [0.8192907805418583]
そこで本研究では,中間近似から初期化することでデノナイジング過程を高速化し,早期デノナイジングステップを効果的に回避する戦略を提案する。我々は,超高解像度,デブロアリング,圧縮センシングなど,複数の画像復元タスクにまたがるImageNet-1KとCelebAHQの手法を検証した。
論文参考訳（メタデータ） (2025-07-06T01:36:27Z)
Temporal-Consistent Video Restoration with Pre-trained Diffusion Models [51.47188802535954]
ビデオ復元(VR)は、劣化したビデオから高品質なビデオを復元することを目的としている。事前訓練拡散モデル(DM)を用いた最近のゼロショットVR法は,逆拡散時の近似誤差と時間的整合性の欠如に悩まされている。本稿では,DMのシード空間におけるビデオフレームを直接パラメータ化し,近似誤差を排除した新しいMAP(Posterior Maximum)フレームワークを提案する。
論文参考訳（メタデータ） (2025-03-19T03:41:56Z)
Sequential Posterior Sampling with Diffusion Models [15.028061496012924]
条件付き画像合成における逐次拡散後サンプリングの効率を向上させるため,遷移力学をモデル化する新しい手法を提案する。本研究では,高フレームレート心エコー画像の現実的データセットに対するアプローチの有効性を実証する。提案手法は,画像の拡散モデルとリアルタイム推論を必要とする他の領域における拡散モデルのリアルタイム適用の可能性を開く。
論文参考訳（メタデータ） (2024-09-09T07:55:59Z)
Solving Video Inverse Problems Using Image Diffusion Models [58.464465016269614]
本稿では,画像拡散モデルのみを活用する革新的なビデオ逆解法を提案する。本手法は,映像の時間次元をバッチ次元画像拡散モデルとして扱う。また、バッチ間の一貫性を促進するバッチ一貫性サンプリング戦略も導入しています。
論文参考訳（メタデータ） (2024-09-04T09:48:27Z)
DiffIR2VR-Zero: Zero-Shot Video Restoration with Diffusion-based Image Restoration Models [9.145545884814327]
DiffIR2VR-Zeroは、任意の事前訓練された画像復元モデルで、追加のトレーニングなしで高品質な映像復元を行うことができるゼロショットフレームワークである。我々のフレームワークは、任意の画像復元拡散モデルで動作し、タスク固有のトレーニングや修正なしに、映像強調のための汎用的なソリューションを提供する。
論文参考訳（メタデータ） (2024-07-01T17:59:12Z)
Blind Image Restoration via Fast Diffusion Inversion [17.139433082780037]
Blind Image Restoration via fast Diffusion (BIRD) は、劣化モデルパラメータと復元画像の協調最適化を行うブラインド赤外線法である。提案手法の鍵となる考え方は、初期ノイズがサンプリングされると、逆サンプリングを変更すること、すなわち、中間潜水剤を全て変更しないことである。画像復元作業におけるBIRDの有効性を実験的に検証し,それらすべてに対して,その成果が得られたことを示す。
論文参考訳（メタデータ） (2024-05-29T23:38:12Z)
Lossy Image Compression with Foundation Diffusion Models [10.407650300093923]
本研究は,拡散を用いた量子化誤差の除去をデノナイジングタスクとして定式化し,送信された遅延画像の損失情報を復元する。当社のアプローチでは,完全な拡散生成プロセスの10%未満の実行が可能であり,拡散モデルにアーキテクチャ的な変更は不要である。
論文参考訳（メタデータ） (2024-04-12T16:23:42Z)
ReNoise: Real Image Inversion Through Iterative Noising [62.96073631599749]
本研究では,操作数を増やすことなく,高い品質と操作率の逆転法を導入し,再現精度を向上する。我々は,近年の高速化拡散モデルを含む様々なサンプリングアルゴリズムとモデルを用いて,Renoise手法の性能を評価する。
論文参考訳（メタデータ） (2024-03-21T17:52:08Z)
Efficient Diffusion Model for Image Restoration by Residual Shifting [63.02725947015132]
本研究では,画像復元のための新しい,効率的な拡散モデルを提案する。提案手法は,推論中の後処理の高速化を回避し,関連する性能劣化を回避する。提案手法は,3つの古典的IRタスクにおける現在の最先端手法よりも優れた,あるいは同等の性能を実現する。
論文参考訳（メタデータ） (2024-03-12T05:06:07Z)
Diffusion Posterior Proximal Sampling for Image Restoration [27.35952624032734]
我々は拡散に基づく画像復元のための洗練されたパラダイムを提案する。具体的には,各生成段階における測定値と一致したサンプルを選択する。選択に使用する候補サンプルの数は、タイムステップの信号対雑音比に基づいて適応的に決定される。
論文参考訳（メタデータ） (2024-02-25T04:24:28Z)
Make a Cheap Scaling: A Self-Cascade Diffusion Model for Higher-Resolution Adaptation [112.08287900261898]
本稿では,高解像度画像への高速適応と映像生成のための新しい自己カスケード拡散モデルを提案する。提案手法は5Xトレーニングの高速化を実現し,さらに0.002Mのチューニングパラメータしか必要としない。実験により,提案手法は10kステップの微調整によって高速に高分解能画像やビデオ合成に適応できることを示した。
論文参考訳（メタデータ） (2024-02-16T07:48:35Z)
ExposureDiffusion: Learning to Expose for Low-light Image Enhancement [87.08496758469835]
この研究は、拡散モデルと物理ベースの露光モデルとをシームレスに統合することで、この問題に対処する。提案手法は,バニラ拡散モデルと比較して性能が大幅に向上し,推論時間を短縮する。提案するフレームワークは、実際のペア付きデータセット、SOTAノイズモデル、および異なるバックボーンネットワークの両方で動作する。
論文参考訳（メタデータ） (2023-07-15T04:48:35Z)
Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文参考訳（メタデータ） (2023-06-01T03:08:28Z)
Refusion: Enabling Large-Size Realistic Image Restoration with Latent-Space Diffusion Models [9.245782611878752]
ネットワークアーキテクチャ、ノイズレベル、デノイングステップ、トレーニング画像サイズ、知覚/スケジューリングスコアなど、様々な面で拡散モデルを強化する。また、復号処理のために元の入力からの高分解能情報を保存しつつ、低分解能潜時空間での拡散を行うU-Netベースの潜時拡散モデルを提案する。これらの修正により、現実世界の影除去、HR非均一脱ハージング、ステレオ超解像、ボケ効果変換など、様々な画像復元タスクに拡散モデルを適用することができる。
論文参考訳（メタデータ） (2023-04-17T14:06:49Z)
ADIR: Adaptive Diffusion for Image Reconstruction [46.838084286784195]
本研究では,拡散モデルによる事前学習を利用した条件付きサンプリング手法を提案する。次に、事前学習した拡散分極ネットワークを入力に適応させる新しいアプローチと組み合わせる。画像再構成手法の適応拡散は,超高解像度,デブロアリング,テキストベースの編集タスクにおいて,大幅な改善が達成されていることを示す。
論文参考訳（メタデータ） (2022-12-06T18:39:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。