Fugu-MT 論文翻訳(概要): DR2: Diffusion-based Robust Degradation Remover for Blind Face Restoration

論文の概要: DR2: Diffusion-based Robust Degradation Remover for Blind Face Restoration

arxiv url: http://arxiv.org/abs/2303.06885v1
Date: Mon, 13 Mar 2023 06:05:18 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-14 16:02:57.980151
Title: DR2: Diffusion-based Robust Degradation Remover for Blind Face Restoration
Title（参考訳）: DR2: ブラインド顔修復のための拡散型ロバスト劣化再検討
Authors: Zhixin Wang, Xiaoyun Zhang, Ziying Zhang, Huangjie Zheng, Mingyuan Zhou, Ya Zhang, Yanfeng Wang
Abstract要約: ブラインド顔復元は通常、トレーニングのための事前定義された劣化モデルで劣化した低品質データを合成する。トレーニングデータに現実のケースをカバーするために、あらゆる種類の劣化を含めることは、高価で実現不可能である。本稿では、まず、劣化した画像を粗いが劣化不変な予測に変換し、次に、粗い予測を高品質な画像に復元するために拡張モジュールを使用するロバスト劣化再帰法(DR2)を提案する。
参考スコア（独自算出の注目度）: 66.01846902242355
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Blind face restoration usually synthesizes degraded low-quality data with a pre-defined degradation model for training, while more complex cases could happen in the real world. This gap between the assumed and actual degradation hurts the restoration performance where artifacts are often observed in the output. However, it is expensive and infeasible to include every type of degradation to cover real-world cases in the training data. To tackle this robustness issue, we propose Diffusion-based Robust Degradation Remover (DR2) to first transform the degraded image to a coarse but degradation-invariant prediction, then employ an enhancement module to restore the coarse prediction to a high-quality image. By leveraging a well-performing denoising diffusion probabilistic model, our DR2 diffuses input images to a noisy status where various types of degradation give way to Gaussian noise, and then captures semantic information through iterative denoising steps. As a result, DR2 is robust against common degradation (e.g. blur, resize, noise and compression) and compatible with different designs of enhancement modules. Experiments in various settings show that our framework outperforms state-of-the-art methods on heavily degraded synthetic and real-world datasets.
Abstract（参考訳）: ブラインド顔復元は通常、トレーニングのための事前定義された劣化モデルで劣化した低品質データを合成するが、より複雑なケースは現実世界で起こりうる。この仮定と実際の劣化のギャップは、成果物がしばしば出力で観察される復元性能を損なう。しかし、トレーニングデータに実際のケースをカバーするためのあらゆる種類の劣化を含めることは、高価で不可能である。このロバスト性問題に対処するために,まず劣化した画像を粗いが劣化不変な予測に変換する拡散ベースロバスト劣化除去器(dr2)を提案する。 DR2は, 良好な拡散確率モデルを用いて, 様々な種類の劣化がガウス雑音に繋がるノイズ状態に拡散し, 反復分解ステップを通じて意味情報をキャプチャする。その結果、dr2は共通の劣化(ぼかし、リサイズ、ノイズ、圧縮など)に対して堅牢であり、拡張モジュールの異なる設計と互換性がある。様々な環境での実験によって、我々のフレームワークは、高度に分解された合成および実世界のデータセットで最先端のメソッドよりも優れています。

関連論文リスト

All-in-One Image Restoration via Causal-Deconfounding Wavelet-Disentangled Prompt Network [41.06285233763803]
本稿では、AiOIRを効果的に行うために、因果分解型ウェーブレット分散プロンプトネットワーク(CWP-Net)を提案する。 CWP-Netはデカップリングのための2つのモジュール、すなわちエンコーダのウェーブレットアテンションモジュールとデコーダのウェーブレットアテンションモジュールを導入する。 2つのオールインワン設定の実験により,提案したCWP-Netの有効性と性能が証明された。
論文参考訳（メタデータ） (2026-03-04T08:43:11Z)
Unlocking the Potential of Diffusion Priors in Blind Face Restoration [63.419272650578165]
本研究では、2つのモードを切り替えて特定のギャップを解消する統合ネットワークFLIPNETを提案する。復元モードでは、モデルは徐々にBFR指向の特徴とLQ画像からの顔埋め込みを統合し、真正かつ忠実な顔復元を実現する。劣化モードでは、実際の劣化データセットから学んだ知識に基づいて、劣化した画像のような現実世界を合成する。
論文参考訳（メタデータ） (2025-08-12T01:50:55Z)
Invert2Restore: Zero-Shot Degradation-Blind Image Restoration [19.263005158979567]
Invert2Restoreはゼロショットでトレーニング不要なメソッドで、完全に盲目と部分的に盲目の両方で動作する。様々な種類の画像劣化をうまく一般化する。 Invert2Restoreは複数の画像復元タスクに対して実験的に検証する。
論文参考訳（メタデータ） (2025-03-27T13:22:40Z)
Diff-Restorer: Unleashing Visual Prompts for Diffusion-based Universal Image Restoration [19.87693298262894]
拡散モデルに基づく普遍的な画像復元手法であるDiff-Restorerを提案する。我々は、事前学習された視覚言語モデルを用いて、劣化した画像から視覚的プロンプトを抽出する。また、デグレーション対応デコーダを設計し、構造的補正を行い、潜在コードをピクセル領域に変換する。
論文参考訳（メタデータ） (2024-07-04T05:01:10Z)
DeeDSR: Towards Real-World Image Super-Resolution via Degradation-Aware Stable Diffusion [27.52552274944687]
低解像度画像のコンテンツや劣化を認識する拡散モデルの能力を高める新しい2段階の劣化認識フレームワークを提案する。最初の段階では、教師なしのコントラスト学習を用いて画像劣化の表現を得る。第2段階では、分解対応モジュールを単純化されたControlNetに統合し、様々な劣化への柔軟な適応を可能にします。
論文参考訳（メタデータ） (2024-03-31T12:07:04Z)
Efficient Test-Time Adaptation for Super-Resolution with Second-Order Degradation and Reconstruction [62.955327005837475]
画像超解像(SR)は,低分解能(LR)から高分解能(HR)へのマッピングを,一対のHR-LRトレーニング画像を用いて学習することを目的としている。 SRTTAと呼ばれるSRの効率的なテスト時間適応フレームワークを提案し、SRモデルを異なる/未知の劣化型でテストドメインに迅速に適応させることができる。
論文参考訳（メタデータ） (2023-10-29T13:58:57Z)
DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior [70.46245698746874]
DiffBIRは、視覚の異なる画像復元タスクを処理できる一般的な修復パイプラインである。 DiffBIRは, ブラインド画像復元問題を, 1) 劣化除去: 画像に依存しない内容の除去; 2) 情報再生: 失われた画像内容の生成の2段階に分離する。第1段階では, 修復モジュールを用いて劣化を除去し, 高忠実度復元結果を得る。第2段階では、潜伏拡散モデルの生成能力を活用して現実的な詳細を生成するIRControlNetを提案する。
論文参考訳（メタデータ） (2023-08-29T07:11:52Z)
Learning A Coarse-to-Fine Diffusion Transformer for Image Restoration [39.071637725773314]
画像復元のための粗大な拡散変換器(C2F-DFT)を提案する。 C2F-DFTは拡散自己注意(DFSA)と拡散フィードフォワードネットワーク(DFN)を含んでいる粗い訓練段階において,我々のC2F-DFTはノイズを推定し,サンプリングアルゴリズムにより最終クリーン画像を生成する。
論文参考訳（メタデータ） (2023-08-17T01:59:59Z)
Invertible Rescaling Network and Its Extensions [118.72015270085535]
本研究では,新たな視点から双方向の劣化と復元をモデル化する,新しい可逆的枠組みを提案する。我々は、有効な劣化画像を生成し、失われたコンテンツの分布を変換する可逆モデルを開発する。そして、ランダムに描画された潜在変数とともに、生成された劣化画像に逆変換を適用することにより、復元可能とする。
論文参考訳（メタデータ） (2022-10-09T06:58:58Z)
Investigating Tradeoffs in Real-World Video Super-Resolution [90.81396836308085]
実世界のビデオ超解像(VSR)モデルは、一般化性を改善するために様々な劣化で訓練されることが多い。最初のトレードオフを軽減するために,性能を犠牲にすることなく,最大40%のトレーニング時間を削減できる劣化手法を提案する。そこで本研究では,多種多様な実世界の低品質映像系列を含むビデオLQデータセットを提案する。
論文参考訳（メタデータ） (2021-11-24T18:58:21Z)
Designing a Practical Degradation Model for Deep Blind Image Super-Resolution [134.9023380383406]
単一画像スーパーレゾリューション (sisr) 法は, 推定劣化モデルが実画像から逸脱した場合はうまく動作しない。本稿では, ランダムにシャッフルされたブラー, ダウンサンプリング, ノイズ劣化からなる, より複雑で実用的な劣化モデルを提案する。
論文参考訳（メタデータ） (2021-03-25T17:40:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。