論文の概要: Normalizing Flow as a Flexible Fidelity Objective for Photo-Realistic
Super-resolution
- arxiv url: http://arxiv.org/abs/2111.03649v1
- Date: Fri, 5 Nov 2021 17:56:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-08 16:14:38.494035
- Title: Normalizing Flow as a Flexible Fidelity Objective for Photo-Realistic
Super-resolution
- Title(参考訳): フォトリアリスティック・スーパーレゾリューションのためのフレキシブル忠実度目標としてのフローの正規化
- Authors: Andreas Lugmayr, Martin Danelljan, Fisher Yu, Luc Van Gool, Radu
Timofte
- Abstract要約: 超解像は不適切な問題であり、高分解能画像は可算解空間の1つの可能性を表す。
しかし、支配的なパラダイムは、L_のようなピクセル単位の損失を採用することで、ぼやけた平均に向かって予測を駆動する。
本稿では,L_損失を再考することによりこの問題に対処し,一層条件流に対応することを示す。
この関係に触発されて、L_目的に対する忠実度に基づくオルタナティブとして一般流れを探索する。
より深いフローの柔軟性は、対向的な損失と組み合わせることで、より良い視覚的品質と一貫性をもたらすことを実証する。
- 参考スコア(独自算出の注目度): 161.39504409401354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Super-resolution is an ill-posed problem, where a ground-truth
high-resolution image represents only one possibility in the space of plausible
solutions. Yet, the dominant paradigm is to employ pixel-wise losses, such as
L_1, which drive the prediction towards a blurry average. This leads to
fundamentally conflicting objectives when combined with adversarial losses,
which degrades the final quality. We address this issue by revisiting the L_1
loss and show that it corresponds to a one-layer conditional flow. Inspired by
this relation, we explore general flows as a fidelity-based alternative to the
L_1 objective. We demonstrate that the flexibility of deeper flows leads to
better visual quality and consistency when combined with adversarial losses. We
conduct extensive user studies for three datasets and scale factors, where our
approach is shown to outperform state-of-the-art methods for photo-realistic
super-resolution. Code and trained models will be available at:
git.io/AdFlow
- Abstract(参考訳): 超解像は不適切な問題であり、高分解能画像は可算解空間の1つの可能性を表す。
しかし、支配的なパラダイムは、L_1のようなピクセル単位の損失を採用することで、ぼやけた平均への予測を促進する。
これは、最終品質を低下させる敵の損失と組み合わせることで、目的を根本的に矛盾させる。
本稿では,L_1損失を再検討し,一層条件流に対応することを示す。
この関係に触発されて、l_1 目標の忠実性に基づく代替として一般流れを探求する。
深い流れの柔軟性は、逆の損失と組み合わせることで、より良い視覚品質と一貫性をもたらすことを実証する。
3つのデータセットとスケールファクタに関する広範なユーザ調査を実施し,フォトリアリスティック・スーパーレゾリューションの最先端手法よりも優れた手法を提示する。
コードとトレーニングされたモデルはgit.io/adflowで利用可能になる
関連論文リスト
- Exploiting Diffusion Prior for Real-World Image Super-Resolution [75.5898357277047]
本稿では,事前学習したテキスト・画像拡散モデルにカプセル化された事前知識を視覚的超解像に活用するための新しいアプローチを提案する。
時間認識エンコーダを用いることで、事前学習した合成モデルを変更することなく、有望な復元結果が得られる。
論文 参考訳(メタデータ) (2023-05-11T17:55:25Z) - On the Robustness of Normalizing Flows for Inverse Problems in Imaging [16.18759484251522]
意図しない厳密な人工物は、時折条件付き正規化フローの出力で観察される。
条件付きアフィンカップリング層における「分散の爆発」により,これらの問題が生じることを実証的,理論的に明らかにする。
そこで本研究では,アフィンカップリング層を2次スプラインカップリング層に置換し,フローを正規化する簡単な方法を提案する。
論文 参考訳(メタデータ) (2022-12-08T15:18:28Z) - DeepMLE: A Robust Deep Maximum Likelihood Estimator for Two-view
Structure from Motion [9.294501649791016]
動きからの2次元構造(SfM)は3次元再構成と視覚SLAM(vSLAM)の基礎となる。
本稿では,2視点SfM問題を最大最大推定(MLE)として定式化し,DeepMLEと表記されるフレームワークを用いて解いた。
提案手法は,最先端の2ビューSfM手法よりも精度と一般化能力において優れる。
論文 参考訳(メタデータ) (2022-10-11T15:07:25Z) - SelFSR: Self-Conditioned Face Super-Resolution in the Wild via Flow
Field Degradation Network [12.976199676093442]
野生における顔超解像のための新しいドメイン適応分解ネットワークを提案する。
我々のモデルは,CelebAと実世界の顔データセットの両方で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-12-20T17:04:00Z) - DeFlow: Learning Complex Image Degradations from Unpaired Data with
Conditional Flows [145.83812019515818]
本論文では,不対データから画像劣化を学習するDeFlowを提案する。
共有フローデコーダネットワークの潜在空間における劣化過程をモデル化する。
共同画像復元と超解像におけるDeFlowの定式化を検証した。
論文 参考訳(メタデータ) (2021-01-14T18:58:01Z) - SRFlow: Learning the Super-Resolution Space with Normalizing Flow [176.07982398988747]
超解像度は、与えられた低解像度画像の複数の予測を可能にするため、不適切な問題である。
出力の条件分布を学習できる正規化フローベース超解法SRFlowを提案する。
我々のモデルは、単一損失、すなわち負のログ類似度を用いて、原則的に訓練されている。
論文 参考訳(メタデータ) (2020-06-25T06:34:04Z) - Enhancing Perceptual Loss with Adversarial Feature Matching for
Super-Resolution [5.258555266148511]
単一画像超解法 (SISR) は不確定な数の有効解を持つ不確定問題である。
これらのパターンアーティファクトの根本原因は、知覚的損失の事前学習目標と超解答目標とのミスマッチに遡ることができる。
論文 参考訳(メタデータ) (2020-05-15T12:36:54Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。