論文の概要: Superresolution Reconstruction of Single Image for Latent features
- arxiv url: http://arxiv.org/abs/2211.12845v1
- Date: Wed, 16 Nov 2022 09:37:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-27 13:18:34.862764
- Title: Superresolution Reconstruction of Single Image for Latent features
- Title(参考訳): 遅発性特徴に対する単一画像の超解像再構成
- Authors: Xin Wang, Jing-Ke Yan, Jing-Ye Cai, Jian-Hua Deng, Qin Qin, Qin Wang,
Heng Xiao, Yao Cheng, Peng-Fei Ye
- Abstract要約: 単一画像超解像再構成(SISR)タスクは不確実性問題を解決する典型的なタスクである。
高品質なサンプリング、高速サンプリング、そしてサンプリング後の詳細とテクスチャの多様性の要件を満たすことは、しばしば困難である。
本稿では,これらの問題を解決するために,Latent Feature (LDDPM) のための条件拡散確率モデルを提案する。
- 参考スコア(独自算出の注目度): 13.109083311337356
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In recent years, Deep Learning has shown good results in the Single Image
Superresolution Reconstruction (SISR) task, thus becoming the most widely used
methods in this field. The SISR task is a typical task to solve an uncertainty
problem. Therefore, it is often challenging to meet the requirements of
High-quality sampling, fast Sampling, and diversity of details and texture
after Sampling simultaneously in a SISR task.It leads to model collapse, lack
of details and texture features after Sampling, and too long Sampling time in
High Resolution (HR) image reconstruction methods. This paper proposes a
Diffusion Probability model for Latent features (LDDPM) to solve these
problems. Firstly, a Conditional Encoder is designed to effectively encode
Low-Resolution (LR) images, thereby reducing the solution space of
reconstructed images to improve the performance of reconstructed images. Then,
the Normalized Flow and Multi-modal adversarial training are used to model the
denoising distribution with complex Multi-modal distribution so that the
Generative Modeling ability of the model can be improved with a small number of
Sampling steps. Experimental results on mainstream datasets demonstrate that
our proposed model reconstructs more realistic HR images and obtains better
PSNR and SSIM performance compared to existing SISR tasks, thus providing a new
idea for SISR tasks.
- Abstract(参考訳): 近年、Deep LearningはSingle Image Super Resolution Reconstruction (SISR)タスクにおいて良い結果を示しており、この分野で最も広く使われている手法となっている。
SISRタスクは不確実性問題を解決する典型的なタスクである。
したがって、SISRタスクで同時にサンプリングした後に、高品質なサンプリング、高速サンプリング、詳細とテクスチャの多様性の要求を満たすことはしばしば困難であり、モデル崩壊、サンプリング後の詳細とテクスチャの特徴の欠如、高分解能画像再構成法では長時間のサンプリング時間が長すぎる。
本稿では,これらの問題を解決するために,潜在特徴量(lddpm)の拡散確率モデルを提案する。
まず, 条件付きエンコーダを用いて, 低分解能画像(LR)を効果的に符号化し, 再構成画像の解空間を小さくし, 再構成画像の性能を向上させる。
次に、正規化フローとマルチモーダル逆訓練を用いて、複雑なマルチモーダル分布を持つ分別分布をモデル化し、少量のサンプリングステップでモデルの生成モデリング能力を向上させる。
本モデルでは,従来のSISRタスクと比較して,よりリアルなHRイメージを再構成し,PSNRとSSIMのパフォーマンスが向上し,SISRタスクに対する新たなアイデアが得られた。
関連論文リスト
- Mixed Degradation Image Restoration via Local Dynamic Optimization and Conditional Embedding [67.57487747508179]
マルチインワン画像復元 (IR) は, 一つのモデルで全ての種類の劣化画像復元を処理し, 大幅な進歩を遂げている。
本稿では,単一と混合の分解で画像を効果的に復元できる新しいマルチインワンIRモデルを提案する。
論文 参考訳(メタデータ) (2024-11-25T09:26:34Z) - Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors [75.24313405671433]
拡散に基づく画像超解像法 (SR) は、事前訓練された大規模なテキスト・画像拡散モデルを先行として活用することにより、顕著な成功を収めた。
本稿では,拡散型SR手法の効率問題に対処する新しい一段階SRモデルを提案する。
既存の微調整戦略とは異なり、SR専用の劣化誘導低ランク適応 (LoRA) モジュールを設計した。
論文 参考訳(メタデータ) (2024-09-25T16:15:21Z) - Photo-Realistic Image Restoration in the Wild with Controlled Vision-Language Models [14.25759541950917]
この研究は、能動的視覚言語モデルと合成分解パイプラインを活用して、野生(ワイルドIR)における画像復元を学習する。
我々の基底拡散モデルは画像復元SDE(IR-SDE)である。
論文 参考訳(メタデータ) (2024-04-15T12:34:21Z) - Boosting Flow-based Generative Super-Resolution Models via Learned Prior [8.557017814978334]
フローベース超解像(SR)モデルは、高品質な画像を生成する際に驚くべき能力を示した。
これらの手法は、グリッドアーティファクト、爆発する逆数、固定サンプリング温度による最適以下の結果など、画像生成中にいくつかの課題に遭遇する。
本研究では、フローベースSRモデルの推論フェーズ前に学習した条件を導入する。
論文 参考訳(メタデータ) (2024-03-16T18:04:12Z) - Deep Equilibrium Diffusion Restoration with Parallel Sampling [120.15039525209106]
拡散モデルに基づく画像復元(IR)は、拡散モデルを用いて劣化した画像から高品質な(本社)画像を復元し、有望な性能を達成することを目的としている。
既存のほとんどの手法では、HQイメージをステップバイステップで復元するために長いシリアルサンプリングチェーンが必要であるため、高価なサンプリング時間と高い計算コストがかかる。
本研究では,拡散モデルに基づくIRモデルを異なる視点,すなわちDeqIRと呼ばれるDeQ(Deep equilibrium)固定点系で再考することを目的とする。
論文 参考訳(メタデータ) (2023-11-20T08:27:56Z) - Efficient Test-Time Adaptation for Super-Resolution with Second-Order
Degradation and Reconstruction [62.955327005837475]
画像超解像(SR)は,低分解能(LR)から高分解能(HR)へのマッピングを,一対のHR-LRトレーニング画像を用いて学習することを目的としている。
SRTTAと呼ばれるSRの効率的なテスト時間適応フレームワークを提案し、SRモデルを異なる/未知の劣化型でテストドメインに迅速に適応させることができる。
論文 参考訳(メタデータ) (2023-10-29T13:58:57Z) - Single Image Internal Distribution Measurement Using Non-Local
Variational Autoencoder [11.985083962982909]
本稿では,非局所変分オートエンコーダ(textttNLVAE)という画像固有解を提案する。
textttNLVAEは,非局所領域からの非絡み合った情報を用いて高解像度画像を再構成する自己教師型戦略として導入された。
7つのベンチマークデータセットによる実験結果から,textttNLVAEモデルの有効性が示された。
論文 参考訳(メタデータ) (2022-04-02T18:43:55Z) - Hierarchical Conditional Flow: A Unified Framework for Image
Super-Resolution and Image Rescaling [139.25215100378284]
画像SRと画像再スケーリングのための統合フレームワークとして階層的条件フロー(HCFlow)を提案する。
HCFlowは、LR画像と残りの高周波成分の分布を同時にモデル化することにより、HRとLR画像ペア間のマッピングを学習する。
さらに性能を高めるために、知覚的損失やGAN損失などの他の損失と、トレーニングで一般的に使用される負の対数類似損失とを組み合わせる。
論文 参考訳(メタデータ) (2021-08-11T16:11:01Z) - SRDiff: Single Image Super-Resolution with Diffusion Probabilistic
Models [19.17571465274627]
単一の画像スーパーリゾリューション(SISR)は、与えられた低リゾリューション(LR)画像から高解像度(HR)画像を再構成することを目的とする。
新規な単像超解像拡散確率モデル(SRDiff)を提案する。
SRDiffはデータ可能性の変動境界の変種に最適化されており、多様で現実的なSR予測を提供することができる。
論文 参考訳(メタデータ) (2021-04-30T12:31:25Z) - Characteristic Regularisation for Super-Resolving Face Images [81.84939112201377]
既存の顔画像超解像法(SR)は、主に人工的にダウンサンプリングされた低解像度(LR)画像の改善に焦点を当てている。
従来の非教師なしドメイン適応(UDA)手法は、未ペアの真のLRとHRデータを用いてモデルをトレーニングすることでこの問題に対処する。
これにより、視覚的特徴を構成することと、画像の解像度を高めることの2つのタスクで、モデルをオーバーストレッチする。
従来のSRモデルとUDAモデルの利点を結合する手法を定式化する。
論文 参考訳(メタデータ) (2019-12-30T16:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。