論文の概要: EDiffSR: An Efficient Diffusion Probabilistic Model for Remote Sensing
Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2310.19288v1
- Date: Mon, 30 Oct 2023 06:09:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 21:36:58.978934
- Title: EDiffSR: An Efficient Diffusion Probabilistic Model for Remote Sensing
Image Super-Resolution
- Title(参考訳): EDiffSR: リモートセンシング画像超解像のための効率的な拡散確率モデル
- Authors: Yi Xiao, Qiangqiang Yuan, Kui Jiang, Jiang He, Xianyu Jin, and
Liangpei Zhang
- Abstract要約: 畳み込みネットワークは、リモートセンシング画像スーパーレゾルティオン(SR)において顕著な発展を遂げた
生成的敵ネットワークは複雑な詳細を推測する可能性があるが、それらは容易に崩壊し、望ましくない成果物をもたらす。
EDiffSRは訓練が容易で、知覚障害画像の生成におけるDPMの利点を維持している。
- 参考スコア(独自算出の注目度): 32.956539422513416
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, convolutional networks have achieved remarkable development in
remote sensing image Super-Resoltuion (SR) by minimizing the regression
objectives, e.g., MSE loss. However, despite achieving impressive performance,
these methods often suffer from poor visual quality with over-smooth issues.
Generative adversarial networks have the potential to infer intricate details,
but they are easy to collapse, resulting in undesirable artifacts. To mitigate
these issues, in this paper, we first introduce Diffusion Probabilistic Model
(DPM) for efficient remote sensing image SR, dubbed EDiffSR. EDiffSR is easy to
train and maintains the merits of DPM in generating perceptual-pleasant images.
Specifically, different from previous works using heavy UNet for noise
prediction, we develop an Efficient Activation Network (EANet) to achieve
favorable noise prediction performance by simplified channel attention and
simple gate operation, which dramatically reduces the computational budget.
Moreover, to introduce more valuable prior knowledge into the proposed EDiffSR,
a practical Conditional Prior Enhancement Module (CPEM) is developed to help
extract an enriched condition. Unlike most DPM-based SR models that directly
generate conditions by amplifying LR images, the proposed CPEM helps to retain
more informative cues for accurate SR. Extensive experiments on four remote
sensing datasets demonstrate that EDiffSR can restore visual-pleasant images on
simulated and real-world remote sensing images, both quantitatively and
qualitatively. The code of EDiffSR will be available at
https://github.com/XY-boy/EDiffSR
- Abstract(参考訳): 近年,畳み込みネットワークは,mse損失などの回帰目標を最小化することで,リモートセンシング画像スーパーリゾルション(sr)において顕著な発展を遂げている。
しかし、印象的な性能は達成したものの、これらの手法は過度にスムースな問題を伴う視覚品質の低下に苦しむことが多い。
生成的敵ネットワークは複雑な詳細を推測する可能性があるが、それらは容易に崩壊し、望ましくない成果物をもたらす。
そこで本稿では,ediffsrと呼ばれる効率的なリモートセンシング画像srのための拡散確率モデル(dpm)を提案する。
EDiffSRは訓練が容易で、知覚障害画像の生成におけるDPMの利点を維持している。
具体的には,ノイズ予測にヘビーunetを使用する従来の手法と異なり,チャネル注意と簡易ゲート操作を簡略化し,優れたノイズ予測性能を実現するための効率的な活性化ネットワーク (eanet) を開発し,計算予算を劇的に削減する。
さらに,提案するediffsrにより価値の高い事前知識を導入するために,より充実した条件を抽出するためのpractical conditional prior enhancement module (cpem)を開発した。
LR画像の増幅により条件を直接生成するほとんどのDPMベースのSRモデルとは異なり、提案したCPEMは正確なSRのためにより情報的な手がかりを維持するのに役立つ。
4つのリモートセンシングデータセットの大規模な実験により、EDiffSRは、シミュレーションされた実世界のリモートセンシング画像の視覚的な不快なイメージを定量的かつ質的に復元できることを示した。
EDiffSRのコードはhttps://github.com/XY-boy/EDiffSRで入手できる。
関連論文リスト
- One-Step Effective Diffusion Network for Real-World Image Super-Resolution [11.326598938246558]
本稿では,Real-ISR問題に対する1ステップの効果的な拡散ネットワーク,すなわちOSEDiffを提案する。
我々は,KL分散正則化を行うために,潜時空間における変分点蒸留を適用した。
実験の結果,OSEDiffは,客観的指標と主観的評価の両方の観点から,同等あるいはさらに優れたリアルISR結果が得られることが示された。
論文 参考訳(メタデータ) (2024-06-12T13:10:31Z) - RSHazeDiff: A Unified Fourier-aware Diffusion Model for Remote Sensing Image Dehazing [32.16602874389847]
Hazeはリモートセンシング画像の視覚的品質を著しく低下させる。
本稿では,RSHazeDiffと呼ばれるリモートセンシング画像デハージングのための新しいFourier-aware拡散モデルを提案する。
合成および実世界のベンチマークの実験は、RSHazeDiffの好ましい性能を検証する。
論文 参考訳(メタデータ) (2024-05-15T04:22:27Z) - Semantic Guided Large Scale Factor Remote Sensing Image Super-resolution with Generative Diffusion Prior [13.148815217684277]
大規模因子超解像(SR)アルゴリズムは、軌道から取得した低解像度(LR)衛星データの最大化に不可欠である。
既存の手法では、鮮明なテクスチャと正しい接地オブジェクトでSR画像を復元する際の課題に直面している。
本稿では,大規模リモートセンシング画像の超解像を実現するための新しいフレームワークであるセマンティックガイド拡散モデル(SGDM)を提案する。
論文 参考訳(メタデータ) (2024-05-11T16:06:16Z) - Iterative Token Evaluation and Refinement for Real-World
Super-Resolution [77.74289677520508]
実世界の画像超解像(RWSR)は、低品質(LQ)画像が複雑で未同定の劣化を起こすため、長年にわたる問題である。
本稿では,RWSRのための反復的トークン評価・リファインメントフレームワークを提案する。
ITERはGAN(Generative Adversarial Networks)よりも訓練が容易であり,連続拡散モデルよりも効率的であることを示す。
論文 参考訳(メタデータ) (2023-12-09T17:07:32Z) - ICF-SRSR: Invertible scale-Conditional Function for Self-Supervised
Real-world Single Image Super-Resolution [60.90817228730133]
単一画像超解像(SISR)は、与えられた低解像度(LR)画像を高解像度(HR)にアップサンプリングすることを目的とした課題である。
近年のアプローチは、単純化されたダウンサンプリング演算子によって劣化したシミュレーションLR画像に基づいて訓練されている。
Invertible Scale-Conditional Function (ICF) を提案する。これは入力画像をスケールし、異なるスケール条件で元の入力を復元する。
論文 参考訳(メタデータ) (2023-07-24T12:42:45Z) - RBSR: Efficient and Flexible Recurrent Network for Burst
Super-Resolution [57.98314517861539]
バースト超解像(BurstSR)は、高解像度(HR)画像を低解像度(LR)画像と雑音画像から再構成することを目的としている。
本稿では,効率よくフレキシブルなリカレントネットワークでフレーム単位のキューを融合させることを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:14:13Z) - Blind Super-Resolution for Remote Sensing Images via Conditional
Stochastic Normalizing Flows [14.882417028542855]
本稿では、上記の問題に対処するために、正規化フロー(BlindSRSNF)に基づく新しいブラインドSRフレームワークを提案する。
BlindSRSNFは、低解像度(LR)画像が与えられた高解像度画像空間上の条件確率分布を、確率の変動境界を明示的に最適化することによって学習する。
提案アルゴリズムは,シミュレーションLRと実世界RSIの両方において,視覚的品質の優れたSR結果が得られることを示す。
論文 参考訳(メタデータ) (2022-10-14T12:37:32Z) - SRDiff: Single Image Super-Resolution with Diffusion Probabilistic
Models [19.17571465274627]
単一の画像スーパーリゾリューション(SISR)は、与えられた低リゾリューション(LR)画像から高解像度(HR)画像を再構成することを目的とする。
新規な単像超解像拡散確率モデル(SRDiff)を提案する。
SRDiffはデータ可能性の変動境界の変種に最適化されており、多様で現実的なSR予測を提供することができる。
論文 参考訳(メタデータ) (2021-04-30T12:31:25Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - EventSR: From Asynchronous Events to Image Reconstruction, Restoration,
and Super-Resolution via End-to-End Adversarial Learning [75.17497166510083]
イベントカメラは強度の変化を感知し、従来のカメラよりも多くの利点がある。
イベントストリームからの強度画像の再構成手法が提案されている。
出力は依然として低解像度(LR)、ノイズ、非現実的である。
本研究では、イベントストリームからLR画像を再構成し、画像品質を高め、EventSRと呼ばれる拡張イメージをアップサンプリングする、新しいエンドツーエンドパイプラインを提案する。
論文 参考訳(メタデータ) (2020-03-17T10:58:10Z) - Characteristic Regularisation for Super-Resolving Face Images [81.84939112201377]
既存の顔画像超解像法(SR)は、主に人工的にダウンサンプリングされた低解像度(LR)画像の改善に焦点を当てている。
従来の非教師なしドメイン適応(UDA)手法は、未ペアの真のLRとHRデータを用いてモデルをトレーニングすることでこの問題に対処する。
これにより、視覚的特徴を構成することと、画像の解像度を高めることの2つのタスクで、モデルをオーバーストレッチする。
従来のSRモデルとUDAモデルの利点を結合する手法を定式化する。
論文 参考訳(メタデータ) (2019-12-30T16:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。