論文の概要: SU-ESRGAN: Semantic and Uncertainty-Aware ESRGAN for Super-Resolution of Satellite and Drone Imagery with Fine-Tuning for Cross Domain Evaluation
- arxiv url: http://arxiv.org/abs/2508.00750v1
- Date: Fri, 01 Aug 2025 16:25:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-04 18:08:53.952527
- Title: SU-ESRGAN: Semantic and Uncertainty-Aware ESRGAN for Super-Resolution of Satellite and Drone Imagery with Fine-Tuning for Cross Domain Evaluation
- Title(参考訳): SU-ESRGAN: 衛星・ドローン画像の超解像とクロスドメイン評価のための微調整のための意味的・不確実性を考慮したESRGAN
- Authors: Prerana Ramkumar,
- Abstract要約: GAN(Generative Adversarial Networks)は、画像の現実的な超解像(SR)を実現しているが、セマンティック一貫性と画素ごとの信頼性は欠如している。
本稿では,衛星画像にESRGANを統合するための最初のSRフレームワークであるSemantic and Uncertainty-Aware ESRGAN(SU-ESRGAN)を紹介する。
この新モデルは、広視野視野カメラ(FoV)を使用した衛星システムやUAVにおいて、カバー範囲の空間分解能のトレードオフとして有用である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Adversarial Networks (GANs) have achieved realistic super-resolution (SR) of images however, they lack semantic consistency and per-pixel confidence, limiting their credibility in critical remote sensing applications such as disaster response, urban planning and agriculture. This paper introduces Semantic and Uncertainty-Aware ESRGAN (SU-ESRGAN), the first SR framework designed for satellite imagery to integrate the ESRGAN, segmentation loss via DeepLabv3 for class detail preservation and Monte Carlo dropout to produce pixel-wise uncertainty maps. The SU-ESRGAN produces results (PSNR, SSIM, LPIPS) comparable to the Baseline ESRGAN on aerial imagery. This novel model is valuable in satellite systems or UAVs that use wide field-of-view (FoV) cameras, trading off spatial resolution for coverage. The modular design allows integration in UAV data pipelines for on-board or post-processing SR to enhance imagery resulting due to motion blur, compression and sensor limitations. Further, the model is fine-tuned to evaluate its performance on cross domain applications. The tests are conducted on two drone based datasets which differ in altitude and imaging perspective. Performance evaluation of the fine-tuned models show a stronger adaptation to the Aerial Maritime Drone Dataset, whose imaging characteristics align with the training data, highlighting the importance of domain-aware training in SR-applications.
- Abstract(参考訳): GAN(Generative Adversarial Networks)は、画像の現実的な超解像(SR)を実現しているが、セマンティック一貫性と画素単位の信頼性が欠如しており、災害対応、都市計画、農業などの重要なリモートセンシングアプリケーションにおける信頼性が制限されている。
本稿では,衛星画像にESRGANを統合するための最初のSRフレームワークであるSemantic and Uncertainty-Aware ESRGAN(SU-ESRGAN)について紹介する。
SU-ESRGANは、航空画像上のベースラインESRGANに匹敵する結果(PSNR、SSIM、LPIPS)を生成する。
この新モデルは、広視野視野カメラ(FoV)を使用した衛星システムやUAVにおいて、カバー範囲の空間分解能のトレードオフとして有用である。
モジュラー設計により、オンボードや後処理SR用のUAVデータパイプラインの統合が可能になり、動きのぼやけ、圧縮、センサーの制限によって画像が強化される。
さらに、モデルは、クロスドメインアプリケーションの性能を評価するために微調整される。
テストは高度と画像の視点が異なる2つのドローンベースのデータセットで実施される。
微調整されたモデルの性能評価は、訓練データと画像特性が一致したAerial Maritime Drone Datasetに強い適応性を示し、SRアプリケーションにおけるドメイン認識トレーニングの重要性を強調している。
関連論文リスト
- STAR: A Benchmark for Astronomical Star Fields Super-Resolution [51.79340280382437]
54,738個のフラックス一貫性の星体画像対を含む大規模SRデータセットSTARを提案する。
本稿では,Flux-Invariant Super Resolution (FISR)モデルを提案する。
論文 参考訳(メタデータ) (2025-07-22T09:28:28Z) - Data Augmentation and Resolution Enhancement using GANs and Diffusion Models for Tree Segmentation [49.13393683126712]
都市森林は、環境の質を高め、都市における生物多様性を支援する上で重要な役割を担っている。
複雑な地形と異なる衛星センサーやUAV飛行高度による画像解像度の変化により、正確に木を検知することは困難である。
低解像度空中画像の品質を高めるため,GANと拡散モデルとドメイン適応を統合した新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2025-05-21T03:57:10Z) - A Diffusion-Based Framework for Terrain-Aware Remote Sensing Image Reconstruction [4.824120664293887]
SatelliteMakerは、さまざまなレベルのデータ損失で失われたデータを再構成する拡散ベースの方法である。
条件入力としてのDEM(Digital Elevation Model)は、リアルな画像を生成するために調整されたプロンプトを使用する。
分散損失に基づくVGG-Adapterモジュール。
論文 参考訳(メタデータ) (2025-04-16T14:19:57Z) - SatFlow: Generative model based framework for producing High Resolution Gap Free Remote Sensing Imagery [0.0]
SatFlowは低分解能MODIS画像とランドサット観測を融合して高分解能・高分解能表面反射率画像を生成する生成モデルベースフレームワークである。
条件付きフローマッチングを用いて学習した本モデルでは, 構造的・スペクトル的整合性のある画像の生成性能が向上した。
この機能は、作物のフェノロジー追跡や環境変化検出など、下流のアプリケーションに不可欠である。
論文 参考訳(メタデータ) (2025-02-03T06:40:13Z) - DemosaicFormer: Coarse-to-Fine Demosaicing Network for HybridEVS Camera [70.28702677370879]
Hybrid Event-Based Vision Sensor (HybridEVS)は、従来のフレームベースとイベントベースのセンサーを統合する新しいセンサーである。
その可能性にもかかわらず、ハイブリッドEVS用に特別に設計された画像信号処理(ISP)パイプラインの欠如は大きな課題である。
粗大な復調と画素補正を含む,粗大で微細なフレームワークであるDemosaicFormerを提案する。
論文 参考訳(メタデータ) (2024-06-12T07:20:46Z) - Semantic Guided Large Scale Factor Remote Sensing Image Super-resolution with Generative Diffusion Prior [13.148815217684277]
大規模因子超解像(SR)アルゴリズムは、軌道から取得した低解像度(LR)衛星データの最大化に不可欠である。
既存の手法では、鮮明なテクスチャと正しい接地オブジェクトでSR画像を復元する際の課題に直面している。
本稿では,大規模リモートセンシング画像の超解像を実現するための新しいフレームワークであるセマンティックガイド拡散モデル(SGDM)を提案する。
論文 参考訳(メタデータ) (2024-05-11T16:06:16Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - A comparative analysis of SRGAN models [0.0]
実世界の画像のベンチマークデータセットを用いて,SRGAN(Super Resolution Generative Adversarial Network)モデル,ESRGAN,Real-ESRGAN,EDSRの性能評価を行った。
いくつかのモデルは、視覚的品質を維持しながら入力画像の解像度を著しく向上させるように見えるが、これはTesseract OCRエンジンを用いて評価される。
論文 参考訳(メタデータ) (2023-07-18T17:35:45Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。