論文の概要: An Efficient Remote Sensing Super Resolution Method Exploring Diffusion Priors and Multi-Modal Constraints for Crop Type Mapping
- arxiv url: http://arxiv.org/abs/2510.23382v1
- Date: Mon, 27 Oct 2025 14:34:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.573125
- Title: An Efficient Remote Sensing Super Resolution Method Exploring Diffusion Priors and Multi-Modal Constraints for Crop Type Mapping
- Title(参考訳): 作物型マッピングのための拡散優先条件とマルチモード制約を探索する効率的なリモートセンシング超解法
- Authors: Songxi Yang, Tang Sui, Qunying Huang,
- Abstract要約: 超解像度は、低解像度でも歴史的に価値のあるリモートセンシング画像アーカイブを利用する方法を提供する。
現在の手法では、科学的に現実的なイメージを再構成するための現実的な制約として補助情報を限定的に活用している。
RSSR のための効率的な LSSR フレームワークを提案し,Landsat 8 と Sentinel 2 画像のペア化によるマルチモーダルデータセットを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Super resolution offers a way to harness medium even lowresolution but historically valuable remote sensing image archives. Generative models, especially diffusion models, have recently been applied to remote sensing super resolution (RSSR), yet several challenges exist. First, diffusion models are effective but require expensive training from scratch resources and have slow inference speeds. Second, current methods have limited utilization of auxiliary information as real-world constraints to reconstruct scientifically realistic images. Finally, most current methods lack evaluation on downstream tasks. In this study, we present a efficient LSSR framework for RSSR, supported by a new multimodal dataset of paired 30 m Landsat 8 and 10 m Sentinel 2 imagery. Built on frozen pretrained Stable Diffusion, LSSR integrates crossmodal attention with auxiliary knowledge (Digital Elevation Model, land cover, month) and Synthetic Aperture Radar guidance, enhanced by adapters and a tailored Fourier NDVI loss to balance spatial details and spectral fidelity. Extensive experiments demonstrate that LSSR significantly improves crop boundary delineation and recovery, achieving state-of-the-art performance with Peak Signal-to-Noise Ratio/Structural Similarity Index Measure of 32.63/0.84 (RGB) and 23.99/0.78 (IR), and the lowest NDVI Mean Squared Error (0.042), while maintaining efficient inference (0.39 sec/image). Moreover, LSSR transfers effectively to NASA Harmonized Landsat and Sentinel (HLS) super resolution, yielding more reliable crop classification (F1: 0.86) than Sentinel-2 (F1: 0.85). These results highlight the potential of RSSR to advance precision agriculture.
- Abstract(参考訳): 超解像度は、低解像度でも歴史的に価値のあるリモートセンシング画像アーカイブを利用する方法を提供する。
生成モデル、特に拡散モデルは最近、リモートセンシング超解像(RSSR)に適用されているが、いくつかの課題が存在する。
第一に、拡散モデルは効果的であるが、スクラッチリソースからの高価なトレーニングが必要であり、推論速度が遅い。
第二に、現在の手法では、科学的に現実的なイメージを再構成するための現実的な制約として補助情報を限定的に活用している。
最後に、現在のほとんどのメソッドは下流タスクの評価を欠いている。
本研究では,30m Landsat 8 と 10m Sentinel 2 の2つの画像からなる新たなマルチモーダルデータセットにより,RSSR のための効率的な LSSR フレームワークを提案する。
LSSRは、凍結した安定拡散に基づいて構築され、補助的な知識(デジタル標高モデル、ランドカバー、月)と合成開口レーダ誘導を統合し、アダプタによって強化され、空間的詳細とスペクトルの忠実さのバランスをとるために、フーリエNDVIの損失を調整した。
大規模な実験により、LSSRは作物の境界線と回復を著しく改善し、ピーク信号/ノイズ比/構造的類似度指数の32.63/0.84(RGB)と23.99/0.78(IR)と最低のNDVI平均正方形誤差(0.042)を計測し、効率的な推論(0.39 sec/image)を維持した。
さらに、LSSRは NASA Harmonized Landsat and Sentinel (HLS) スーパーレゾリューションに効果的に移行し、Sentinel-2 (F1: 0.85) よりも信頼性の高い作物分類(F1: 0.86)が得られる。
これらの結果は、RSSRが精密農業を推し進める可能性を浮き彫りにした。
関連論文リスト
- DiffFuSR: Super-Resolution of all Sentinel-2 Multispectral Bands using Diffusion Models [12.227962960123016]
本稿では,Sentinel-2 Level-2A画像の12のスペクトル帯域を超解像するモジュールパイプラインDiffFuSRを提案する。
パイプラインは、(i)拡散ベース超解像(SR)モデルで、NAIPとWorldStratデータセットから高分解能RGB画像に基づいてトレーニングされ、Sentinel-2特性をシミュレートするために調和し、(ii)超解像RGB画像を用いて残りのマルチスペクトルバンドを空間的にスケールアップする学習融合ネットワークである。
論文 参考訳(メタデータ) (2025-06-13T13:18:09Z) - GenDR: Lightning Generative Detail Restorator [18.465568249533966]
我々は,より大きい潜伏空間を持つテーラー拡散モデルから抽出した生成詳細復元のための1段階拡散モデルGenDRを提案する。
実験の結果,GenDRは定量的な測定値と視覚的忠実度の両方で最先端の性能を達成できた。
論文 参考訳(メタデータ) (2025-03-09T22:02:18Z) - Latent Diffusion, Implicit Amplification: Efficient Continuous-Scale Super-Resolution for Remote Sensing Images [7.920423405957888]
E$2$DiffSRは、最先端のSR手法と比較して、客観的な指標と視覚的品質を達成する。
拡散に基づくSR法の推論時間を非拡散法と同程度のレベルに短縮する。
論文 参考訳(メタデータ) (2024-10-30T09:14:13Z) - Spatial Annealing for Efficient Few-shot Neural Rendering [73.49548565633123]
我々はtextbfSpatial textbf Annealing regularized textbfNeRF (textbfSANeRF) という,正確で効率的な数発のニューラルレンダリング手法を導入する。
単に1行のコードを追加することで、SANeRFは、現在の数ショットのニューラルレンダリング方法と比較して、より優れたレンダリング品質とはるかに高速な再構築速度を提供する。
論文 参考訳(メタデータ) (2024-06-12T02:48:52Z) - ResShift: Efficient Diffusion Model for Image Super-resolution by
Residual Shifting [70.83632337581034]
拡散に基づく画像超解像法(SR)は主に低推論速度によって制限される。
本稿では,SRの拡散段数を大幅に削減する新しい,効率的な拡散モデルを提案する。
本手法は,残差をシフトすることで高分解能画像と低分解能画像の間を移動させるマルコフ連鎖を構成する。
論文 参考訳(メタデータ) (2023-07-23T15:10:02Z) - SuperYOLO: Super Resolution Assisted Object Detection in Multimodal
Remote Sensing Imagery [36.216230299131404]
マルチモーダルデータを融合し,マルチスケールオブジェクトに対して高分解能(HR)オブジェクト検出を行うSuperYOLOを提案する。
提案モデルでは,最先端モデルと比較して,精度と速度のトレードオフが良好である。
論文 参考訳(メタデータ) (2022-09-27T12:58:58Z) - Fourier Space Losses for Efficient Perceptual Image Super-Resolution [131.50099891772598]
提案した損失関数の適用のみで,最近導入された効率的なジェネレータアーキテクチャの性能向上が可能であることを示す。
フーリエ空間における周波数に対する損失の直接的強調は知覚的画質を著しく向上させることを示す。
訓練されたジェネレータは、最先端の知覚的SR法である RankSRGAN と SRFlow よりも2.4倍、48倍高速である。
論文 参考訳(メタデータ) (2021-06-01T20:34:52Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。