論文の概要: When Earth Foundation Models Meet Diffusion: An Application to Land Surface Temperature Super-Resolution
- arxiv url: http://arxiv.org/abs/2604.16841v1
- Date: Sat, 18 Apr 2026 05:21:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.196859
- Title: When Earth Foundation Models Meet Diffusion: An Application to Land Surface Temperature Super-Resolution
- Title(参考訳): 地球モデルと拡散:地表面温度超解法への応用
- Authors: Yiheng Chen, Zihui Ma, Peishi Jiang, Yilong Dai, Qikai Hu, Xinyue Ye, Lingyao Li, Rita Sousa, Runlong Yu,
- Abstract要約: 極端空間劣化下での超解像のための新しいフレームワークであるEFDiffを提案する。
EFDiffはPrithvi-EO-2.0 Earth基盤モデルを用いて、高分解能マルチスペクトル反射率を地理空間埋め込みにエンコードする。
我々は,Landsat共登録熱反射パッチ242,416枚からなる世界規模の多種多様なベンチマークを用いて,EFDiffを極端な32倍のスケールギャップで評価した。
- 参考スコア(独自算出の注目度): 7.772443261581984
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Land surface temperature (LST) super-resolution is important for environmental monitoring. However, it remains challenging as coarse thermal observations severely underdetermine fine-scale structure. In this paper, we propose Earth Foundation Model-guided Diffusion (EFDiff), a novel framework for super-resolution under extreme spatial degradation. EFDiff uses the Prithvi-EO-2.0 Earth foundation model to encode high-resolution multispectral reflectance into geospatial embeddings, which are injected into the denoising network via cross-attention to guide fine-scale reconstruction from highly degraded observations. We study two variants, EFDiff-$ε$ and EFDiff-$x_0$, which offer complementary trade-offs between perceptual realism and pixel-level fidelity. We evaluate EFDiff under an extreme $32\times$ scale gap using a globally diverse benchmark comprising 242,416 co-registered Landsat thermal-reflectance patches. Results show that EFDiff consistently outperforms baseline methods and that cross-attention conditioning by EFM is more effective than HLS channel concatenation. Although we present EFDiff in the context of LST super-resolution, the framework is broadly applicable to remote sensing problems in which pretrained geospatial representations can guide generative reconstruction.
- Abstract(参考訳): 地表面温度(LST)超解像は環境モニタリングにおいて重要である。
しかし、粗い熱観測が極めて微細な構造を過小評価しているため、これは依然として困難である。
本稿では,地球モデル誘導拡散法(EFDiff)を提案する。
EFDiffはPrithvi-EO-2.0アース基礎モデルを用いて、高分解能マルチスペクトル反射を地理空間埋め込みにエンコードする。
EFDiff-$ε$とEFDiff-$x_0$という2つの変種について検討した。
EFDiffは242,416個のLandsat共登録熱反射パッチからなる世界規模で多種多様なベンチマークを用いて,32\times$スケールギャップで評価した。
その結果、EFDiffはベースライン法より一貫して優れており、EMFによるクロスアテンション条件付けはHLSチャネル結合よりも効果的であることがわかった。
LST超解像の文脈でEFDiffを提案するが、このフレームワークは、事前訓練された地理空間表現が生成的再構成を導くリモートセンシング問題に広く適用できる。
関連論文リスト
- Controllable Reference Guided Diffusion with Local Global Fusion for Real World Remote Sensing Image Super Resolution [9.658727475375565]
超解像技術は、リモートセンシング画像の空間分解能を高め、より効率的な大規模な地球観測アプリケーションを可能にする。
既存のRefSR手法は、クロスセンサーの解像度ギャップや重要な土地被覆の変化など、現実世界の複雑さに苦しむ。
実世界リモートセンシング画像SRのための新しい制御可能な参照誘導拡散モデルであるCRefDiffを提案する。
論文 参考訳(メタデータ) (2025-06-30T12:45:28Z) - Data Augmentation and Resolution Enhancement using GANs and Diffusion Models for Tree Segmentation [49.13393683126712]
都市森林は、環境の質を高め、都市における生物多様性を支援する上で重要な役割を担っている。
複雑な地形と異なる衛星センサーやUAV飛行高度による画像解像度の変化により、正確に木を検知することは困難である。
低解像度空中画像の品質を高めるため,GANと拡散モデルとドメイン適応を統合した新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2025-05-21T03:57:10Z) - No Location Left Behind: Measuring and Improving the Fairness of Implicit Representations for Earth Data [13.412573082645096]
暗黙の神経表現(INR)は、地球表象の課題に対処する上での公約が増大している。
既存の手法はグローバルな平均性能を不均等に優先する。
FAIR-Earthは、地球表象の不等式を調べ、挑戦するための第一種データセットである。
論文 参考訳(メタデータ) (2025-02-05T16:51:13Z) - RaNeuS: Ray-adaptive Neural Surface Reconstruction [87.20343320266215]
微分可能放射場 eg NeRF を利用して、新しいビューレンダリングを生成するとともに、詳細な3次元表面を再構成する。
本研究では,SDFから放射場への射影を一様等間隔のアイコニカル正規化で定式化し,最適化することを考えると,光度重み付け係数を改良する。
提案する textitRaNeuS は,合成データと実データの両方で広く評価されている。
論文 参考訳(メタデータ) (2024-06-14T07:54:25Z) - Generative Adversarial Models for Extreme Geospatial Downscaling [0.0]
本稿では,非常に高いスケーリング係数に対応可能な条件付きGANに基づく地理空間ダウンスケーリング手法について述べる。
この手法は、既存の手法では無視されがちなダウンスケーリングプロセスに固有の不確実性を明確に考慮する。
1つの決定論的結果ではなく、多量の高分解能サンプルを生成する。
論文 参考訳(メタデータ) (2024-02-21T18:25:04Z) - Diffusion Models Without Attention [110.5623058129782]
Diffusion State Space Model (DiffuSSM) は、よりスケーラブルな状態空間モデルバックボーンで注目メカニズムを置き換えるアーキテクチャである。
拡散訓練におけるFLOP効率の高いアーキテクチャへの注力は、大きな前進となる。
論文 参考訳(メタデータ) (2023-11-30T05:15:35Z) - On Robust Cross-View Consistency in Self-Supervised Monocular Depth Estimation [56.97699793236174]
本論文では,2種類の堅牢なクロスビュー整合性について検討する。
深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。
いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2022-09-19T03:46:13Z) - HDNet: High-resolution Dual-domain Learning for Spectral Compressive
Imaging [138.04956118993934]
HSI再構成のための高分解能デュアルドメイン学習ネットワーク(HDNet)を提案する。
一方、高効率な特徴融合によるHR空間スペクトルアテンションモジュールは、連続的かつ微細な画素レベルの特徴を提供する。
一方、HSI再構成のために周波数領域学習(FDL)を導入し、周波数領域の差を狭める。
論文 参考訳(メタデータ) (2022-03-04T06:37:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。