論文の概要: Metadata, Wavelet, and Time Aware Diffusion Models for Satellite Image Super Resolution
- arxiv url: http://arxiv.org/abs/2506.23566v1
- Date: Mon, 30 Jun 2025 07:19:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.952264
- Title: Metadata, Wavelet, and Time Aware Diffusion Models for Satellite Image Super Resolution
- Title(参考訳): 衛星画像超解像のためのメタデータ・ウェーブレット・時間対応拡散モデル
- Authors: Luigi Sigillo, Renato Giamba, Danilo Comminiello,
- Abstract要約: MWT-Diffは、衛星画像超解像(SR)のための革新的なフレームワークである
フレームワークの中核は、新しいメタデータ、ウェーブレット、タイムアウェアエンコーダ(MWT-Encoder)である。
埋め込み特徴表現は階層的拡散力学を駆使し、モデルが低解像度入力から高解像度衛星画像を徐々に再構成する。
- 参考スコア(独自算出の注目度): 4.307648859471193
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The acquisition of high-resolution satellite imagery is often constrained by the spatial and temporal limitations of satellite sensors, as well as the high costs associated with frequent observations. These challenges hinder applications such as environmental monitoring, disaster response, and agricultural management, which require fine-grained and high-resolution data. In this paper, we propose MWT-Diff, an innovative framework for satellite image super-resolution (SR) that combines latent diffusion models with wavelet transforms to address these challenges. At the core of the framework is a novel metadata-, wavelet-, and time-aware encoder (MWT-Encoder), which generates embeddings that capture metadata attributes, multi-scale frequency information, and temporal relationships. The embedded feature representations steer the hierarchical diffusion dynamics, through which the model progressively reconstructs high-resolution satellite imagery from low-resolution inputs. This process preserves critical spatial characteristics including textural patterns, boundary discontinuities, and high-frequency spectral components essential for detailed remote sensing analysis. The comparative analysis of MWT-Diff across multiple datasets demonstrated favorable performance compared to recent approaches, as measured by standard perceptual quality metrics including FID and LPIPS.
- Abstract(参考訳): 高解像度衛星画像の取得は、しばしば衛星センサーの空間的および時間的制限と、頻繁な観測に伴う高コストによって制限される。
これらの課題は、環境モニタリング、災害対応、農業管理といった、きめ細かい高解像度のデータを必要とする応用を妨げる。
本稿では、遅延拡散モデルとウェーブレット変換を組み合わせた衛星画像超解像(SR)のための革新的なフレームワークであるMWT-Diffを提案する。
フレームワークのコアとなるのは、メタデータ属性、マルチスケールの周波数情報、時間関係をキャプチャする埋め込みを生成する新しいメタデータ、ウェーブレット、タイムアウェアエンコーダ(MWT-Encoder)である。
埋め込み特徴表現は階層的拡散力学を駆使し、モデルが低解像度入力から高解像度衛星画像を徐々に再構成する。
このプロセスは、テクスチャパターン、境界不連続性、および詳細なリモートセンシング分析に必要な高周波スペクトル成分を含む重要な空間特性を保存する。
複数のデータセットを対象としたMWT-Diffの比較分析は、FIDやLPIPSといった標準的な知覚品質指標によって測定されるように、近年のアプローチと比較して、良好なパフォーマンスを示した。
関連論文リスト
- Quaternion Wavelet-Conditioned Diffusion Models for Image Super-Resolution [7.986370916847687]
本稿では、第4次ウェーブレット前処理フレームワークと遅延拡散モデルを統合する新しいSRフレームワークResQuを紹介する。
提案手法は,四元系ウェーブレットの埋め込みを利用して,様々な段階で動的に統合される条件付けプロセスを強化する。
提案手法は,多くの場合において,知覚品質および標準評価指標における既存手法よりも優れる,優れたSR結果が得られる。
論文 参考訳(メタデータ) (2025-05-01T06:17:33Z) - A Diffusion-Based Framework for Terrain-Aware Remote Sensing Image Reconstruction [4.824120664293887]
SatelliteMakerは、さまざまなレベルのデータ損失で失われたデータを再構成する拡散ベースの方法である。
条件入力としてのDEM(Digital Elevation Model)は、リアルな画像を生成するために調整されたプロンプトを使用する。
分散損失に基づくVGG-Adapterモジュール。
論文 参考訳(メタデータ) (2025-04-16T14:19:57Z) - FreSca: Scaling in Frequency Space Enhances Diffusion Models [55.75504192166779]
本稿では,潜時拡散モデルにおける周波数制御について検討する。
本稿では,低周波成分と高周波成分にノイズ差を分解する新しいフレームワークFreScaを紹介する。
FreScaはモデルの再トレーニングやアーキテクチャの変更なしに動作し、モデルとタスクに依存しない制御を提供する。
論文 参考訳(メタデータ) (2025-04-02T22:03:11Z) - DehazeMamba: SAR-guided Optical Remote Sensing Image Dehazing with Adaptive State Space Model [27.83437788159158]
DehazeMambaはプログレッシブ・ヘイズ・デカップリング・フュージョン・ストラテジー上に構築された新規なSAR誘導脱ヘイズ・ネットワークである。
提案手法は,光-SAR差分解析によるヘイズ影響領域を動的に同定するHPDMと,特徴量評価に基づく2段階融合プロセスによるドメインシフトを緩和するプログレッシブ・フュージョン・モジュール (PFM) である。
大規模な実験により、DehazeMambaは最先端の手法を著しく上回り、PSNRの0.73dB改善と下流タスクの大幅な強化を実現している。
論文 参考訳(メタデータ) (2025-03-17T11:25:05Z) - Deep Multimodal Fusion for Semantic Segmentation of Remote Sensing Earth Observation Data [0.08192907805418582]
本稿では,セマンティックセグメンテーションのための後期融合深層学習モデル(LF-DLM)を提案する。
1つのブランチは、UNetFormerがキャプチャした空中画像の詳細なテクスチャと、ViT(Multi-Axis Vision Transformer)バックボーンを統合する。
もう一方のブランチは、U-ViNet(U-TAE)を用いてSentinel-2衛星画像Max時系列から複雑な時間ダイナミクスをキャプチャする。
論文 参考訳(メタデータ) (2024-10-01T07:50:37Z) - SFANet: Spatial-Frequency Attention Network for Weather Forecasting [54.470205739015434]
天気予報は様々な分野において重要な役割を担い、意思決定とリスク管理を推進している。
伝統的な手法は、しばしば気象系の複雑な力学を捉えるのに苦労する。
本稿では,これらの課題に対処し,天気予報の精度を高めるための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2024-05-29T08:00:15Z) - Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.902047563260496]
我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。
より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。
我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文 参考訳(メタデータ) (2024-05-08T11:09:24Z) - Diffusion Models for Interferometric Satellite Aperture Radar [73.01013149014865]
確率拡散モデル (Probabilistic Diffusion Models, PDMs) は、最近、非常に有望な生成モデルのクラスとして登場した。
ここでは、PDMを活用して、レーダーベースの衛星画像データセットを複数生成する。
PDMは複雑で現実的な構造を持つ画像を生成することに成功したが、サンプリング時間は依然として問題である。
論文 参考訳(メタデータ) (2023-08-31T16:26:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。