論文の概要: Flow matching for Sentinel-2 super-resolution: implementation, application, and implications
- arxiv url: http://arxiv.org/abs/2605.00367v1
- Date: Fri, 01 May 2026 03:07:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.83278
- Title: Flow matching for Sentinel-2 super-resolution: implementation, application, and implications
- Title(参考訳): Sentinel-2超解像のためのフローマッチング:実装,応用,含意
- Authors: Dakota Hester, Vitor S. Martins, Lucas B. Ferreira, Thainara M. A. Lima, Juliana A. Araújo,
- Abstract要約: アメリカ合衆国(CONUS)上空の可視・近赤外帯の4次元超解像に対するフローマッチングモデルを提案する。
その結果,Euler法を用いて1枚のサンプリング工程において,フローマッチングモデルの方が拡散特性とリアルESRGANモデルに優れることがわかった。
我々はこのモデルを用いて、202510mのSentinel-2年次複合材料から合成した2.5mの超解像4バンド CONUS 画像製品を開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Developing robust techniques for super-resolution of satellite imagery involves navigating commonly observed trade-offs between spectral fidelity and perceptual quality. In this work, we introduce a flow matching model for 4x super-resolution of 10-m Sentinel-2 visible and near-infrared bands over the conterminous United States (CONUS) using a dataset of 120,851 10-m Sentinel-2 and 2.5-m resampled NAIP imagery pairs acquired on the same day. Our results showed that the flow matching model outperformed diffusion and Real-ESRGAN models in pixel-wise accuracy in a single sampling step using the Euler method. When evaluated with a second-order Midpoint solver, our model generated perceptually realistic super-resolved imagery in only 20 sampling steps, effectively navigating the perception-distortion trade-off at inference time without retraining. We used this model to produce a super-resolved 2.5-m 4-band CONUS imagery product derived from 2025 10-m Sentinel-2 annual composites, consisting of over 1.58 trillion pixels. We further evaluated the use of super-resolved data on a land cover classification task using semantic segmentation models. Finally, we generated a yearly 2.5-m land cover product for the Chesapeake Bay watershed for 2020-2025. An accuracy assessment against 25,000 ground truth points revealed an overall accuracy of 89.11% for the annual land cover product. We conclude that flow matching is an effective generative modeling approach for super-resolution of Sentinel-2 imagery compared to diffusion and Generative Adversarial Network-based methods, and has strong implications for expanding access to high-resolution imagery for geospatial applications that demand fine spatial detail.
- Abstract(参考訳): 衛星画像の超高解像度化のためのロバストな技術を開発するには、スペクトルの忠実度と知覚品質の間の共通のトレードオフをナビゲートする必要がある。
本研究では,120,851 10-m Sentinel-2と2.5-m resampled NAIP画像ペアを同日に取得したデータセットを用いて,アメリカ合衆国(CONUS)上空の10m Sentinel-2可視・近赤外帯域の4倍超解像のフローマッチングモデルを提案する。
その結果,Euler法を用いて1枚のサンプリング工程において,フローマッチングモデルの方が拡散特性とリアルESRGANモデルに優れることがわかった。
2階のミッドポイントソルバを用いて評価すると,20段階のサンプリングステップで知覚的に現実的な超解像が生成され,推論時における知覚歪みトレードオフが再学習なしで効果的にナビゲートされる。
我々はこのモデルを用いて、202510mのSentinel-2年次複合材料から合成した2.5mの超解像4バンド CONUS 画像製品を開発した。
さらに,セグメンテーションモデルを用いて,土地被覆分類作業における超解データの利用について検討した。
最終的に、2020-2025年にチェサピーク湾流域の年間2.5mの土地被覆物を生成した。
地上の真理点25,000点に対する精度評価の結果、年間土地被覆品の総合的精度は89.11%であった。
フローマッチングは,拡散および生成逆数ネットワークに基づく手法と比較して,Sentinel-2画像の超解像に対する効果的な生成モデル手法であり,空間的細部を必要とする地理空間的アプリケーションにおいて,高分解能画像へのアクセスを拡大するための強い意味を持つ。
関連論文リスト
- Spatiotemporal Satellite Image Downscaling with Transfer Encoders and Autoregressive Generative Models [6.277747770841536]
本稿では,衛星画像の粗大な入力から微細な衛星画像の再構成を行うトランスファーラーニング・ジェネレーション・ダウンスケーリング・フレームワークを提案する。
提案手法は,軽量なU-Net転送エンコーダと拡散型生成モデルを組み合わせたものである。
論文 参考訳(メタデータ) (2025-12-01T06:00:45Z) - An Efficient Remote Sensing Super Resolution Method Exploring Diffusion Priors and Multi-Modal Constraints for Crop Type Mapping [0.0]
超解像度は、低解像度でも歴史的に価値のあるリモートセンシング画像アーカイブを利用する方法を提供する。
現在の手法では、科学的に現実的なイメージを再構成するための現実的な制約として補助情報を限定的に活用している。
RSSR のための効率的な LSSR フレームワークを提案し,Landsat 8 と Sentinel 2 画像のペア化によるマルチモーダルデータセットを提案する。
論文 参考訳(メタデータ) (2025-10-27T14:34:52Z) - Efficient Perceptual Image Super Resolution: AIM 2025 Study and Benchmark [53.56717645904575]
我々は,厳密な効率制約を満たしつつ,Real-ESRGANの知覚結果を再現または改善することを目的としている。
提案手法は,500枚の4K解像度の試験画像からなる新しいデータセット上で評価され,それぞれが複数の劣化型を用いて劣化した。
最高パフォーマンスのアプローチは、すべてのベンチマークデータセットでReal-ESRGANを上回ります。
論文 参考訳(メタデータ) (2025-10-14T17:45:22Z) - DiffFuSR: Super-Resolution of all Sentinel-2 Multispectral Bands using Diffusion Models [12.227962960123016]
本稿では,Sentinel-2 Level-2A画像の12のスペクトル帯域を超解像するモジュールパイプラインDiffFuSRを提案する。
パイプラインは、(i)拡散ベース超解像(SR)モデルで、NAIPとWorldStratデータセットから高分解能RGB画像に基づいてトレーニングされ、Sentinel-2特性をシミュレートするために調和し、(ii)超解像RGB画像を用いて残りのマルチスペクトルバンドを空間的にスケールアップする学習融合ネットワークである。
論文 参考訳(メタデータ) (2025-06-13T13:18:09Z) - Unsupervised Fault Detection using SAM with a Moving Window Approach [0.0]
本稿では、SAM(High End Segment Anything Model)と移動ウィンドウアプローチを用いた教師なし手法を提案する。
我々は、微調整やラベル付きデータを必要とせずに、これらの課題を克服することを目指している。
論文 参考訳(メタデータ) (2024-07-08T18:12:29Z) - From Blurry to Brilliant Detection: YOLO-Based Aerial Object Detection with Super Resolution [3.5044007821404635]
空中物体検出は、小さな物体の大きさ、高密度クラスタリング、距離や動きのぼかしによる画質劣化などの課題を提示する。
B2BDetは、推論中にドメイン固有の超解像を適用し、拡張されたYOLOv5アーキテクチャを使って検出する2段階のフレームワークでこの問題に対処する。
このアプローチは、航空最適化SRGAN微調整とEAM(Efficient Attention Module)やCLFPN(Cross-Layer Feature Pyramid Network)といったアーキテクチャ革新を組み合わせる。
論文 参考訳(メタデータ) (2024-01-26T05:50:58Z) - On Distillation of Guided Diffusion Models [94.95228078141626]
そこで本研究では,分類器を含まない誘導拡散モデルから抽出し易いモデルへ抽出する手法を提案する。
画素空間上で訓練された標準拡散モデルに対して,本手法は元のモデルに匹敵する画像を生成することができる。
遅延空間で訓練された拡散モデル(例えば、安定拡散)に対して、我々の手法は1から4段階のデノナイジングステップで高忠実度画像を生成することができる。
論文 参考訳(メタデータ) (2022-10-06T18:03:56Z) - Unsupervised Foggy Scene Understanding via Self Spatial-Temporal Label
Diffusion [51.11295961195151]
運転シーンの霧画像列の特徴を利用して、自信ある擬似ラベルを密度化する。
局所的な空間的類似性と逐次画像データの隣接時間対応の2つの発見に基づいて,新たなターゲット・ドメイン駆動擬似ラベル拡散方式を提案する。
本手法は,2つの天然霧のデータセット上で51.92%,53.84%の平均交叉結合(mIoU)を達成するのに有効である。
論文 参考訳(メタデータ) (2022-06-10T05:16:50Z) - Projected GANs Converge Faster [50.23237734403834]
GAN(Generative Adversarial Networks)は高品質な画像を生成するが、訓練は難しい。
生成したサンプルと実際のサンプルを固定された事前訓練された特徴空間に投影することで、これらの問題に大きく取り組みます。
我々の投影GANは画像品質、サンプル効率、収束速度を改善する。
論文 参考訳(メタデータ) (2021-11-01T15:11:01Z) - Cascaded Diffusion Models for High Fidelity Image Generation [53.57766722279425]
本研究では,画像ネット生成の課題に対して,カスケード拡散モデルを用いて高忠実度画像を生成可能であることを示す。
カスケード拡散モデルは、解像度が増大する画像を生成する複数の拡散モデルのパイプラインを含む。
その結果,カスケードパイプラインのサンプル品質は,条件付拡張に大きく依存していることがわかった。
論文 参考訳(メタデータ) (2021-05-30T17:14:52Z) - Unlimited Resolution Image Generation with R2D2-GANs [69.90258455164513]
本稿では,任意の解像度の高品質な画像を生成するための新しいシミュレーション手法を提案する。
この方法では、フル長のミッション中に収集したソナースキャンと同等の大きさのソナースキャンを合成することができる。
生成されたデータは、連続的で、現実的に見え、また、取得の実際の速度の少なくとも2倍の速さで生成される。
論文 参考訳(メタデータ) (2020-03-02T17:49:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。