論文の概要: Developing a foundation model for high-resolution remote sensing data of the Netherlands
- arxiv url: http://arxiv.org/abs/2605.10184v1
- Date: Mon, 11 May 2026 08:35:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.651224
- Title: Developing a foundation model for high-resolution remote sensing data of the Netherlands
- Title(参考訳): オランダにおける高分解能リモートセンシングデータの基礎モデルの構築
- Authors: Paul Vermeeren, Heysem Kaya,
- Abstract要約: オランダの1.2m高解像度衛星画像を用いた基礎モデルを構築した。
畳み込みニューラルネットワークとビジョントランスフォーマーを組み合わせることで、モデルは低周波と高周波の両方のランドスケープ特徴をキャプチャする。
モデルは時間にわたってより広いコンテキスト情報から学習し、そのモデルが時間的依存関係を活用できるようにする。
- 参考スコア(独自算出の注目度): 5.105973851661909
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We develop a foundation model using 1.2m high resolution satellite images of the Netherlands. By combining a Convolutional Neural Network and a Vision Transformer, the model captures both low- and high-frequency landscape features, such as fine textures, edges, and small objects as well as large terrain structures, elevation patterns, and land-cover distributions. Leveraging temporal data as input, the model learns from broader contextual information across time, allowing the model to exploit the temporal dependencies, such as topographic features, land-cover changes, and seasonal dynamics. These additional constraints reduce feature ambiguity, improve representation learning, and enable better generalization with fewer labeled samples. The foundation model is evaluated on multiple downstream tasks, ranging from use cases within the Netherlands to global benchmarking datasets. On the vegetation monitoring dataset of the Netherlands, the model shows clear performance improvements by incorporating temporal information instead of relying on a single time point. Despite using a smaller model and less pretraining data limited to the Netherlands, it achieves competitive results on global benchmarks when compared to state-of-the-art models. These results demonstrate that the model can learn rich, generalizable representations from limited data, achieving competitive performance on global benchmarks while using a fraction of the parameters of larger state-of-the-art remote sensing models. To maximize reproducibility and reuse, we made the scripts and the model accessible on GitHub.
- Abstract(参考訳): オランダの1.2m高解像度衛星画像を用いた基礎モデルを構築した。
Convolutional Neural NetworkとVision Transformerを組み合わせることで、このモデルは、微細なテクスチャ、エッジ、小さなオブジェクトなど、低周波と高周波の両方のランドスケープ特性と、大きな地形構造、標高パターン、土地被覆分布をキャプチャする。
時間的データを入力として活用することで、モデルは時間にわたってより広いコンテキスト情報から学習し、地形的特徴や土地被覆の変化、季節的ダイナミクスといった時間的依存関係を活用することができる。
これらの追加制約は、特徴の曖昧さを減らし、表現学習を改善し、ラベル付きサンプルを減らしてより良い一般化を可能にする。
ファンデーションモデルは、オランダのユースケースからグローバルなベンチマークデータセットまで、複数のダウンストリームタスクで評価されます。
オランダの植生モニタリングデータセットでは、単一の時間ポイントに頼るのではなく、時間情報を組み込むことによって、明確なパフォーマンス向上を示す。
より小さなモデルを使用し、オランダに限定した事前トレーニングの少ないデータを使用するにもかかわらず、最先端のモデルと比較して、グローバルベンチマークで競合する結果が得られる。
これらの結果から,モデルが限られたデータからリッチで一般化可能な表現を学習し,大規模リモートセンシングモデルのパラメータのごく一部を使用しながら,グローバルベンチマーク上での競争性能を達成できることが示唆された。
再現性と再利用を最大化するために、スクリプトとモデルをGitHubでアクセス可能にしました。
関連論文リスト
- Glocal Information Bottleneck for Time Series Imputation [70.41814118117311]
Time Series Imputationは、時間データの欠落した値を復元することを目的としている。
既存のモデルは、通常、数値(ローカル情報)の回復に焦点をあてて、ポイントワイズ復元損失を最適化する。
我々はGlocal Information Bottleneck(Glocal-IB)という新たなトレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2025-10-06T15:24:44Z) - Towards Scalable and Generalizable Earth Observation Data Mining via Foundation Model Composition [0.0]
リモートセンシングと一般ビジョンデータセットに事前訓練された基礎モデルを効果的に組み合わせて性能を向上させることができるかを検討する。
その結果、より小さな事前訓練モデルの特徴レベルのアンサンブルは、はるかに大きなモデルの性能に適合するか、超える可能性があることがわかった。
この研究は、よりコンパクトなモデルにアンサンブルの強度を伝達するために知識蒸留を適用する可能性を強調している。
論文 参考訳(メタデータ) (2025-06-25T07:02:42Z) - FoundIR: Unleashing Million-scale Training Data to Advance Foundation Models for Image Restoration [66.61201445650323]
既存の手法は現実のシナリオにおける一般化ボトルネックに悩まされる。
既存のトレーニングデータに対して,2つの大きなメリットがある,100万規模のデータセットをコントリビュートしています。
実世界のシナリオにおいて,より広範囲の復元作業に対処するために,ロバストなモデルFoundIRを提案する。
論文 参考訳(メタデータ) (2024-12-02T12:08:40Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - Foundation Models for Generalist Geospatial Artificial Intelligence [3.7002058945990415]
本稿では,大規模データに基づく基礎モデルの事前学習と微調整を効果的に行うための第1種フレームワークを提案する。
我々はこの枠組みを利用して、マルチスペクトル衛星画像の1TB以上を事前トレーニングしたトランスフォーマーベースの基礎モデルであるPrithviを開発した。
論文 参考訳(メタデータ) (2023-10-28T10:19:55Z) - Lag-Llama: Towards Foundation Models for Probabilistic Time Series
Forecasting [54.04430089029033]
本稿では,デコーダのみの変換器アーキテクチャに基づく時系列予測のための汎用基礎モデルであるLag-Llamaを提案する。
Lag-Llamaは、複数のドメインからの多様な時系列データの大規模なコーパスで事前訓練され、強力なゼロショット一般化能力を示す。
このような未確認データセットの比較的小さな部分で微調整を行うと、Lag-Llamaは最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-10-12T12:29:32Z) - Understanding and Improving Model Averaging in Federated Learning on Heterogeneous Data [9.792805355704203]
We study the loss landscape of model averaging in Federated Learning (FL)。
我々は,グローバルモデルの損失を,クライアントモデルに関連する5つの要因に分解する。
我々は,IMAを訓練後期のグローバルモデルに利用して,期待する速度からの偏差を低減することを提案する。
論文 参考訳(メタデータ) (2023-05-13T06:19:55Z) - Taxonomizing local versus global structure in neural network loss
landscapes [60.206524503782006]
ロスランドスケープが世界規模で良好に接続されている場合, 最適なテスト精度が得られることを示す。
また、モデルが小さい場合や、品質の低いデータに訓練された場合、世界規模で接続の不十分なランドスケープが生じる可能性があることも示しています。
論文 参考訳(メタデータ) (2021-07-23T13:37:14Z) - Federated Learning With Quantized Global Model Updates [84.55126371346452]
モバイル端末がローカルデータセットを使用してグローバルモデルをトレーニングできるフェデレーション学習について検討する。
本稿では,大域的モデルと局所的モデル更新の両方を,送信前に量子化する損失FL(LFL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-18T16:55:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。