論文の概要: GeoCrossBench: Cross-Band Generalization for Remote Sensing
- arxiv url: http://arxiv.org/abs/2511.02831v1
- Date: Tue, 04 Nov 2025 18:58:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:06.162034
- Title: GeoCrossBench: Cross-Band Generalization for Remote Sensing
- Title(参考訳): GeoCrossBench: リモートセンシングのためのクロスバンド一般化
- Authors: Hakob Tamazyan, Ani Vanyan, Alvard Barseghyan, Anna Khosrovyan, Evan Shelhamer, Hrant Khachatrian,
- Abstract要約: 新しい評価プロトコルを備えたGeoBenchベンチマークの拡張であるGeoCrossBenchを紹介する。
分配性能、バンドオーバーラップのない衛星への一般化、追加のバンドによる衛星への一般化などをテストする。
また,ChannelViTの自己教師付き拡張であるChiViTを開発し,そのクロスサテライト性能を改善した。
- 参考スコア(独自算出の注目度): 5.039951899275048
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The number and diversity of remote sensing satellites grows over time, while the vast majority of labeled data comes from older satellites. As the foundation models for Earth observation scale up, the cost of (re-)training to support new satellites grows too, so the generalization capabilities of the models towards new satellites become increasingly important. In this work we introduce GeoCrossBench, an extension of the popular GeoBench benchmark with a new evaluation protocol: it tests the in-distribution performance; generalization to satellites with no band overlap; and generalization to satellites with additional bands with respect to the training set. We also develop a self-supervised extension of ChannelViT, ChiViT, to improve its cross-satellite performance. First, we show that even the best foundation models for remote sensing (DOFA, TerraFM) do not outperform general purpose models like DINOv3 in the in-distribution setting. Second, when generalizing to new satellites with no band overlap, all models suffer 2-4x drop in performance, and ChiViT significantly outperforms the runner-up DINOv3. Third, the performance of all tested models drops on average by 5-25\% when given additional bands during test time. Finally, we show that fine-tuning just the last linear layer of these models using oracle labels from all bands can get relatively consistent performance across all satellites, highlighting that the benchmark is far from being saturated. We publicly release the code and the datasets to encourage the development of more future-proof remote sensing models with stronger cross-satellite generalization.
- Abstract(参考訳): リモートセンシング衛星の数と多様性は時間とともに増加し、ラベル付きデータの大部分は古い衛星から来ている。
地球観測の基礎モデルが大きくなるにつれて、新しい衛星をサポートするための(再)訓練コストも増大し、新しい衛星へのモデルの一般化能力がますます重要になる。
本研究では,GeoBenchベンチマークの拡張版であるGeoCrossBenchを紹介する。GeoBenchベンチマークは,配電性能の試験,バンドオーバーラップのない衛星への一般化,トレーニングセットに関する追加帯域を持つ衛星への一般化など,新しい評価プロトコルを備える。
また,ChannelViTの自己教師付き拡張であるChiViTを開発し,そのクロスサテライト性能を改善した。
まず、リモートセンシングのための最良の基礎モデル(DOFA、TerraFM)でさえ、分散環境でのDINOv3のような汎用モデルよりも優れていないことを示す。
第二に、バンドオーバーラップのない新しい衛星に一般化する場合、全てのモデルの性能は2-4倍に低下し、ChiViTはランナーのDINOv3よりも大幅に向上する。
第3に、テスト期間中に追加のバンドが与えられると、すべてのテストモデルのパフォーマンスが平均5~25\%低下する。
最後に、これらのモデルの最後の線形層を全バンドのオラクルラベルを用いて微調整することで、全ての衛星間で比較的一貫した性能が得られることを示し、ベンチマークが飽和するには程遠いことを強調した。
コードとデータセットを公開し、より強力なクロスサテライト一般化を備えた将来的なリモートセンシングモデルの開発を促進する。
関連論文リスト
- TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation [65.74990259650984]
本研究では,グローバルに分散したSentinel-1とSentinel-2画像を利用する,スケーラブルな自己教師型学習モデルTerraFMを紹介する。
我々のトレーニング戦略は、局所的・言語的コントラスト学習を統合し、二重中心化機構を導入する。
TerraFMは分類タスクとセグメンテーションタスクの両方において強力な一般化を実現し、GEO-BenchとCopernicus-Benchの先行モデルよりも優れている。
論文 参考訳(メタデータ) (2025-06-06T17:59:50Z) - OpenEarthSensing: Large-Scale Fine-Grained Benchmark for Open-World Remote Sensing [57.050679160659705]
オープンワールドリモートセンシングのための大規模きめ細かいベンチマークである textbfOpenEarthSensing (OES) を紹介する。
OESには189のシーンとオブジェクトのカテゴリが含まれており、現実世界で起こりうる潜在的なセマンティックシフトの大部分をカバーしている。
論文 参考訳(メタデータ) (2025-02-28T02:49:52Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - DiffusionSat: A Generative Foundation Model for Satellite Imagery [63.2807119794691]
現在、DiffusionSatは、現在利用可能な大規模な高解像度リモートセンシングデータセットのコレクションに基づいてトレーニングされている、最大の生成基盤モデルである。
提案手法は, リアルタイムなサンプルを作成し, 時間生成, マルチスペクトル入力の超解像, インペイントなどの複数の生成課題を解くのに利用できる。
論文 参考訳(メタデータ) (2023-12-06T16:53:17Z) - FedSN: A Federated Learning Framework over Heterogeneous LEO Satellite Networks [18.213174641216884]
多数の低軌道軌道(LEO)衛星が打ち上げられ、SpaceXなどの商業企業によって宇宙に投入された。
LEO衛星が搭載するマルチモーダルセンサにより、通信だけでなく、空間変調認識やリモートセンシング画像分類など、さまざまな機械学習アプリケーションにも機能する。
本稿では,これらの課題に対処するための一般FLフレームワークとしてFedSNを提案し,LEO衛星上でのデータ多様性について検討する。
論文 参考訳(メタデータ) (2023-11-02T14:47:06Z) - Energy-Based Models for Cross-Modal Localization using Convolutional
Transformers [52.27061799824835]
GPSのない衛星画像に対して、距離センサを搭載した地上車両を位置決めする新しい枠組みを提案する。
本稿では, 畳み込み変換器を用いて, 高精度な計量レベルの局所化を行う手法を提案する。
我々は、エンドツーエンドでモデルをトレーニングし、KITTI、Pandaset、カスタムデータセットの最先端技術よりも高い精度でアプローチを実証する。
論文 参考訳(メタデータ) (2023-06-06T21:27:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。