論文の概要: GeoRoPE: Ground-Aware Rotary Adaptation for Remote Sensing Foundation Models
- arxiv url: http://arxiv.org/abs/2606.14760v1
- Date: Mon, 08 Jun 2026 12:15:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:32.053112
- Title: GeoRoPE: Ground-Aware Rotary Adaptation for Remote Sensing Foundation Models
- Title(参考訳): GeoRoPE:リモートセンシング基礎モデルのための地上対応ロータリー適応
- Authors: Yu Luo, Kun Hu, Mengwei He, Xiaogang Zhu, Shan Zeng, Allen Benter, Wei Xiang, Patrick Filippi, Thomas Francis Bishop, Zhiyong Wang,
- Abstract要約: リモートセンシング基礎モデル(RSFM)は、複数のセンサからの画像の事前学習と地中サンプリング(GSD)の恩恵を受ける
固定されたトークングリッドオフセットは、センサー間の異なる接地距離に対応でき、グリッドベースの位置先入先を物理的に矛盾させる。
地上認識, RoPE互換, パラメータ効率を考慮したRSFM空間適応手法であるGeoRoPEを提案する。
- 参考スコア(独自算出の注目度): 34.24842271651431
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Remote-sensing foundation models (RSFMs) benefit from pretraining on imagery from multiple sensors and ground sampling distances (GSDs), but such exposure alone does not resolve scale mismatch during downstream adaptation. A fixed token-grid offset can correspond to different ground distances across sensors, making grid-based positional priors physically inconsistent. Meanwhile, heterogeneous spatial granularity means that compact urban regions and homogeneous landscapes may require different positional sensitivities even under the same GSD. Therefore, we propose {GeoRoPE}, a ground-aware, RoPE-compatible, and parameter-efficient spatial adaptation method for RSFMs. GeoRoPE recalibrates token-level positional interactions from two complementary aspects. First, \textit{Geo-Coordinate Calibration (GCC)} rescales raw token-grid offsets according to the ground distance represented by one token-grid step, producing geo-calibrated relative coordinates across GSDs. Second, \textit{Geo-Frequency Calibration (GFC)} adjusts the native RoPE frequency with a relation-specific factor, enabling position sensitive adaptation to scene-dependent spatial granularity. GeoRoPE is injected into pretrained RSFMs through a lightweight adapter, preserving the frozen spatial prior while adding geo-aware positional corrections. Experiments across multiple RSFMs, sensors, resolutions, and downstream tasks demonstrate that GeoRoPE improves cross-resolution robustness and scale-sensitive representation learning.
- Abstract(参考訳): リモートセンシング基礎モデル(RSFM)は、複数のセンサと地中サンプリング距離(GSD)の画像の事前トレーニングの恩恵を受けるが、そのような露出だけで下流適応時のスケールミスマッチを解決しない。
固定されたトークングリッドオフセットは、センサー間の異なる接地距離に対応でき、グリッドベースの位置前も物理的に矛盾する。
一方、異質な空間的粒度は、コンパクトな都市部と均質な景観が、同じGSDの下でも異なる位置感性を必要とすることを意味する。
そこで本研究では,地上認識,RoPE互換,パラメータ効率の空間適応手法であるGeoRoPEを提案する。
GeoRoPEはトークンレベルの位置的相互作用を2つの相補的な側面から再検討する。
第一に、 \textit{Geo-Coordinate Calibration (GCC) は、1つのトークングリッドステップで表される接地距離に応じて生のトークングリッドオフセットを再スケールし、GSDをまたいだ地理校正された相対座標を生成する。
第2に、GFC (textit{Geo-Frequency Calibration) は、ネイティブなRoPE周波数を関係要因で調整し、シーン依存の空間的粒度への位置依存的な適応を可能にする。
GeoRoPEは、軽量アダプタを介して事前訓練されたRSFMに注入され、地理的に認識された位置補正を加えながら、凍結した空間を保存する。
複数のRSFM、センサー、解像度、下流タスクにわたる実験は、GeoRoPEがクロスレゾリューションロバストネスとスケールセンシティブな表現学習を改善することを実証している。
関連論文リスト
- CIPER: A Unified Framework for Cross-view Image-retrieval and Pose-estimation [14.612259909790454]
クロスビュージオローカライゼーションは、地上画像の位置を航空画像データベースとマッチングすることによって推定する。
既存の手法では、大規模な検索と正確なポーズ推定のいずれかによってこれに取り組むが、両方ではない。
両タスクを共同で実行する単一アーキテクチャであるCIPER(Cross-view Image-Retrieval and Pose-estimation TransformER)を提案する。
論文 参考訳(メタデータ) (2026-06-03T15:31:06Z) - FLORO: A Multimodal Geospatial Foundation Model for Ecological Remote Sensing Across Sensors and Scales [65.4821703903285]
FLOROは、小さなが高度に多様なリモートセンシングコーパスから転送可能な表現を学習するために設計されたマルチモーダル基礎モデルである。
FLOROは、Sentinel-1、Sentinel-2、SkySAT画像、標高、UAV由来のデータとの不均一な組み合わせによるマスク付きオートエンコーディングを用いて事前訓練される。
我々は、シーン分類、セグメンテーション、回帰タスクにまたがる凍結エンコーダプロトコルを用いて、PANGAEAベンチマーク上でFLOROを評価した。
論文 参考訳(メタデータ) (2026-05-27T08:55:54Z) - URoPE: Universal Relative Position Embedding across Geometric Spaces [55.651792747815854]
URoPEは回転位置埋め込み(Rotary Position Embedding, RoPE)の普遍的な拡張である。
キー/値の画像パッチごとに、URoPEは事前に定義された奥行きアンカーで対応するカメラ線に沿って3Dポイントをサンプリングする。
標準2D RoPEは、投影されたピクセル座標を用いて適用することができる。
論文 参考訳(メタデータ) (2026-04-20T18:52:03Z) - Unifying UAV Cross-View Geo-Localization via 3D Geometric Perception [51.687842983240564]
無人航空機(UAV)のクロスビューな地上局地化は、斜めのUAV画像と衛星地図との厳密な幾何学的相違により、いまだに困難である。
本稿では,3次元シーン形状を明示的にモデル化し,粗い位置認識ときめ細かなポーズ推定を統一する,幾何認識型UAV測位フレームワークを提案する。
提案手法は, 最先端のベースラインを著しく上回り, ロバストメータレベルのローカライゼーション精度を実現し, 複雑な都市環境における一般化を向上する。
論文 参考訳(メタデータ) (2026-04-02T08:08:41Z) - LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture [2.618539394367099]
本稿では,大規模な衛星リモートセンシングデータに対する埋め込み予測のための新しいアーキテクチャを提案する。
平均化の代わりに、EPAはNASA/USGSランドサット・センチネル(HLS)画像とLNetイメージ0.8kを直接予測するために埋め込みに潜伏している。
論文 参考訳(メタデータ) (2026-03-07T14:56:15Z) - Geo2Vec: Shape- and Distance-Aware Neural Representation of Geospatial Entities [13.206124101350847]
署名された距離場(SDF)にインスパイアされた新しい手法であるGeo2Vecを導入し、元の空間で直接動作する。
SDFを近似するように訓練されたニューラルネットワークは、すべてのジオエンタリティタイプに対してコンパクトで幾何学的、統一された表現を生成する。
実験結果から,Geo2Vecは形状と位置を表す既存の手法より一貫して優れており,トポロジカルおよび距離の関係を捉え,実世界のGeoAIアプリケーションにおいて高い効率を実現していることがわかった。
論文 参考訳(メタデータ) (2025-08-26T07:12:28Z) - Performance and Generalizability Impacts of Incorporating Location Encoders into Deep Learning for Dynamic PM2.5 Estimation [0.39762912548964846]
動的・空間的不均一な応用のための深層学習における位置情報の効果について検討する。
日表面PM2.5を衛星観測と地上観測により推定した。
以上の結果から,空間一般化の支援により,原座標は領域内の性能を向上させることができるが,領域間の一般化性は低下することが示された。
論文 参考訳(メタデータ) (2025-05-24T02:00:34Z) - SegDesicNet: Lightweight Semantic Segmentation in Remote Sensing with Geo-Coordinate Embeddings for Domain Adaptation [0.5461938536945723]
リモートセマンティックセマンティックセグメンテーションのための新しい教師なしドメイン適応手法を提案する。
提案するSegDesicNetモジュールは、単位球上に投影された座標のGRID位置符号化を遅らせ、ドメイン損失を得る。
我々のアルゴリズムは,人工ニューラルネットワークと物理世界の人間の理解とのモデリング格差を減らそうとしている。
論文 参考訳(メタデータ) (2025-03-11T11:01:18Z) - Information Entropy Initialized Concrete Autoencoder for Optimal Sensor
Placement and Reconstruction of Geophysical Fields [58.720142291102135]
そこで本稿では,スパーク計測による地場再構成のためのセンサ配置の最適化について提案する。
本研究では, (a) 温度と (b) バレンツ海周辺の塩分濃度場とスバルバルド諸島群を例に示す。
得られた最適センサ位置は, 物理的解釈が明確であり, 海流の境界に対応することが判明した。
論文 参考訳(メタデータ) (2022-06-28T12:43:38Z) - Collaborative Training between Region Proposal Localization and
Classification for Domain Adaptive Object Detection [121.28769542994664]
オブジェクト検出のためのドメイン適応は、ラベル付きデータセットからラベル付きデータセットへの検出を適応させようとする。
本稿では,地域提案ネットワーク (RPN) と地域提案分類器 (RPC) が,大きなドメインギャップに直面した場合の転送可能性が大きく異なることを初めて明らかにする。
論文 参考訳(メタデータ) (2020-09-17T07:39:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。