論文の概要: LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture
- arxiv url: http://arxiv.org/abs/2603.07246v1
- Date: Sat, 07 Mar 2026 14:56:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.118774
- Title: LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture
- Title(参考訳): LEPA:予測アーキテクチャによる衛星リモートセンシングデータの幾何学的等式学習
- Authors: Erik Scheurer, Rocco Sedona, Stefan Kesselheim, Gabriele Cavallaro,
- Abstract要約: 本稿では,大規模な衛星リモートセンシングデータに対する埋め込み予測のための新しいアーキテクチャを提案する。
平均化の代わりに、EPAはNASA/USGSランドサット・センチネル(HLS)画像とLNetイメージ0.8kを直接予測するために埋め込みに潜伏している。
- 参考スコア(独自算出の注目度): 2.618539394367099
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geospatial foundation models provide precomputed embeddings that serve as compact feature vectors for large-scale satellite remote sensing data. While these embeddings can reduce data-transfer bottlenecks and computational costs, Earth observation (EO) applications can still face geometric mismatches between user-defined areas of interest and the fixed precomputed embedding grid. Standard latent-space interpolation is unreliable in this setting because the embedding manifold is highly non-convex, yielding representations that do not correspond to realistic inputs. We verify this using Prithvi-EO-2.0 to understand the shortcomings of interpolation applied to patch embeddings. As a substitute, we propose a Learned Equivariance-Predicting Architecture (LEPA). Instead of averaging vectors, LEPA conditions a predictor on geometric augmentations to directly predict the transformed embedding. We evaluate LEPA on NASA/USGS Harmonized Landsat-Sentinel (HLS) imagery and ImageNet-1k. Experiments show that standard interpolation achieves a mean reciprocal rank (MRR) below 0.2, whereas LEPA increases MRR to over 0.8, enabling accurate geometric adjustment without re-encoding.
- Abstract(参考訳): 地理空間基盤モデルは、大規模な衛星リモートセンシングデータのためのコンパクトな特徴ベクトルとして機能する計算済みの埋め込みを提供する。
これらの埋め込みはデータ転送のボトルネックと計算コストを削減できるが、地球観測(EO)アプリケーションは、ユーザ定義の関心領域と固定された事前計算された埋め込みグリッドとの間の幾何学的ミスマッチに直面することがある。
標準潜在空間補間はこの設定では信頼できない、なぜなら埋め込み多様体は極めて非凸であり、現実的な入力に対応しない表現をもたらすからである。
Prithvi-EO-2.0を用いて、パッチ埋め込みに適用される補間の欠点を理解する。
代用として,Learned Equivariance-Predicting Architecture (LEPA)を提案する。
ベクトルを平均化する代わりに、EPAは変換された埋め込みを直接予測するために幾何学的拡張の予測器を条件にしている。
我々は,NASA/USGSハーモナイズドランドサット・センチネル(HLS)画像とImageNet-1kでEPAを評価した。
実験により、標準補間法は平均相反ランク(MRR)を0.2以下に達成し、一方 LEPA は MRR を0.8 以上増加させ、再エンコードなしで正確な幾何調整を可能にする。
関連論文リスト
- Semantic Tube Prediction: Beating LLM Data Efficiency with JEPA [50.494504099850325]
我々は、トークン列が滑らかな意味多様体上の測地線を辿り、従って局所線型であることを示す測地論仮説を導入する。
本稿では,この制約により信号対雑音比が向上し,軌道中の衝突を防止することにより多様性が保たれることを示す。
幾何学的先行性は、ブルートフォーススケーリングを超越できることを実証する。
論文 参考訳(メタデータ) (2026-02-26T04:45:07Z) - Inferring Height from Earth Embeddings: First insights using Google AlphaEarth [0.0]
本研究では,地空間とマルチモーダルの特徴をテキストにエンコードすることで,深層学習(DL)回帰モデルを地域表面高マッピングに効果的に導くことができるかを検討する。
空間分解能10mのAlphaEarth Embeddingsに着目し,高画質のDSM(Digital Surface Model)を基準とした高さ推定能力の評価を行った。
両方のアーキテクチャは(どちらも$R2 = 0.97$で)強力なトレーニング性能を達成し、埋め込みが情報および復調可能な高さ関連の信号を符号化していることを確認した。
論文 参考訳(メタデータ) (2026-02-19T10:52:50Z) - RSAR: Restricted State Angle Resolver and Rotated SAR Benchmark [61.987291551925516]
単位円制限損失を組み込んで角度予測精度を向上させるユニットサイクルリゾルバを導入する。
提案手法は,既存の最先端教師あり手法の性能を効果的に向上させることができる。
UCRの助けを借りて、これまでで最大の多クラス回転SARオブジェクト検出データセットであるRSARをさらに注釈し、導入する。
論文 参考訳(メタデータ) (2025-01-08T11:41:47Z) - GeOT: A spatially explicit framework for evaluating spatio-temporal predictions [2.2766940909460986]
空間的評価基準と損失関数として最適輸送(OT)を提唱した。
提案手法は,予測誤差に関連する輸送コストを定量化し,予測モデルの性能を評価する。
自転車シェアリング、充電ステーション、交通データセットによる実験では、空間コストは非空間誤差メトリクスの限界変化によって大幅に削減されている。
論文 参考訳(メタデータ) (2024-10-15T15:46:03Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - Relation DETR: Exploring Explicit Position Relation Prior for Object Detection [26.03892270020559]
本稿では,DETR(Detection TRansformer)の収束性と性能を向上させる手法を提案する。
我々の手法であるRelation-DETRは、プログレッシブ・アテンション・リファインメントのための位置関係埋め込みを構築するエンコーダを導入している。
汎用データセットとタスク固有のデータセットの両方の実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2024-07-16T13:17:07Z) - DAC: Detector-Agnostic Spatial Covariances for Deep Local Features [11.494662473750505]
現在の深部視覚特徴検出器は検出された特徴の空間的不確かさをモデル化していない。
本稿では,事前訓練したディープ特徴検出器に接続可能な2つのポストホック共分散推定法を提案する。
論文 参考訳(メタデータ) (2023-05-20T17:43:09Z) - Learning Signed Hyper Surfaces for Oriented Point Cloud Normal Estimation [53.19926259132379]
我々は,符号付きハイパー曲面の学習による点雲の向きの正規分布推定のためのSHS-Netと呼ばれる新しい手法を提案する。
符号付き超曲面は、局所的および大域的な情報を集約する高次元特徴空間において暗黙的に学習される。
注意重み付き正規予測モジュールをデコーダとして提案し,局所およびグローバル潜時符号を入力として向きの正規を推定する。
論文 参考訳(メタデータ) (2023-05-10T03:40:25Z) - Enhanced Laser-Scan Matching with Online Error Estimation for Highway
and Tunnel Driving [0.0]
Lidarデータは、自動運転車やモバイルロボットプラットフォームのナビゲーションのためのポイントクラウドを生成するために使用できる。
本稿では,2つの新しい改良点を提供するスキャンマッチングアルゴリズムであるIterative Closest Ellipsoidal Transform (ICET)を提案する。
論文 参考訳(メタデータ) (2022-07-29T13:42:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。