論文の概要: Democratizing planetary-scale analysis: An ultra-lightweight Earth embedding database for accurate and flexible global land monitoring
- arxiv url: http://arxiv.org/abs/2601.11183v1
- Date: Fri, 16 Jan 2026 10:59:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-19 20:21:50.46079
- Title: Democratizing planetary-scale analysis: An ultra-lightweight Earth embedding database for accurate and flexible global land monitoring
- Title(参考訳): 惑星スケールの民主化分析: 高精度でフレキシブルな地球観測のための超軽量地球埋め込みデータベース
- Authors: Shuang Chen, Jie Wang, Shuai Yuan, Jiayang Li, Yu Xia, Yuanhong Liao, Junbo Wei, Jincheng Yuan, Xiaoqing Xu, Xiaolin Zhu, Peng Zhu, Hongsheng Zhang, Yuyu Zhou, Haohuan Fu, Huabing Huang, Bin Chen, Fan Dai, Peng Gong,
- Abstract要約: ESDは、2000年から2024年までの25年間にわたる、超軽量で30mの地球埋め込みデータベースである。
データセットは、生のアーカイブと比較してデータボリュームが340倍に減少する。
頑丈な数発の学習能力と長手一貫性により、ESDは惑星スケールの研究を民主化するための汎用的な基盤を提供する。
- 参考スコア(独自算出の注目度): 19.019853798955513
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid evolution of satellite-borne Earth Observation (EO) systems has revolutionized terrestrial monitoring, yielding petabyte-scale archives. However, the immense computational and storage requirements for global-scale analysis often preclude widespread use, hindering planetary-scale studies. To address these barriers, we present Embedded Seamless Data (ESD), an ultra-lightweight, 30-m global Earth embedding database spanning the 25-year period from 2000 to 2024. By transforming high-dimensional, multi-sensor observations from the Landsat series (5, 7, 8, and 9) and MODIS Terra into information-dense, quantized latent vectors, ESD distills essential geophysical and semantic features into a unified latent space. Utilizing the ESDNet architecture and Finite Scalar Quantization (FSQ), the dataset achieves a transformative ~340-fold reduction in data volume compared to raw archives. This compression allows the entire global land surface for a single year to be encapsulated within approximately 2.4 TB, enabling decadal-scale global analysis on standard local workstations. Rigorous validation demonstrates high reconstructive fidelity (MAE: 0.0130; RMSE: 0.0179; CC: 0.8543). By condensing the annual phenological cycle into 12 temporal steps, the embeddings provide inherent denoising and a semantically organized space that outperforms raw reflectance in land-cover classification, achieving 79.74% accuracy (vs. 76.92% for raw fusion). With robust few-shot learning capabilities and longitudinal consistency, ESD provides a versatile foundation for democratizing planetary-scale research and advancing next-generation geospatial artificial intelligence.
- Abstract(参考訳): 衛星搭載地球観測(EO)システムの急速な進化は、地球観測に革命をもたらし、ペタバイト規模のアーカイブを生み出した。
しかし、地球規模の分析のための膨大な計算と記憶の要求は、惑星規模の研究を妨げるため、しばしば広く使われることを妨げている。
これらの障壁に対処するため,2000年から2024年までの25年間にわたって,超軽量で30mの地球埋め込みデータベースである Embedded Seamless Data (ESD) を紹介した。
ランドサット級数 (5, 7, 8, 9) と MODIS Terra から高次元のマルチセンサー観測を情報密度、量子化潜在ベクトルに変換することにより、ESD は重要な地学的特徴と意味的特徴を統一潜在空間に蒸留する。
ESDNetアーキテクチャとFinite Scalar Quantization (FSQ)を利用することで、データセットは生のアーカイブと比較してデータボリュームが約340倍に削減される。
この圧縮により、地球全体の陸地表面は1年で約2.4 TB以内にカプセル化され、標準的なローカルワークステーションのデカダルスケールのグローバル分析が可能になる。
厳密な検証は、高い再構成率(MAE:0.0130; RMSE: 0.0179; CC: 0.8543)を示す。
毎年恒例の現象周期を12段階に縮めることで、埋め込みは固有の認知と、土地被覆分類における生の反射率を上回り、79.74%の精度(生の融合では76.92%)を達成できる意味的に整理された空間を提供する。
頑丈な数発の学習能力と長手一貫性により、ESDは惑星規模の研究を民主化し、次世代の地理空間人工知能を進化させるための汎用的な基盤を提供する。
関連論文リスト
- Advancing Ocean State Estimation with efficient and scalable AI [22.24444646069193]
マルチソースおよびマルチスケールデータを同化するAI駆動型海洋データ同化フレームワーク(ADAF-Ocean)を提案する。
ADAF-Oceanは、異種入力から海洋状態への連続的なマッピングを学び、ネイティブデータの忠実さを保存する。
論文 参考訳(メタデータ) (2025-11-08T15:24:23Z) - ReconMOST: Multi-Layer Sea Temperature Reconstruction with Observations-Guided Diffusion [48.540756751934836]
ReconMOSTは多層水温再構築のためのデータ駆動誘導拡散モデルフレームワークである。
提案手法はMLベースのSST再構成をグローバルな多層設定に拡張し,92.5%以上の欠落データを処理する。
論文 参考訳(メタデータ) (2025-06-12T06:27:22Z) - TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation [65.74990259650984]
本研究では,グローバルに分散したSentinel-1とSentinel-2画像を利用する,スケーラブルな自己教師型学習モデルTerraFMを紹介する。
我々のトレーニング戦略は、局所的・言語的コントラスト学習を統合し、二重中心化機構を導入する。
TerraFMは分類タスクとセグメンテーションタスクの両方において強力な一般化を実現し、GEO-BenchとCopernicus-Benchの先行モデルよりも優れている。
論文 参考訳(メタデータ) (2025-06-06T17:59:50Z) - High Performance Space Debris Tracking in Complex Skylight Backgrounds with a Large-Scale Dataset [48.32788509877459]
高精度なデブリ追跡を実現するために,深層学習に基づく空間デブリ追跡ネットワーク(SDT-Net)を提案する。
SDT-Netはデブリの特徴を効果的に表現し、エンドツーエンドのモデル学習の効率性と安定性を高める。
データセットとコードはまもなくリリースされます。
論文 参考訳(メタデータ) (2025-06-03T08:30:25Z) - From Proxies to Fields: Spatiotemporal Reconstruction of Global Radiation from Sparse Sensor Sequences [0.38836072943850625]
TRONは22年間のシミュレーションデータに基づいて訓練され、65,341箇所で一般化されている。
TRONは、大気モデル、地球物理学的ハザードモニタリング、リアルタイム環境リスク予測など、スパースデータから科学分野を再構築するためのドメインに依存しないフレームワークを提供する。
論文 参考訳(メタデータ) (2025-05-24T16:24:10Z) - GAIA: A Foundation Model for Operational Atmospheric Dynamics [0.83442357861662]
我々は,MAE(Masked Autoencoders)とラベルのない自己蒸留(DINO)を融合したハイブリッド自己教師型モデルGAIAを紹介する。
GAIAは、自明な日中パターンではなく、大気力学を捉える非絡み合った表現を学ぶ。
下流タスクに移行すると、GAIAは一貫してMAEのみのベースラインを上回っます。
論文 参考訳(メタデータ) (2025-05-15T05:07:09Z) - Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。
EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。
本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文 参考訳(メタデータ) (2025-04-09T15:13:26Z) - OpenEarthMap-SAR: A Benchmark Synthetic Aperture Radar Dataset for Global High-Resolution Land Cover Mapping [16.387666608029882]
我々は,地球規模の高解像度土地被覆マッピングのためのベンチマークSARデータセットOpenEarthMap-SARを紹介する。
OpenEarthMap-SARは、5033の航空画像と衛星画像の150万部で構成され、サイズは1024$times$1024ピクセルで、日本、フランス、アメリカから35の地域をカバーしている。
セマンティックセグメンテーションのための最先端手法の性能評価と,さらなる技術開発に適した課題設定を提案する。
論文 参考訳(メタデータ) (2025-01-18T22:30:27Z) - SpectralEarth: Training Hyperspectral Foundation Models at Scale [47.93167977587301]
ハイパースペクトル基礎モデルの事前学習を目的とした大規模マルチテンポラルデータセットであるSpectralEarthを紹介する。
我々はSpectralEarthの一連の基礎モデルを事前訓練し、古典的な視覚バックボーンにスペクトルアダプタを統合する。
タンデムでは、土地被覆、作物型マッピング、樹木種分類のための9つの下流データセットを構築した。
論文 参考訳(メタデータ) (2024-08-15T22:55:59Z) - Jalisco's multiclass land cover analysis and classification using a
novel lightweight convnet with real-world multispectral and relief data [51.715517570634994]
本稿では、LC分類と解析を行うために、新しい軽量(89kパラメータのみ)畳み込みニューラルネットワーク(ConvNet)を提案する。
本研究では,実世界のオープンデータソースを3つ組み合わせて13のチャネルを得る。
組込み分析は、いくつかのクラスにおいて限られたパフォーマンスを期待し、最も類似したクラスをグループ化する機会を与えてくれます。
論文 参考訳(メタデータ) (2022-01-26T14:58:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。