論文の概要: M3LEO: A Multi-Modal, Multi-Label Earth Observation Dataset Integrating Interferometric SAR and Multispectral Data
- arxiv url: http://arxiv.org/abs/2406.04230v2
- Date: Thu, 31 Oct 2024 13:18:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-01 16:58:58.906889
- Title: M3LEO: A Multi-Modal, Multi-Label Earth Observation Dataset Integrating Interferometric SAR and Multispectral Data
- Title(参考訳): M3LEO:干渉SARとマルチスペクトルデータを統合したマルチモード・マルチラベル地球観測データセット
- Authors: Matthew J Allen, Francisco Dorr, Joseph Alejandro Gallego Mejia, Laura Martínez-Ferrer, Anna Jungbluth, Freddie Kalaitzis, Raúl Ramos-Pollán,
- Abstract要約: M3LEOはマルチモーダルでマルチラベルの地球観測データセットである。
6つの地理的領域から約17M 4x4 kmのデータチップにまたがる。
- 参考スコア(独自算出の注目度): 1.4053129774629076
- License:
- Abstract: Satellite-based remote sensing has revolutionised the way we address global challenges. Huge quantities of Earth Observation (EO) data are generated by satellite sensors daily, but processing these large datasets for use in ML pipelines is technically and computationally challenging. While some preprocessed Earth observation datasets exist, their content is often limited to optical or near-optical wavelength data, which is ineffective at night or in adverse weather conditions. Synthetic Aperture Radar (SAR), an active sensing technique based on microwave length radiation, offers a viable alternative. However, the application of machine learning to SAR has been limited due to a lack of ML-ready data and pipelines, particularly for the full diversity of SAR data, including polarimetry, coherence and interferometry. In this work, we introduce M3LEO, a multi-modal, multi-label Earth observation dataset that includes polarimetric, interferometric, and coherence SAR data derived from Sentinel-1, alongside multispectral Sentinel-2 imagery and auxiliary data describing terrain properties such as land use. M3LEO spans approximately 17M 4x4 km data chips from six diverse geographic regions. The dataset is complemented by a flexible PyTorch Lightning framework configured using Hydra to accommodate its use across diverse ML applications in Earth observation. We provide tools to process any dataset available on popular platforms such as Google Earth Engine for seamless integration with our framework. We show that the distribution shift in self-supervised embeddings is substantial across geographic regions, even when controlling for terrain properties. Data: huggingface.co/M3LEO, Code: github.com/spaceml-org/M3LEO.
- Abstract(参考訳): 衛星ベースのリモートセンシングは、地球規模の課題に対処する方法に革命をもたらした。
大量の地球観測データ(EO)は衛星センサーによって毎日生成されますが、これらの大規模なデータセットをMLパイプラインで使用するために処理することは技術的に、計算的に困難です。
事前処理された地球観測データセットは存在するが、その内容は夜間や悪天候下では有効ではない光学的または近光的波長のデータに限られることが多い。
SAR(Synthetic Aperture Radar)はマイクロ波長放射に基づく能動センシング技術である。
しかし、機械学習のSARへの適用は、ML対応のデータとパイプラインの欠如、特に偏光度、コヒーレンス、インターフェロメトリーを含むSARデータの完全な多様性のために制限されている。
本研究では,マルチスペクトル・センチネル2画像と土地利用などの地形特性を示す補助データとともに,センチネル-1から得られた偏光,干渉,コヒーレンスSARデータを含むマルチモーダル・マルチラベル地球観測データセットであるM3LEOを紹介する。
M3LEOは6つの地理的領域から約17M 4x4 kmのデータチップにまたがる。
このデータセットは、Hydraを使用して設定された柔軟なPyTorch Lightningフレームワークによって補完される。
当社のフレームワークとシームレスに統合するために、Google Earth Engineなどの一般的なプラットフォームで利用可能なデータセットを処理するツールを提供しています。
本研究では, 地形特性の制御においても, 自己監督型埋め込みの分布変化が地理的領域で顕著であることを示す。
データ: huggingface.co/M3LEO, Code: github.com/spaceml-org/M3LEO
関連論文リスト
- SemanticSpray++: A Multimodal Dataset for Autonomous Driving in Wet Surface Conditions [10.306226508237348]
SemanticSpray++データセットは、湿った表面条件下でのハイウェイのようなシナリオのカメラ、LiDAR、レーダーデータのためのラベルを提供する。
3つのセンサーのモダリティをラベル付けすることで、データセットは、異なる知覚方法のパフォーマンスを分析するための包括的なテストベッドを提供する。
論文 参考訳(メタデータ) (2024-06-14T11:46:48Z) - MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations [55.022519020409405]
本稿では,マルチモーダルな3Dシーンデータセットと階層型言語アノテーションを用いたベンチマーク,MMScanを構築した。
結果として得られたマルチモーダルな3Dデータセットは、109kオブジェクトと7.7kリージョン上の1.4Mメタアノテーション付きキャプションと、3Dビジュアルグラウンドと質問応答ベンチマークのための3.04M以上の多様なサンプルを含んでいる。
論文 参考訳(メタデータ) (2024-06-13T17:59:30Z) - DIDLM:A Comprehensive Multi-Sensor Dataset with Infrared Cameras, Depth Cameras, LiDAR, and 4D Millimeter-Wave Radar in Challenging Scenarios for 3D Mapping [7.050468075029598]
本研究では,屋内・屋外環境における3次元マッピングのための総合的マルチセンサ・データセットを提案する。
このデータセットは、赤外線カメラ、深度カメラ、LiDAR、および4Dミリ波レーダーからのデータで構成されている。
さまざまなSLAMアルゴリズムを使用してデータセットを処理し、異なるシナリオにおけるアルゴリズムのパフォーマンスの違いを明らかにする。
論文 参考訳(メタデータ) (2024-04-15T09:49:33Z) - GDTM: An Indoor Geospatial Tracking Dataset with Distributed Multimodal
Sensors [9.8714071146137]
GDTMは、分散マルチモーダルセンサと再構成可能なセンサノード配置を備えた、マルチモーダルオブジェクトトラッキングのための9時間のデータセットである。
我々のデータセットは、マルチモーダルデータ処理のためのアーキテクチャの最適化など、いくつかの研究課題の探索を可能にする。
論文 参考訳(メタデータ) (2024-02-21T21:24:57Z) - Creating and Leveraging a Synthetic Dataset of Cloud Optical Thickness Measures for Cloud Detection in MSI [3.4764766275808583]
雲の形成は、しばしば地球の地表を観測する光学衛星による不明瞭な観測である。
雲の光学的厚さ推定のための新しい合成データセットを提案する。
信頼性と汎用性を備えたクラウドマスクを実データで取得するために活用する。
論文 参考訳(メタデータ) (2023-11-23T14:28:28Z) - Multimodal Dataset for Localization, Mapping and Crop Monitoring in
Citrus Tree Farms [7.666806082770633]
このデータセットは、深度情報を備えたステレオRGB画像と、モノクロ、近赤外線、熱画像を提供する。
データセットは、キツネの3つの畑で収集された7つの配列から構成される。
総運転時間は1.7時間、走行距離は7.5km、データ量は1.3TBである。
論文 参考訳(メタデータ) (2023-09-27T00:30:08Z) - Diffusion Models for Interferometric Satellite Aperture Radar [73.01013149014865]
確率拡散モデル (Probabilistic Diffusion Models, PDMs) は、最近、非常に有望な生成モデルのクラスとして登場した。
ここでは、PDMを活用して、レーダーベースの衛星画像データセットを複数生成する。
PDMは複雑で現実的な構造を持つ画像を生成することに成功したが、サンプリング時間は依然として問題である。
論文 参考訳(メタデータ) (2023-08-31T16:26:17Z) - UnLoc: A Universal Localization Method for Autonomous Vehicles using
LiDAR, Radar and/or Camera Input [51.150605800173366]
UnLocは、全ての気象条件におけるマルチセンサー入力によるローカライズのための、新しい統一型ニューラルネットワークアプローチである。
本手法は,Oxford Radar RobotCar,Apollo SouthBay,Perth-WAの各データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-07-03T04:10:55Z) - Multimodal Dataset from Harsh Sub-Terranean Environment with Aerosol
Particles for Frontier Exploration [55.41644538483948]
本稿では, エアロゾル粒子を用いた過酷で非構造的な地下環境からのマルチモーダルデータセットを提案する。
ロボットオペレーティング・システム(ROS)フォーマットのすべてのオンボードセンサーから、同期された生データ計測を含んでいる。
本研究の焦点は、時間的・空間的なデータの多様性を捉えることだけでなく、取得したデータに厳しい条件が及ぼす影響を示すことである。
論文 参考訳(メタデータ) (2023-04-27T20:21:18Z) - Satellite Image Time Series Analysis for Big Earth Observation Data [50.591267188664666]
本稿では,機械学習を用いた衛星画像時系列解析のためのオープンソースRパッケージである sit について述べる。
本手法は, Cerrado Biome のケーススタディにより, 土地利用と土地被覆マップの精度が高いことを示す。
論文 参考訳(メタデータ) (2022-04-24T15:23:25Z) - Omnidata: A Scalable Pipeline for Making Multi-Task Mid-Level Vision
Datasets from 3D Scans [103.92680099373567]
本稿では,実世界の包括的3Dスキャンからマルチタスク視覚データセットをパラメトリックサンプリングし,レンダリングするパイプラインを提案する。
サンプリングパラメータを変更することで、生成されたデータセットを“ステア”して、特定の情報を強調することが可能になる。
生成されたスタータデータセットでトレーニングされた共通アーキテクチャは、複数の共通ビジョンタスクとベンチマークで最先端のパフォーマンスに達した。
論文 参考訳(メタデータ) (2021-10-11T04:21:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。