論文の概要: MCTED: A Machine-Learning-Ready Dataset for Digital Elevation Model Generation From Mars Imagery
- arxiv url: http://arxiv.org/abs/2509.08027v1
- Date: Tue, 09 Sep 2025 13:14:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 17:24:19.822389
- Title: MCTED: A Machine-Learning-Ready Dataset for Digital Elevation Model Generation From Mars Imagery
- Title(参考訳): MCTED:火星画像からのデジタル標高モデル生成のための機械学習対応データセット
- Authors: Rafał Osadnik, Pablo Gómez, Eleni Bohacek, Rickbir Bahia,
- Abstract要約: この研究は、火星のデジタル標高モデル予測タスクのための新しいデータセットを提示し、MCTEDと呼ばれる機械学習アプリケーションに備える。
データセットは、高解像度の火星オルソニメージとDEMペアを処理するように設計された包括的パイプラインを使用して、Day et alから生成された。
火星探査機マーズ・リコネッサンス・オービター(Mars Reconnaissance Orbiter)がCTX装置を用いて収集したデータで、火星の表面を包括的にカバーしている。
- 参考スコア(独自算出の注目度): 1.7499351967216341
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work presents a new dataset for the Martian digital elevation model prediction task, ready for machine learning applications called MCTED. The dataset has been generated using a comprehensive pipeline designed to process high-resolution Mars orthoimage and DEM pairs from Day et al., yielding a dataset consisting of 80,898 data samples. The source images are data gathered by the Mars Reconnaissance Orbiter using the CTX instrument, providing a very diverse and comprehensive coverage of the Martian surface. Given the complexity of the processing pipelines used in large-scale DEMs, there are often artefacts and missing data points in the original data, for which we developed tools to solve or mitigate their impact. We divide the processed samples into training and validation splits, ensuring samples in both splits cover no mutual areas to avoid data leakage. Every sample in the dataset is represented by the optical image patch, DEM patch, and two mask patches, indicating values that were originally missing or were altered by us. This allows future users of the dataset to handle altered elevation regions as they please. We provide statistical insights of the generated dataset, including the spatial distribution of samples, the distributions of elevation values, slopes and more. Finally, we train a small U-Net architecture on the MCTED dataset and compare its performance to a monocular depth estimation foundation model, DepthAnythingV2, on the task of elevation prediction. We find that even a very small architecture trained on this dataset specifically, beats a zero-shot performance of a depth estimation foundation model like DepthAnythingV2. We make the dataset and code used for its generation completely open source in public repositories.
- Abstract(参考訳): この研究は、火星のデジタル標高モデル予測タスクのための新しいデータセットを提示し、MCTEDと呼ばれる機械学習アプリケーションに備える。
データセットは、高解像度の火星オルソニメージとDEMペアをデイなどから処理するために設計された包括的なパイプラインを使用して生成され、80,898のデータサンプルからなるデータセットが生成される。
火星探査機マーズ・リコネッサンス・オービター(Mars Reconnaissance Orbiter)がCTX装置を用いて収集したデータで、火星の表面を包括的にカバーしている。
大規模なDEMで使用される処理パイプラインの複雑さを考えると、元のデータにはアーティファクトや欠落したデータポイントが存在します。
処理されたサンプルをトレーニングと検証の分割に分割し、データの漏洩を避けるために、両方の分割されたサンプルが相互の領域をカバーしないことを保証します。
データセットのすべてのサンプルは、光学画像パッチ、DEMパッチ、および2つのマスクパッチによって表現されます。
これにより、将来的なデータセットのユーザは、好きなように変更された標高領域を処理できるようになる。
本研究では, サンプルの空間分布, 標高値の分布, 斜面など, 生成されたデータセットの統計的知見を提供する。
最後に、MCTEDデータセット上に小さなU-Netアーキテクチャをトレーニングし、その性能を標高予測のタスクにおいて単眼深度推定基盤モデルDepthAnythingV2と比較する。
このデータセットで特別にトレーニングされた非常に小さなアーキテクチャでさえ、DepthAnythingV2のような深さ推定基盤モデルのゼロショットのパフォーマンスを上回ります。
私たちは、その生成に使用されるデータセットとコードを、パブリックリポジトリで完全にオープンソースにしています。
関連論文リスト
- TerraMesh: A Planetary Mosaic of Multimodal Earth Observation Data [3.674991996196602]
TerraMeshは、光、レーダー、高度、開口、ランドレディのモダリティをData-Readyフォーマットで組み合わせた、グローバルに多様なマルチモーダルデータセットである。
本研究では,TerraMeshで事前学習した際のモデル性能の向上を示す詳細なデータ処理手順,包括的統計,実証的証拠を提供する。
論文 参考訳(メタデータ) (2025-04-15T13:20:35Z) - The Change You Want To Detect: Semantic Change Detection In Earth Observation With Hybrid Data Generation [0.8875650122536799]
超高分解能(VHR)画像に基づく大規模なバイ時間変化検出は、地球観測に不可欠である。
ほとんどのアプローチでは、時間的および空間的適応に必要な汎用性は示さない。
我々は,大規模なハイブリッドな意味変化検出データセットを作成するための生成パイプラインHySCDGを提案する。
論文 参考訳(メタデータ) (2025-03-19T20:32:37Z) - EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision [72.84868704100595]
本稿では,地球モニタリングタスクにおける深層学習アプリケーションを強化することを目的とした,リモートセンシングデータの自己監督を目的としたデータセットを提案する。
このデータセットは15テラピクセルのグローバルリモートセンシングデータにまたがっており、NEON、Sentinel、Satellogicによる1mの空間解像度データの新たなリリースなど、さまざまなソースの画像を組み合わせている。
このデータセットは、リモートセンシングデータの異なる課題に取り組むために開発されたMasked Autoencoderである。
論文 参考訳(メタデータ) (2025-01-14T13:42:22Z) - MASSTAR: A Multi-Modal and Large-Scale Scene Dataset with a Versatile Toolchain for Surface Prediction and Completion [25.44529512862336]
MASSTARはマルチモーダルなlArgeスケールのシーンデータセットであり、サーフAce predictionと完了のためのVerSatile Toolchainを備えている。
環境から生の3Dデータを処理するための汎用的で効率的なツールチェーンを開発した。
実世界の部分的なデータを含む1000以上のシーンレベルのモデルからなるサンプルデータセットを生成する。
論文 参考訳(メタデータ) (2024-03-18T11:35:18Z) - MV-JAR: Masked Voxel Jigsaw and Reconstruction for LiDAR-Based
Self-Supervised Pre-Training [58.07391711548269]
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
論文 参考訳(メタデータ) (2023-03-23T17:59:02Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Omnidata: A Scalable Pipeline for Making Multi-Task Mid-Level Vision
Datasets from 3D Scans [103.92680099373567]
本稿では,実世界の包括的3Dスキャンからマルチタスク視覚データセットをパラメトリックサンプリングし,レンダリングするパイプラインを提案する。
サンプリングパラメータを変更することで、生成されたデータセットを“ステア”して、特定の情報を強調することが可能になる。
生成されたスタータデータセットでトレーニングされた共通アーキテクチャは、複数の共通ビジョンタスクとベンチマークで最先端のパフォーマンスに達した。
論文 参考訳(メタデータ) (2021-10-11T04:21:46Z) - Sketch and Scale: Geo-distributed tSNE and UMAP [75.44887265789056]
地理的に分散したデータセット上で機械学習分析を実行することは、急速に発生する問題である。
私たちはSketch and Scale(SnS)という新しいフレームワークを紹介します。
これはCount Sketchデータ構造を利用して、エッジノード上のデータを圧縮し、マスターノード上の縮小サイズスケッチを集約し、サマリ上でバニラtSNEまたはUMAPを実行する。
我々は、この技術が完全に並列で、線形に時間にスケールし、メモリに対数的に分散し、通信し、世界中の複数のデータセンターにまたがる数百万、数十億のデータポイントでデータセットを解析できることを示す。
論文 参考訳(メタデータ) (2020-11-11T22:32:21Z) - Exploring the Impacts from Datasets to Monocular Depth Estimation (MDE)
Models with MineNavi [5.689127984415125]
ディープラーニングに基づく現在のコンピュータビジョンタスクは、モデルトレーニングやテストのためのアノテーションを備えた大量のデータを必要とする。
実際には、高密度推定タスクのための手動ラベリングは非常に困難または不可能であり、データセットのシーンは小さな範囲に制限されることが多い。
本稿では,手作業の負担を伴わない拡張可能なデータセットを得るための合成データセット生成手法を提案する。
論文 参考訳(メタデータ) (2020-08-19T14:03:17Z) - JHU-CROWD++: Large-Scale Crowd Counting Dataset and A Benchmark Method [92.15895515035795]
我々は、"4,372"イメージと"1.51万"アノテーションを含む、新しい大規模非制約クラウドカウントデータセット(JHU-CROWD++)を導入する。
本稿では, 残差誤差推定により, 群集密度マップを段階的に生成する新しい群集カウントネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T14:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。