論文の概要: Mars-Bench: A Benchmark for Evaluating Foundation Models for Mars Science Tasks
- arxiv url: http://arxiv.org/abs/2510.24010v1
- Date: Tue, 28 Oct 2025 02:34:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:36.723266
- Title: Mars-Bench: A Benchmark for Evaluating Foundation Models for Mars Science Tasks
- Title(参考訳): Mars-Bench: 火星科学タスクの基礎モデルを評価するベンチマーク
- Authors: Mirali Purohit, Bimal Gajera, Vatsal Malaviya, Irish Mehta, Kunal Kasodekar, Jacob Adler, Steven Lu, Umaa Rebbapragada, Hannah Kerner,
- Abstract要約: 他の領域における進歩の鍵となるのは、体系的な評価をサポートする標準化されたベンチマークが利用可能になったことである。
火星に関する幅広いタスクのモデルを体系的に評価するために設計された最初のベンチマークであるMars-Benchを紹介する。
我々は、自然画像、地球衛星データ、最先端のビジョン言語モデルに基づいて事前訓練されたモデルを用いて、標準化された、使用可能なデータセットとベースライン評価を提供する。
- 参考スコア(独自算出の注目度): 7.399515278460871
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation models have enabled rapid progress across many specialized domains by leveraging large-scale pre-training on unlabeled data, demonstrating strong generalization to a variety of downstream tasks. While such models have gained significant attention in fields like Earth Observation, their application to Mars science remains limited. A key enabler of progress in other domains has been the availability of standardized benchmarks that support systematic evaluation. In contrast, Mars science lacks such benchmarks and standardized evaluation frameworks, which have limited progress toward developing foundation models for Martian tasks. To address this gap, we introduce Mars-Bench, the first benchmark designed to systematically evaluate models across a broad range of Mars-related tasks using both orbital and surface imagery. Mars-Bench comprises 20 datasets spanning classification, segmentation, and object detection, focused on key geologic features such as craters, cones, boulders, and frost. We provide standardized, ready-to-use datasets and baseline evaluations using models pre-trained on natural images, Earth satellite data, and state-of-the-art vision-language models. Results from all analyses suggest that Mars-specific foundation models may offer advantages over general-domain counterparts, motivating further exploration of domain-adapted pre-training. Mars-Bench aims to establish a standardized foundation for developing and comparing machine learning models for Mars science. Our data, models, and code are available at: https://mars-bench.github.io/.
- Abstract(参考訳): ファンデーションモデルは、ラベルのないデータに対する大規模な事前トレーニングを活用し、様々な下流タスクに強力な一般化を示すことによって、多くの専門分野をまたいだ急速な進歩を可能にした。
このようなモデルは地球観測のような分野で大きな注目を集めてきたが、火星科学への応用は依然として限られている。
他の領域における進歩の鍵となるのは、体系的な評価をサポートする標準化されたベンチマークが利用可能になったことである。
対照的に、火星科学はそのようなベンチマークや標準化された評価フレームワークを欠いているため、火星のタスクの基礎モデルの開発には限界がある。
このギャップに対処するため、軌道画像と表面画像の両方を用いて、幅広い火星関連タスクのモデルを体系的に評価するために設計された最初のベンチマークであるMars-Benchを紹介した。
マーズ・ベンチは、分類、セグメンテーション、オブジェクト検出にまたがる20のデータセットで構成されており、クレーター、円錐、岩盤、凍土などの重要な地質学的特徴に焦点を当てている。
我々は、自然画像、地球衛星データ、最先端のビジョン言語モデルに基づいて事前訓練されたモデルを用いて、標準化された、使用可能なデータセットとベースライン評価を提供する。
すべての分析結果から、火星固有の基礎モデルは、一般領域のモデルよりも有利であり、ドメイン適応型事前訓練のさらなる探索を動機付けている可能性が示唆された。
Mars-Benchは、火星科学のための機械学習モデルの開発と比較のための標準化された基盤を確立することを目指している。
私たちのデータ、モデル、コードは以下の通りです。
関連論文リスト
- Inpainting the Red Planet: Diffusion Models for the Reconstruction of Martian Environments in Virtual Reality [0.0]
訓練は、NASAのHiRISE調査から得られた12000個の火星高度マップで実施された。
非均一な再スケーリング戦略は、固定された128x128モデル解像度にリサイズする前に、複数のスケールにわたる地形の特徴をキャプチャする。
その結果,本手法は再建精度(RMSEでは4~15%)と知覚的類似性(LPIPSでは29~81%)において,元のデータより一貫して優れていた。
論文 参考訳(メタデータ) (2025-10-16T15:02:05Z) - TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation [65.74990259650984]
本研究では,グローバルに分散したSentinel-1とSentinel-2画像を利用する,スケーラブルな自己教師型学習モデルTerraFMを紹介する。
我々のトレーニング戦略は、局所的・言語的コントラスト学習を統合し、二重中心化機構を導入する。
TerraFMは分類タスクとセグメンテーションタスクの両方において強力な一般化を実現し、GEO-BenchとCopernicus-Benchの先行モデルよりも優れている。
論文 参考訳(メタデータ) (2025-06-06T17:59:50Z) - Open World Object Detection in the Era of Foundation Models [53.683963161370585]
5つの実世界のアプリケーション駆動データセットを含む新しいベンチマークを導入する。
本稿では,オープンワールドのための新しいオブジェクト検出モデル(FOMO)を提案する。
論文 参考訳(メタデータ) (2023-12-10T03:56:06Z) - ConeQuest: A Benchmark for Cone Segmentation on Mars [9.036303895516745]
ConeQuestは、火星の円錐を識別する最初の専門家による公開データセットである。
本研究では,(i)空間一般化と(ii)コーンサイズ一般化という2つのベンチマークタスクを提案する。
論文 参考訳(メタデータ) (2023-11-15T02:33:08Z) - GEO-Bench: Toward Foundation Models for Earth Monitoring [139.77907168809085]
6つの分類と6つのセグメンテーションタスクからなるベンチマークを提案する。
このベンチマークは、さまざまな地球観測タスクの進行の原動力となる。
論文 参考訳(メタデータ) (2023-06-06T16:16:05Z) - S$^{5}$Mars: Semi-Supervised Learning for Mars Semantic Segmentation [18.92602724896845]
火星のセマンティックセグメンテーションは、ローバーの自律計画と安全な運転の基盤である重要な火星ビジョンタスクである。
優れたモデルを得るためには、ほとんどのディープラーニングメソッドが正確に要求する、十分な詳細かつ高信頼のデータアノテーションが欠如している。
本稿では,共同データと手法設計の観点からその解決策を提案する。
実験結果から,本手法は最先端のSSL手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-07-04T05:03:10Z) - Embedding Earth: Self-supervised contrastive pre-training for dense land
cover classification [61.44538721707377]
本研究では,衛星画像の高可用性を活用するための自己監督型コントラスト事前学習法として,エンベディングアースを提案する。
提案手法による事前学習では, 25%の絶対mIoUが得られた。
学習した特徴は、異なる領域間で一般化され、提案した事前学習スキームの可能性を開放する。
論文 参考訳(メタデータ) (2022-03-11T16:14:14Z) - Towards Robust Monocular Visual Odometry for Flying Robots on Planetary
Missions [49.79068659889639]
火星に着陸したばかりのIngenuityは、トラバーサビリティの影響を受けない新時代の探検の始まりとなるでしょう。
高速な光フロートラッキングを用いた高能率単分子オードメトリーアルゴリズムを提案する。
また、相対翻訳情報行列の主成分分析に基づいて、スケールドリフトの現在のリスクを推定する新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-12T12:52:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。