論文の概要: Foundation Models for Remote Sensing and Earth Observation: A Survey
- arxiv url: http://arxiv.org/abs/2410.16602v1
- Date: Tue, 22 Oct 2024 01:08:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-23 14:28:55.241178
- Title: Foundation Models for Remote Sensing and Earth Observation: A Survey
- Title(参考訳): リモートセンシングと地球観測のための基礎モデル:サーベイ
- Authors: Aoran Xiao, Weihao Xuan, Junjue Wang, Jiaxing Huang, Dacheng Tao, Shijian Lu, Naoto Yokoya,
- Abstract要約: 本調査は、リモートセンシング基礎モデル(RSFM)の新しい分野を体系的にレビューする。
モチベーションと背景の概要から始まり、続いて基本概念が導入された。
その後、データセットや技術貢献を含む既存のRSFM研究を分類し、レビューする。
- 参考スコア(独自算出の注目度): 101.77425018347557
- License:
- Abstract: Remote Sensing (RS) is a crucial technology for observing, monitoring, and interpreting our planet, with broad applications across geoscience, economics, humanitarian fields, etc. While artificial intelligence (AI), particularly deep learning, has achieved significant advances in RS, unique challenges persist in developing more intelligent RS systems, including the complexity of Earth's environments, diverse sensor modalities, distinctive feature patterns, varying spatial and spectral resolutions, and temporal dynamics. Meanwhile, recent breakthroughs in large Foundation Models (FMs) have expanded AI's potential across many domains due to their exceptional generalizability and zero-shot transfer capabilities. However, their success has largely been confined to natural data like images and video, with degraded performance and even failures for RS data of various non-optical modalities. This has inspired growing interest in developing Remote Sensing Foundation Models (RSFMs) to address the complex demands of Earth Observation (EO) tasks, spanning the surface, atmosphere, and oceans. This survey systematically reviews the emerging field of RSFMs. It begins with an outline of their motivation and background, followed by an introduction of their foundational concepts. It then categorizes and reviews existing RSFM studies including their datasets and technical contributions across Visual Foundation Models (VFMs), Visual-Language Models (VLMs), Large Language Models (LLMs), and beyond. In addition, we benchmark these models against publicly available datasets, discuss existing challenges, and propose future research directions in this rapidly evolving field.
- Abstract(参考訳): リモートセンシング(Remote Sensing, RS)は、地球を観測、監視、解釈するための重要な技術であり、地球科学、経済学、人道科学など幅広い分野に応用されている。
人工知能(AI)、特に深層学習はRSにおいて大きな進歩を遂げているが、地球の環境の複雑さ、多様なセンサーのモダリティ、特徴的な特徴パターン、空間とスペクトルの解像度の変化、時間力学など、よりインテリジェントなRSシステムの開発において固有の課題が続いている。
一方、大規模ファンデーションモデル(FM)の最近のブレークスルーは、異常な一般化性とゼロショット転送能力のために、AIのポテンシャルを多くのドメインにわたって拡大している。
しかし、その成功は画像やビデオのような自然なデータに限られており、性能の劣化や、光学的でない様々なモダリティのRSデータの失敗さえあった。
これは、地球観測(EO)タスクの複雑な要求に対応するために、地表、大気、海洋にまたがるリモートセンシング基礎モデル(RSFM)の開発への関心が高まっている。
本調査はRSFMの新興分野を体系的にレビューする。
モチベーションと背景の概要から始まり、続いて基本概念が導入された。
その後、Visual Foundation Models (VFM)、Visual-Language Models (VLM)、Large Language Models (LLM)などを含む既存のRSFM研究を分類し、レビューする。
さらに、これらのモデルを公開データセットと比較し、既存の課題について議論し、この急速に発展する分野における今後の研究方向性を提案する。
関連論文リスト
- Towards Vision-Language Geo-Foundation Model: A Survey [65.70547895998541]
Vision-Language Foundation Models (VLFMs) は、様々なマルチモーダルタスクにおいて顕著な進歩を遂げている。
本稿では, VLGFMを網羅的にレビューし, この分野の最近の展開を要約し, 分析する。
論文 参考訳(メタデータ) (2024-06-13T17:57:30Z) - Research on the Spatial Data Intelligent Foundation Model [70.47828328840912]
本報告では、これらのモデルの原理、手法、最先端の応用を探求する、空間データインテリジェントな大規模モデルに焦点を当てる。
これは、空間データインテリジェントな大規模モデルの定義、開発履歴、現状、およびトレンドに関する詳細な議論を提供する。
本報告では, 都市環境, 航空宇宙リモートセンシング, 地理, 交通, その他のシナリオにおける空間データ知能大規模モデルの重要技術とその応用を体系的に解明する。
論文 参考訳(メタデータ) (2024-05-30T06:21:34Z) - Is Sora a World Simulator? A Comprehensive Survey on General World Models and Beyond [101.15395503285804]
一般世界モデルは、人工知能(AGI)の実現への決定的な道のりを表現している
本調査では,世界モデルの最新動向を包括的に調査する。
我々は,世界モデルの課題と限界について検討し,今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-05-06T14:37:07Z) - Neural Plasticity-Inspired Multimodal Foundation Model for Earth Observation [48.66623377464203]
我々の新しいアプローチは、脳科学における神経可塑性の概念を活用する、ダイナミックワンフォーオール(DOFA)モデルを導入している。
このダイナミックなハイパーネットワークは、異なる波長に調整され、5つのセンサーのデータに基づいて1つの多目的トランスフォーマーを共同で訓練し、12の異なる地球観測タスクを遂行することを可能にする。
論文 参考訳(メタデータ) (2024-03-22T17:11:47Z) - Segment Anything Model Can Not Segment Anything: Assessing AI Foundation
Model's Generalizability in Permafrost Mapping [19.307294875969827]
本稿では,AI基盤モデルとその定義特性を紹介する。
我々は、大規模AIビジョンモデル、特にMetaのセグメンション・アプライシング・モデル(SAM)の性能を評価する。
結果は、SAMには将来性はあるものの、AIの拡張された地形マッピングをサポートするための改善の余地があることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:10:09Z) - Forging Vision Foundation Models for Autonomous Driving: Challenges,
Methodologies, and Opportunities [59.02391344178202]
ビジョンファウンデーションモデル(VFM)は、幅広いAIアプリケーションのための強力なビルディングブロックとして機能する。
総合的なトレーニングデータの不足、マルチセンサー統合の必要性、多様なタスク固有のアーキテクチャは、VFMの開発に重大な障害をもたらす。
本稿では、自動運転に特化したVFMを鍛造する上で重要な課題について述べるとともに、今後の方向性を概説する。
論文 参考訳(メタデータ) (2024-01-16T01:57:24Z) - SkySense: A Multi-Modal Remote Sensing Foundation Model Towards Universal Interpretation for Earth Observation Imagery [35.550999964460466]
本稿では,2150万の時間的シーケンスを持つマルチモーダルリモートセンシングデータセットを事前トレーニングした総称10億スケールモデルSkySenseを提案する。
我々の知る限り、SkySenseは今までで最大のマルチモーダルであり、モジュールを柔軟に組み合わせたり、個別に使用して様々なタスクに適合させることができる。
論文 参考訳(メタデータ) (2023-12-15T09:57:21Z) - Deep Learning for Spatiotemporal Big Data: A Vision on Opportunities and
Challenges [4.497634148674422]
一時的ビッグデータは、これまで不可能だった問題を解決する新たな機会を育むことができる。
ビッグデータの特徴は、ディープラーニング技術に新たな課題をもたらす。
論文 参考訳(メタデータ) (2023-10-30T19:12:51Z) - When Geoscience Meets Foundation Models: Towards General Geoscience Artificial Intelligence System [6.445323648941926]
地球科学基礎モデル(Geoscience foundation model, GFMs)は、地球系の力学のシミュレーションと理解を強化するために、広範な学際データを統合するパラダイムシフトソリューションである。
GFMのユニークな長所は、フレキシブルなタスク仕様、多様な入出力能力、マルチモーダルな知識表現である。
このレビューは、先進的なAI技術と地球科学の交差点における未解決の機会を強調した、新興の地球科学研究パラダイムの包括的概要を提供する。
論文 参考訳(メタデータ) (2023-09-13T08:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。