Fugu-MT 論文翻訳(概要): Foundation Models for Remote Sensing and Earth Observation: A Survey

論文の概要: Foundation Models for Remote Sensing and Earth Observation: A Survey

arxiv url: http://arxiv.org/abs/2410.16602v1
Date: Tue, 22 Oct 2024 01:08:21 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:38.824511
Title: Foundation Models for Remote Sensing and Earth Observation: A Survey
Title（参考訳）: リモートセンシングと地球観測のための基礎モデル:サーベイ
Authors: Aoran Xiao, Weihao Xuan, Junjue Wang, Jiaxing Huang, Dacheng Tao, Shijian Lu, Naoto Yokoya,
Abstract要約: 本調査は、リモートセンシング基礎モデル(RSFM)の新しい分野を体系的にレビューする。モチベーションと背景の概要から始まり、続いて基本概念が導入された。その後、データセットや技術貢献を含む既存のRSFM研究を分類し、レビューする。
参考スコア（独自算出の注目度）: 101.77425018347557
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Remote Sensing (RS) is a crucial technology for observing, monitoring, and interpreting our planet, with broad applications across geoscience, economics, humanitarian fields, etc. While artificial intelligence (AI), particularly deep learning, has achieved significant advances in RS, unique challenges persist in developing more intelligent RS systems, including the complexity of Earth's environments, diverse sensor modalities, distinctive feature patterns, varying spatial and spectral resolutions, and temporal dynamics. Meanwhile, recent breakthroughs in large Foundation Models (FMs) have expanded AI's potential across many domains due to their exceptional generalizability and zero-shot transfer capabilities. However, their success has largely been confined to natural data like images and video, with degraded performance and even failures for RS data of various non-optical modalities. This has inspired growing interest in developing Remote Sensing Foundation Models (RSFMs) to address the complex demands of Earth Observation (EO) tasks, spanning the surface, atmosphere, and oceans. This survey systematically reviews the emerging field of RSFMs. It begins with an outline of their motivation and background, followed by an introduction of their foundational concepts. It then categorizes and reviews existing RSFM studies including their datasets and technical contributions across Visual Foundation Models (VFMs), Visual-Language Models (VLMs), Large Language Models (LLMs), and beyond. In addition, we benchmark these models against publicly available datasets, discuss existing challenges, and propose future research directions in this rapidly evolving field.
Abstract（参考訳）: リモートセンシング(Remote Sensing, RS)は、地球を観測、監視、解釈するための重要な技術であり、地球科学、経済学、人道科学など幅広い分野に応用されている。人工知能(AI)、特に深層学習はRSにおいて大きな進歩を遂げているが、地球の環境の複雑さ、多様なセンサーのモダリティ、特徴的な特徴パターン、空間とスペクトルの解像度の変化、時間力学など、よりインテリジェントなRSシステムの開発において固有の課題が続いている。一方、大規模ファンデーションモデル(FM)の最近のブレークスルーは、異常な一般化性とゼロショット転送能力のために、AIのポテンシャルを多くのドメインにわたって拡大している。しかし、その成功は画像やビデオのような自然なデータに限られており、性能の劣化や、光学的でない様々なモダリティのRSデータの失敗さえあった。これは、地球観測(EO)タスクの複雑な要求に対応するために、地表、大気、海洋にまたがるリモートセンシング基礎モデル(RSFM)の開発への関心が高まっている。本調査はRSFMの新興分野を体系的にレビューする。モチベーションと背景の概要から始まり、続いて基本概念が導入された。その後、Visual Foundation Models (VFM)、Visual-Language Models (VLM)、Large Language Models (LLM)などを含む既存のRSFM研究を分類し、レビューする。さらに、これらのモデルを公開データセットと比較し、既存の課題について議論し、この急速に発展する分野における今後の研究方向性を提案する。

関連論文リスト

Towards Depth Foundation Model: Recent Trends in Vision-Based Depth Estimation [75.30238170051291]
深さ推定は3Dコンピュータビジョンの基本課題であり、3D再構成、自由視点レンダリング、ロボティクス、自律運転、AR/VR技術といった応用に不可欠である。 LiDARのようなハードウェアセンサーに依存する従来の方法は、しばしば高コスト、低解像度、環境感度によって制限され、現実のシナリオで適用性を制限する。ビジョンベースの手法の最近の進歩は有望な代替手段を提供するが、低容量モデルアーキテクチャやドメイン固有の小規模データセットへの依存のため、一般化と安定性の課題に直面している。
論文参考訳（メタデータ） (2025-07-15T17:59:59Z)
From Physics to Foundation Models: A Review of AI-Driven Quantitative Remote Sensing Inversion [10.054868326253784]
定量的リモートセンシングインバージョンは、バイオマス、植生指標、衛星観測からの蒸発散などの連続した表面変数を推定することを目的としている。従来の物理に基づくパラダイムは、データ駆動および基礎モデル(FM)ベースのアプローチに道を譲っている。
論文参考訳（メタデータ） (2025-07-11T23:57:00Z)
Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文参考訳（メタデータ） (2025-06-11T03:29:18Z)
A Survey on Remote Sensing Foundation Models: From Vision to Multimodality [35.532200523631765]
リモートセンシングのための視覚とマルチモーダル基礎モデルは、インテリジェントな地理空間データ解釈能力を大幅に向上させた。データタイプの多様性、大規模アノテートデータセットの必要性、マルチモーダル融合技術の複雑さは、これらのモデルの効果的なデプロイに重大な障害をもたらす。本稿では、リモートセンシングのための最先端のビジョンモデルとマルチモーダル基礎モデルについて、アーキテクチャ、トレーニング方法、データセット、アプリケーションシナリオに焦点をあててレビューする。
論文参考訳（メタデータ） (2025-03-28T01:57:35Z)
Foundation Models for Spatio-Temporal Data Science: A Tutorial and Survey [69.0648659029394]
時空間(ST)データサイエンスは、都市コンピューティング、気候科学、インテリジェントトランスポートといった領域における複雑なシステムを理解するのに不可欠である。研究者は、様々なSTタスクに対する適応性と一般化を高めるために、時空間モデル(STFM)の概念を探求し始めている。 STFMは、データセンシング、管理、マイニングなど、STデータサイエンスのワークフロー全体を強化し、より包括的でスケーラブルなアプローチを提供する。
論文参考訳（メタデータ） (2025-03-12T09:42:18Z)
A Survey on Post-training of Large Language Models [185.51013463503946]
大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。本稿では,5つのコアパラダイムにまたがるPoLMの進化を体系的に追跡する,最初の包括的調査について述べる。
論文参考訳（メタデータ） (2025-03-08T05:41:42Z)
Low-Rank Adaptation for Foundation Models: A Comprehensive Review [42.23155921954156]
Low-Rank Adaptation (LoRA)は、これらの課題を緩和するための非常に有望なアプローチとして登場した。この調査は、大規模な言語モデルから一般的な基礎モデルまで、LoRAテクニックの包括的なレビューを初めて提供する。
論文参考訳（メタデータ） (2024-12-31T09:38:55Z)
Generative Artificial Intelligence Meets Synthetic Aperture Radar: A Survey [49.29751866761522]
本稿では,GenAIとSARの交差点について検討する。まず、SAR分野における一般的なデータ生成ベースのアプリケーションについて説明する。次に、最新のGenAIモデルの概要を体系的にレビューする。最後に、SARドメインの対応するアプリケーションも含まれる。
論文参考訳（メタデータ） (2024-11-05T03:06:00Z)
AI Foundation Models in Remote Sensing: A Survey [6.036426846159163]
本稿では,リモートセンシング領域における基礎モデルの包括的調査を行う。コンピュータビジョンおよびドメイン固有タスクにおけるそれらの応用に基づいて、これらのモデルを分類する。これらの基盤モデルによって達成された、新しいトレンドと大きな進歩を強調します。
論文参考訳（メタデータ） (2024-08-06T22:39:34Z)
Towards Vision-Language Geo-Foundation Model: A Survey [65.70547895998541]
Vision-Language Foundation Models (VLFMs) は、様々なマルチモーダルタスクにおいて顕著な進歩を遂げている。本稿では, VLGFMを網羅的にレビューし, この分野の最近の展開を要約し, 分析する。
論文参考訳（メタデータ） (2024-06-13T17:57:30Z)
Research on the Spatial Data Intelligent Foundation Model [70.47828328840912]
本報告では、これらのモデルの原理、手法、最先端の応用を探求する、空間データインテリジェントな大規模モデルに焦点を当てる。これは、空間データインテリジェントな大規模モデルの定義、開発履歴、現状、およびトレンドに関する詳細な議論を提供する。本報告では, 都市環境, 航空宇宙リモートセンシング, 地理, 交通, その他のシナリオにおける空間データ知能大規模モデルの重要技術とその応用を体系的に解明する。
論文参考訳（メタデータ） (2024-05-30T06:21:34Z)
Is Sora a World Simulator? A Comprehensive Survey on General World Models and Beyond [101.15395503285804]
一般世界モデルは、人工知能(AGI)の実現への決定的な道のりを表現している本調査では,世界モデルの最新動向を包括的に調査する。我々は,世界モデルの課題と限界について検討し,今後の方向性について考察する。
論文参考訳（メタデータ） (2024-05-06T14:37:07Z)
Forging Vision Foundation Models for Autonomous Driving: Challenges, Methodologies, and Opportunities [59.02391344178202]
ビジョンファウンデーションモデル(VFM)は、幅広いAIアプリケーションのための強力なビルディングブロックとして機能する。総合的なトレーニングデータの不足、マルチセンサー統合の必要性、多様なタスク固有のアーキテクチャは、VFMの開発に重大な障害をもたらす。本稿では、自動運転に特化したVFMを鍛造する上で重要な課題について述べるとともに、今後の方向性を概説する。
論文参考訳（メタデータ） (2024-01-16T01:57:24Z)
SkySense: A Multi-Modal Remote Sensing Foundation Model Towards Universal Interpretation for Earth Observation Imagery [35.550999964460466]
本稿では,2150万の時間的シーケンスを持つマルチモーダルリモートセンシングデータセットを事前トレーニングした総称10億スケールモデルSkySenseを提案する。我々の知る限り、SkySenseは今までで最大のマルチモーダルであり、モジュールを柔軟に組み合わせたり、個別に使用して様々なタスクに適合させることができる。
論文参考訳（メタデータ） (2023-12-15T09:57:21Z)
When Geoscience Meets Foundation Models: Towards General Geoscience Artificial Intelligence System [6.445323648941926]
地球科学基礎モデル(Geoscience foundation model, GFMs)は、地球系の力学のシミュレーションと理解を強化するために、広範な学際データを統合するパラダイムシフトソリューションである。 GFMのユニークな長所は、フレキシブルなタスク仕様、多様な入出力能力、マルチモーダルな知識表現である。このレビューは、先進的なAI技術と地球科学の交差点における未解決の機会を強調した、新興の地球科学研究パラダイムの包括的概要を提供する。
論文参考訳（メタデータ） (2023-09-13T08:44:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。