論文の概要: Foundation Models for Spatio-Temporal Data Science: A Tutorial and Survey
- arxiv url: http://arxiv.org/abs/2503.13502v1
- Date: Wed, 12 Mar 2025 09:42:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-19 14:14:24.684760
- Title: Foundation Models for Spatio-Temporal Data Science: A Tutorial and Survey
- Title(参考訳): 時空間データ科学の基礎モデル : チュートリアルと調査
- Authors: Yuxuan Liang, Haomin Wen, Yutong Xia, Ming Jin, Bin Yang, Flora Salim, Qingsong Wen, Shirui Pan, Gao Cong,
- Abstract要約: 時空間(ST)データサイエンスは、都市コンピューティング、気候科学、インテリジェントトランスポートといった領域における複雑なシステムを理解するのに不可欠である。
研究者は、様々なSTタスクに対する適応性と一般化を高めるために、時空間モデル(STFM)の概念を探求し始めている。
STFMは、データセンシング、管理、マイニングなど、STデータサイエンスのワークフロー全体を強化し、より包括的でスケーラブルなアプローチを提供する。
- 参考スコア(独自算出の注目度): 69.0648659029394
- License:
- Abstract: Spatio-Temporal (ST) data science, which includes sensing, managing, and mining large-scale data across space and time, is fundamental to understanding complex systems in domains such as urban computing, climate science, and intelligent transportation. Traditional deep learning approaches have significantly advanced this field, particularly in the stage of ST data mining. However, these models remain task-specific and often require extensive labeled data. Inspired by the success of Foundation Models (FM), especially large language models, researchers have begun exploring the concept of Spatio-Temporal Foundation Models (STFMs) to enhance adaptability and generalization across diverse ST tasks. Unlike prior architectures, STFMs empower the entire workflow of ST data science, ranging from data sensing, management, to mining, thereby offering a more holistic and scalable approach. Despite rapid progress, a systematic study of STFMs for ST data science remains lacking. This survey aims to provide a comprehensive review of STFMs, categorizing existing methodologies and identifying key research directions to advance ST general intelligence.
- Abstract(参考訳): 空間と時間にわたって大規模なデータを検知し、管理し、採掘することを含む時空間データ科学(ST)は、都市コンピューティング、気候科学、インテリジェントトランスポートといった領域における複雑なシステムを理解するのに不可欠である。
従来のディープラーニングアプローチは、特にSTデータマイニングの段階で、この分野を著しく進歩させてきた。
しかし、これらのモデルはタスク固有のままであり、しばしば広範囲のラベル付きデータを必要とする。
ファンデーションモデル(FM)、特に大きな言語モデルの成功に触発されて、研究者は様々なSTタスクにまたがる適応性と一般化を促進するために、時空間モデル(STFM)の概念を探求し始めた。
従来のアーキテクチャとは異なり、STFMはデータセンシング、管理、マイニングなど、STデータサイエンスのワークフロー全体を強化し、より包括的でスケーラブルなアプローチを提供する。
急速な進歩にもかかわらず、STデータサイエンスのためのSTFMの体系的研究は依然として不十分である。
本調査は,STFMの総合的なレビューを行い,既存の方法論を分類し,ST汎用インテリジェンスを推し進めるための重要な研究方向を特定することを目的とする。
関連論文リスト
- Foundation Models for Remote Sensing and Earth Observation: A Survey [101.77425018347557]
本調査は、リモートセンシング基礎モデル(RSFM)の新しい分野を体系的にレビューする。
モチベーションと背景の概要から始まり、続いて基本概念が導入された。
我々はこれらのモデルを公開データセットと比較し、既存の課題について議論し、今後の研究方向性を提案する。
論文 参考訳(メタデータ) (2024-10-22T01:08:21Z) - DSBench: How Far Are Data Science Agents to Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
本稿では,72の科学分野をカバーするNature Communicationsの記事からまとめられた包括的データセットについて述べる。
2つのベンチマークタスク(図のキャプションと複数選択)で19のプロプライエタリモデルとオープンソースモデルを評価し,人手による注釈を行った。
タスク固有データを用いた細調整Qwen2-VL-7Bは、GPT-4oや人間の専門家でさえも、マルチチョイス評価において優れた性能を示した。
論文 参考訳(メタデータ) (2024-07-06T00:40:53Z) - Progress and Opportunities of Foundation Models in Bioinformatics [77.74411726471439]
基礎モデル(FM)は、特に深層学習の領域において、計算生物学の新しい時代に定着した。
我々の焦点は、特定の生物学的問題にFMを応用することであり、研究ニーズに適切なFMを選択するために研究コミュニティを指導することを目的としています。
データノイズ、モデル説明可能性、潜在的なバイアスなど、生物学においてFMが直面する課題と限界を分析します。
論文 参考訳(メタデータ) (2024-02-06T02:29:17Z) - Foundation Models for Weather and Climate Data Understanding: A
Comprehensive Survey [39.08108001903514]
私たちは、気象や気候データのために特別に設計された最先端のAI方法論を、徹底的に、タイムリーに概説しています。
主な対象は、気象・気候データの種類、主モデル、モデルスコープと応用、気象・気候のデータセットの4つである。
論文 参考訳(メタデータ) (2023-12-05T01:10:54Z) - Large Models for Time Series and Spatio-Temporal Data: A Survey and
Outlook [95.32949323258251]
時系列データ、特に時系列データと時間時間データは、現実世界のアプリケーションで広く使われている。
大規模言語やその他の基礎モデルの最近の進歩は、時系列データマイニングや時間データマイニングでの使用の増加に拍車を掛けている。
論文 参考訳(メタデータ) (2023-10-16T09:06:00Z) - When Geoscience Meets Foundation Models: Towards General Geoscience Artificial Intelligence System [6.445323648941926]
地球科学基礎モデル(Geoscience foundation model, GFMs)は、地球系の力学のシミュレーションと理解を強化するために、広範な学際データを統合するパラダイムシフトソリューションである。
GFMのユニークな長所は、フレキシブルなタスク仕様、多様な入出力能力、マルチモーダルな知識表現である。
このレビューは、先進的なAI技術と地球科学の交差点における未解決の機会を強調した、新興の地球科学研究パラダイムの包括的概要を提供する。
論文 参考訳(メタデータ) (2023-09-13T08:44:09Z) - Easy Begun is Half Done: Spatial-Temporal Graph Modeling with
ST-Curriculum Dropout [8.924689054841524]
空間時間グラフモデリングのための新しい実装戦略ST-Curriculum Dropoutを提案する。
我々は,高レベルな特徴空間における各ノードの学習困難さを評価し,それらの困難さを排除し,モデルが基本的ST関係のみを扱う必要があることを確かめる。
私たちの戦略は、トレーニング可能なパラメータを追加せずに、標準的なディープラーニングアーキテクチャに適用できます。
論文 参考訳(メタデータ) (2022-11-28T09:47:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。