論文の概要: UrbanFM: Scaling Urban Spatio-Temporal Foundation Models
- arxiv url: http://arxiv.org/abs/2602.20677v1
- Date: Tue, 24 Feb 2026 08:26:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.676455
- Title: UrbanFM: Scaling Urban Spatio-Temporal Foundation Models
- Title(参考訳): UrbanFM: 都市時空間モデルの拡張
- Authors: Wei Chen, Yuqian Wu, Junle Chen, Xiaofang Zhou, Yuxuan Liang,
- Abstract要約: 動的システムとしての都市システムは、人間の移動と都市の進化の基本的な法則を符号化した動的時間的データストリームを生成する。
AI for Scienceは、気象学のような分野における基礎モデルの変革的なパワーを目撃しているが、都市コンピューティングは「シナリオ固有の」モデルによって断片化されている。
我々は,大規模データからアーキテクチャを統一するために,限られた帰納バイアスで設計された最小限の自己注意型アーキテクチャであるUrbanFMを提案する。
実験により、UrbanFMは、大規模な都市時間基盤モデルに向けた第一歩として、都市とタスクをまたいだ顕著なゼロショットの一般化を実現していることが示された。
- 参考スコア(独自算出の注目度): 36.98769959300113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Urban systems, as dynamic complex systems, continuously generate spatio-temporal data streams that encode the fundamental laws of human mobility and city evolution. While AI for Science has witnessed the transformative power of foundation models in disciplines like genomics and meteorology, urban computing remains fragmented due to "scenario-specific" models, which are overfitted to specific regions or tasks, hindering their generalizability. To bridge this gap and advance spatio-temporal foundation models for urban systems, we adopt scaling as the central perspective and systematically investigate two key questions: what to scale and how to scale. Grounded in first-principles analysis, we identify three critical dimensions: heterogeneity, correlation, and dynamics, aligning these principles with the fundamental scientific properties of urban spatio-temporal data. Specifically, to address heterogeneity through data scaling, we construct WorldST. This billion-scale corpus standardizes diverse physical signals, such as traffic flow and speed, from over 100 global cities into a unified data format. To enable computation scaling for modeling correlations, we introduce the MiniST unit, a novel split mechanism that discretizes continuous spatio-temporal fields into learnable computational units to unify representations of grid-based and sensor-based observations. Finally, addressing dynamics via architecture scaling, we propose UrbanFM, a minimalist self-attention architecture designed with limited inductive biases to autonomously learn dynamic spatio-temporal dependencies from massive data. Furthermore, we establish EvalST, the largest-scale urban spatio-temporal benchmark to date. Extensive experiments demonstrate that UrbanFM achieves remarkable zero-shot generalization across unseen cities and tasks, marking a pivotal first step toward large-scale urban spatio-temporal foundation models.
- Abstract(参考訳): 都市システムは、動的な複雑なシステムとして、人間の移動と都市の発展の基本的な法則を符号化する時空間データストリームを継続的に生成する。
AI for Scienceは、ゲノム学や気象学といった分野における基礎モデルの変革的なパワーを目撃しているが、都市コンピューティングは、特定の地域やタスクに過度に適合する「シナリオ固有の」モデルによって断片化され、その一般化を妨げている。
このギャップを埋め、都市システムの時空間的基盤モデルを進めるために、我々はスケーリングを中心的な視点として採用し、何をスケールするか、どのようにスケールするかという2つの重要な質問を体系的に調査する。
第一原理分析に基づいて, 異質性, 相関性, 動態の3つの重要な次元を同定し, 都市時空間データの基本的な科学的特性と整合する。
具体的には、データスケーリングによる不均一性に対処するため、WorldSTを構築します。
この数十億ドル規模のコーパスは、100以上の世界都市から統一されたデータフォーマットへと、交通の流れや速度などの多様な物理信号を標準化する。
モデル相関の計算スケーリングを実現するために,連続時空間を学習可能な計算単位に分解し,グリッドベースおよびセンサベース観測の表現を統一する機構であるMiniSTユニットを導入する。
最後に,大規模データから動的時空間依存性を自律的に学習するために,帰納バイアスを限定した最小限の自己注意型アーキテクチャであるUrbanFMを提案する。
さらに,これまでで最大規模の都市時空間ベンチマークであるEvalSTを確立した。
広範にわたる実験により、UrbanFMは目に見えない都市やタスクで目覚ましいゼロショットの一般化を実現しており、大規模な都市時空間基盤モデルに向けた重要な第一歩となっている。
関連論文リスト
- UrbanMind: Urban Dynamics Prediction with Multifaceted Spatial-Temporal Large Language Models [18.051209616917042]
UrbanMind は多面的都市動態予測のための空間時空間 LLM フレームワークである。
UrbanMindのコアとなるMuffin-MAEは、特殊なマスキング戦略を備えた多面式フュージョンマスク自動エンコーダである。
複数の都市にまたがる実世界の都市データセットの実験は、UrbanMindが一貫して最先端のベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2025-05-16T19:38:06Z) - Diffusion Transformers as Open-World Spatiotemporal Foundation Models [30.98708067420915]
UrbanDiTは、オープンワールドの都市時間学習の基礎モデルである。
その重要なイノベーションは、データ駆動とタスク固有のプロンプトの両方を適応的に生成する、精巧なプロンプト学習フレームワークにある。
UrbanDiTは、都市時間領域の基礎モデルのための新しいベンチマークをセットアップする。
論文 参考訳(メタデータ) (2024-11-19T02:01:07Z) - Rethinking Urban Mobility Prediction: A Super-Multivariate Time Series
Forecasting Approach [71.67506068703314]
長期の都市移動予測は、都市施設やサービスの効果的管理において重要な役割を担っている。
伝統的に、都市移動データはビデオとして構成され、経度と緯度を基本的なピクセルとして扱う。
本研究では,都市におけるモビリティ予測の新たな視点について紹介する。
都市移動データを従来のビデオデータとして単純化するのではなく、複雑な時系列と見なす。
論文 参考訳(メタデータ) (2023-12-04T07:39:05Z) - Unified Data Management and Comprehensive Performance Evaluation for
Urban Spatial-Temporal Prediction [Experiment, Analysis & Benchmark] [78.05103666987655]
この研究は、多様な都市空間時間データセットにアクセスし活用する際の課題に対処する。
都市空間・時空間のビッグデータ用に設計された統合ストレージフォーマットであるアトミックファイルを導入し,40種類の多様なデータセットでその有効性を検証する。
多様なモデルとデータセットを使用して広範な実験を行い、パフォーマンスリーダーボードを確立し、有望な研究方向性を特定する。
論文 参考訳(メタデータ) (2023-08-24T16:20:00Z) - Methodological Foundation of a Numerical Taxonomy of Urban Form [62.997667081978825]
本稿では, 生物系統学から得られた都市形態の数値分類法を提案する。
我々は同質の都市組織タイプを導出し、それら間の全体形態的類似性を決定することにより、都市形態の階層的分類を生成する。
フレーミングとプレゼンを行った後、プラハとアムステルダムの2都市でテストを行った。
論文 参考訳(メタデータ) (2021-04-30T12:47:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。