論文の概要: UrbanFM: Scaling Urban Spatio-Temporal Foundation Models
- arxiv url: http://arxiv.org/abs/2602.20677v2
- Date: Mon, 02 Mar 2026 08:34:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 15:39:03.829527
- Title: UrbanFM: Scaling Urban Spatio-Temporal Foundation Models
- Title(参考訳): UrbanFM: 都市時空間モデルの拡張
- Authors: Wei Chen, Yuqian Wu, Junle Chen, Xiaofang Zhou, Yuxuan Liang,
- Abstract要約: 動的システムとしての都市システムは、人間の移動と都市の進化の基本的な法則を符号化した動的時間的データストリームを生成する。
AI for Scienceは、気象学のような分野における基礎モデルの変革的なパワーを目撃しているが、都市コンピューティングは「シナリオ固有の」モデルによって断片化されている。
我々は,大規模データからアーキテクチャを統一するために,限られた帰納バイアスで設計された最小限の自己注意型アーキテクチャであるUrbanFMを提案する。
実験により、UrbanFMは、大規模な都市時間基盤モデルに向けた第一歩として、都市とタスクをまたいだ顕著なゼロショットの一般化を実現していることが示された。
- 参考スコア(独自算出の注目度): 36.98769959300113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Urban systems, as dynamic complex systems, continuously generate spatio-temporal data streams that encode the fundamental laws of human mobility and city evolution. While AI for Science has witnessed the transformative power of foundation models in disciplines like genomics and meteorology, urban computing remains fragmented due to "scenario-specific" models, which are overfitted to specific regions or tasks, hindering their generalizability. To bridge this gap and advance spatio-temporal foundation models for urban systems, we adopt scaling as the central perspective and systematically investigate two key questions: what to scale and how to scale. Grounded in first-principles analysis, we identify three critical dimensions: heterogeneity, correlation, and dynamics, aligning these principles with the fundamental scientific properties of urban spatio-temporal data. Specifically, to address heterogeneity through data scaling, we construct WorldST. This billion-scale corpus standardizes diverse physical signals, such as traffic flow and speed, from over 100 global cities into a unified data format. To enable computation scaling for modeling correlations, we introduce the MiniST unit, a novel split mechanism that discretizes continuous spatio-temporal fields into learnable computational units to unify representations of grid-based and sensor-based observations. Finally, addressing dynamics via architecture scaling, we propose UrbanFM, a minimalist self-attention architecture designed with limited inductive biases to autonomously learn dynamic spatio-temporal dependencies from massive data. Furthermore, we establish EvalST, the largest-scale urban spatio-temporal benchmark to date. Extensive experiments demonstrate that UrbanFM achieves remarkable zero-shot generalization across unseen cities and tasks, marking a pivotal first step toward large-scale urban spatio-temporal foundation models.
- Abstract(参考訳): 都市システムは、動的な複雑なシステムとして、人間の移動と都市の発展の基本的な法則を符号化する時空間データストリームを継続的に生成する。
AI for Scienceは、ゲノム学や気象学といった分野における基礎モデルの変革的なパワーを目撃しているが、都市コンピューティングは、特定の地域やタスクに過度に適合する「シナリオ固有の」モデルによって断片化され、その一般化を妨げている。
このギャップを埋め、都市システムの時空間的基盤モデルを進めるために、我々はスケーリングを中心的な視点として採用し、何をスケールするか、どのようにスケールするかという2つの重要な質問を体系的に調査する。
第一原理分析に基づいて, 異質性, 相関性, 動態の3つの重要な次元を同定し, 都市時空間データの基本的な科学的特性と整合する。
具体的には、データスケーリングによる不均一性に対処するため、WorldSTを構築します。
この数十億ドル規模のコーパスは、100以上の世界都市から統一されたデータフォーマットへと、交通の流れや速度などの多様な物理信号を標準化する。
モデル相関の計算スケーリングを実現するために,連続時空間を学習可能な計算単位に分解し,グリッドベースおよびセンサベース観測の表現を統一する機構であるMiniSTユニットを導入する。
最後に,大規模データから動的時空間依存性を自律的に学習するために,帰納バイアスを限定した最小限の自己注意型アーキテクチャであるUrbanFMを提案する。
さらに,これまでで最大規模の都市時空間ベンチマークであるEvalSTを確立した。
広範にわたる実験により、UrbanFMは目に見えない都市やタスクで目覚ましいゼロショットの一般化を実現しており、大規模な都市時空間基盤モデルに向けた重要な第一歩となっている。
関連論文リスト
- Predicting Large-scale Urban Network Dynamics with Energy-informed Graph Neural Diffusion [51.198001060683296]
ネットワーク化された都市システムは人、資源、サービスのフローを促進する。
グラフニューラルネットワークのような現在のモデルは、将来性を示しているが、有効性と効率性のトレードオフに直面している。
本論文は,本質的なモデル設計を伝えるための物理法則からインスピレーションを得て,このトレードオフに対処する。
論文 参考訳(メタデータ) (2025-07-31T01:24:01Z) - UrbanMind: Urban Dynamics Prediction with Multifaceted Spatial-Temporal Large Language Models [18.051209616917042]
UrbanMind は多面的都市動態予測のための空間時空間 LLM フレームワークである。
UrbanMindのコアとなるMuffin-MAEは、特殊なマスキング戦略を備えた多面式フュージョンマスク自動エンコーダである。
複数の都市にまたがる実世界の都市データセットの実験は、UrbanMindが一貫して最先端のベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2025-05-16T19:38:06Z) - Real-time Spatial Retrieval Augmented Generation for Urban Environments [2.8367942280334493]
本研究は,都市への生成AIの効果的な統合に必要なコンポーネントを定義するリアルタイム空間RAGアーキテクチャを提案する。
提案アーキテクチャは、スマートシティソリューションとデジタルツインを開発するソフトウェアコンポーネントのエコシステムであるFIWAREを用いて実装されている。
論文 参考訳(メタデータ) (2025-05-04T21:57:58Z) - Collaborative Imputation of Urban Time Series through Cross-city Meta-learning [54.438991949772145]
メタ学習型暗黙的ニューラル表現(INR)を利用した新しい協調的計算パラダイムを提案する。
次に,モデルに依存しないメタ学習による都市間協調学習手法を提案する。
20のグローバル都市から得られた多様な都市データセットの実験は、我々のモデルの優れた計算性能と一般化可能性を示している。
論文 参考訳(メタデータ) (2025-01-20T07:12:40Z) - Diffusion Transformers as Open-World Spatiotemporal Foundation Models [30.98708067420915]
UrbanDiTは、オープンワールドの都市時間学習の基礎モデルである。
その重要なイノベーションは、データ駆動とタスク固有のプロンプトの両方を適応的に生成する、精巧なプロンプト学習フレームワークにある。
UrbanDiTは、都市時間領域の基礎モデルのための新しいベンチマークをセットアップする。
論文 参考訳(メタデータ) (2024-11-19T02:01:07Z) - HGAurban: Heterogeneous Graph Autoencoding for Urban Spatial-Temporal Learning [36.80668790442231]
重要な課題は、空間時空間グラフで意味のある領域表現を学習する既存のニューラルネットワークの能力を制限する、空間時空間データのノイズとスパースの性質にある。
都市データ表現のための自己教師付き生成学習を生かしたヘテロジニアスな空間時間グラフマスク型オートエンコーダであるHurbanを提案する。
論文 参考訳(メタデータ) (2024-10-14T07:33:33Z) - UrbanGPT: Spatio-Temporal Large Language Models [34.79169613947957]
本稿では,時空間エンコーダと命令調整パラダイムをシームレスに統合するUrbanPTを提案する。
我々は、様々な公開データセットに対して広範囲な実験を行い、異なる時間的予測タスクをカバーした。
結果は、慎重に設計されたアーキテクチャを持つUrbanPTが、最先端のベースラインを一貫して上回っていることを一貫して示しています。
論文 参考訳(メタデータ) (2024-02-25T12:37:29Z) - Rethinking Urban Mobility Prediction: A Super-Multivariate Time Series
Forecasting Approach [71.67506068703314]
長期の都市移動予測は、都市施設やサービスの効果的管理において重要な役割を担っている。
伝統的に、都市移動データはビデオとして構成され、経度と緯度を基本的なピクセルとして扱う。
本研究では,都市におけるモビリティ予測の新たな視点について紹介する。
都市移動データを従来のビデオデータとして単純化するのではなく、複雑な時系列と見なす。
論文 参考訳(メタデータ) (2023-12-04T07:39:05Z) - Unified Data Management and Comprehensive Performance Evaluation for
Urban Spatial-Temporal Prediction [Experiment, Analysis & Benchmark] [78.05103666987655]
この研究は、多様な都市空間時間データセットにアクセスし活用する際の課題に対処する。
都市空間・時空間のビッグデータ用に設計された統合ストレージフォーマットであるアトミックファイルを導入し,40種類の多様なデータセットでその有効性を検証する。
多様なモデルとデータセットを使用して広範な実験を行い、パフォーマンスリーダーボードを確立し、有望な研究方向性を特定する。
論文 参考訳(メタデータ) (2023-08-24T16:20:00Z) - Methodological Foundation of a Numerical Taxonomy of Urban Form [62.997667081978825]
本稿では, 生物系統学から得られた都市形態の数値分類法を提案する。
我々は同質の都市組織タイプを導出し、それら間の全体形態的類似性を決定することにより、都市形態の階層的分類を生成する。
フレーミングとプレゼンを行った後、プラハとアムステルダムの2都市でテストを行った。
論文 参考訳(メタデータ) (2021-04-30T12:47:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。