論文の概要: UrbanVerse: Scaling Urban Simulation by Watching City-Tour Videos
- arxiv url: http://arxiv.org/abs/2510.15018v1
- Date: Thu, 16 Oct 2025 17:42:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 20:17:34.326204
- Title: UrbanVerse: Scaling Urban Simulation by Watching City-Tour Videos
- Title(参考訳): UrbanVerse: 都市間ビデオによる都市シミュレーションのスケールアップ
- Authors: Mingxuan Liu, Honglin He, Elisa Ricci, Wayne Wu, Bolei Zhou,
- Abstract要約: クラウドソーシングされた都市間ビデオから物理を意識したインタラクティブなシミュレーションシーンに変換する,データ駆動型リアルタイムシミュレーションシステムであるUrbanVerseを紹介した。
アイザックシムで運営されているUrbanVerseは、24か国から160の高品質なシーンを提供している。
実験により、UrbanVerseのシーンは現実世界のセマンティクスとレイアウトを保存し、手作業によるシーンに匹敵する人間評価されたリアリズムを達成することが示されている。
- 参考スコア(独自算出の注目度): 64.22243628420799
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Urban embodied AI agents, ranging from delivery robots to quadrupeds, are increasingly populating our cities, navigating chaotic streets to provide last-mile connectivity. Training such agents requires diverse, high-fidelity urban environments to scale, yet existing human-crafted or procedurally generated simulation scenes either lack scalability or fail to capture real-world complexity. We introduce UrbanVerse, a data-driven real-to-sim system that converts crowd-sourced city-tour videos into physics-aware, interactive simulation scenes. UrbanVerse consists of: (i) UrbanVerse-100K, a repository of 100k+ annotated urban 3D assets with semantic and physical attributes, and (ii) UrbanVerse-Gen, an automatic pipeline that extracts scene layouts from video and instantiates metric-scale 3D simulations using retrieved assets. Running in IsaacSim, UrbanVerse offers 160 high-quality constructed scenes from 24 countries, along with a curated benchmark of 10 artist-designed test scenes. Experiments show that UrbanVerse scenes preserve real-world semantics and layouts, achieving human-evaluated realism comparable to manually crafted scenes. In urban navigation, policies trained in UrbanVerse exhibit scaling power laws and strong generalization, improving success by +6.3% in simulation and +30.1% in zero-shot sim-to-real transfer comparing to prior methods, accomplishing a 300 m real-world mission with only two interventions.
- Abstract(参考訳): 配達ロボットから四足歩行まで、都会の実施するAIエージェントはますます都市に浸透し、混乱した街を旅して、ラストマイル接続を提供しようとしている。
このようなエージェントの訓練には、スケールするために多様な高忠実な都市環境が必要であるが、既存の人造または手続き的に生成されたシミュレーションシーンはスケーラビリティに欠けるか、現実の複雑さを捉えるのに失敗する。
クラウドソーシングされた都市間ビデオから物理を意識したインタラクティブなシミュレーションシーンに変換する,データ駆動型リアルタイムシミュレーションシステムであるUrbanVerseを紹介した。
UrbanVerse は以下の通りである。
i)UrbanVerse-100Kは、意味的・物理的特性を有する100k以上のアノテートされた都市3D資産の保管庫であって、
(ii)UrbanVerse-Genは、ビデオからシーンレイアウトを抽出し、取得した資産を用いてメートル法スケールの3Dシミュレーションをインスタンス化する自動パイプラインである。
アイザックシムで運営されているUrbanVerseは、24か国から160の高品質なシーンを提供している。
実験により、UrbanVerseのシーンは現実世界のセマンティクスとレイアウトを保存し、手作業によるシーンに匹敵する人間評価されたリアリズムを達成することが示されている。
都市航法において、UrbanVerseで訓練された政策は、スケーリングの法則と強力な一般化を示し、シミュレーションで+6.3%、ゼロショットのsim-to-real転送で+30.1%向上し、わずか2回の介入で300mの現実世界のミッションを達成している。
関連論文リスト
- Vid2Sim: Realistic and Interactive Simulation from Video for Urban Navigation [62.5805866419814]
Vid2Simは、ニューラル3Dシーンの再構築とシミュレーションのためのスケーラブルで費用効率のよいReal2simパイプラインを通じてsim2realギャップをブリッジする新しいフレームワークである。
実験により、Vid2Simはデジタル双生児と現実世界の都市ナビゲーションの性能を31.2%、成功率68.3%で大幅に改善することが示された。
論文 参考訳(メタデータ) (2025-01-12T03:01:15Z) - CityX: Controllable Procedural Content Generation for Unbounded 3D Cities [50.10101235281943]
現在の生成法は多様性、可制御性または忠実度に乏しい。
本研究では,高忠実度生成のための手続き的コンテンツ生成(PCG)技術を利用する。
我々は,OSM,セマンティックマップ,衛星画像などのマルチモーダル命令を実行可能なプログラムに変換するマルチエージェントフレームワークを開発した。
提案手法はCityXと呼ばれ,多種多様で制御可能でリアルな3D都市景観の創出において,その優位性を実証するものである。
論文 参考訳(メタデータ) (2024-07-24T18:05:13Z) - UrbanWorld: An Urban World Model for 3D City Generation [21.21375372182025]
UrbanWorldは、フレキシブルな制御条件を備えたカスタマイズされたリアルでインタラクティブな3D都市世界を自動生成できる、ジェネレーティブな都市世界モデルである。
我々は5つの視覚的指標について広範囲に定量的に分析を行い、UrbanWorldがSOTA生成リアリズムを実現していることを示す。
エージェントの認識とナビゲーションを生成環境内で示すことで,これらの環境のインタラクティブな性質を検証する。
論文 参考訳(メタデータ) (2024-07-16T17:59:29Z) - Urban Scene Diffusion through Semantic Occupancy Map [49.20779809250597]
UrbanDiffusionは、Bird's-Eye View (BEV)マップに条件付き3次元拡散モデルである。
我々のモデルは,潜在空間内のシーンレベルの構造の分布を学習する。
実世界の運転データセットをトレーニングした後、我々のモデルは多様な都市シーンを生成することができる。
論文 参考訳(メタデータ) (2024-03-18T11:54:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。