論文の概要: Imagine a City: CityGenAgent for Procedural 3D City Generation
- arxiv url: http://arxiv.org/abs/2602.05362v1
- Date: Thu, 05 Feb 2026 06:36:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.79045
- Title: Imagine a City: CityGenAgent for Procedural 3D City Generation
- Title(参考訳): 都市を想像してみよう:CityGenAgent for Procedural 3D City Generation
- Authors: Zishan Liu, Zecong Tang, RuoCheng Wu, Xinzhe Zheng, Jingyu Hu, Ka-Hei Hui, Haoran Xie, Bo Dai, Zhengzhe Liu,
- Abstract要約: 高品質な3D都市の階層的手続き生成のための自然言語駆動フレームワークであるCityGenAgentを紹介する。
提案手法は,都市をブロックプログラムとビルディングプログラムという2つの解釈可能な構成要素に分解する。
CityGenAgentはプログラムとモデルの一般化から恩恵を受け、自然言語の編集と操作をサポートする。
- 参考スコア(独自算出の注目度): 22.929582644377277
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The automated generation of interactive 3D cities is a critical challenge with broad applications in autonomous driving, virtual reality, and embodied intelligence. While recent advances in generative models and procedural techniques have improved the realism of city generation, existing methods often struggle with high-fidelity asset creation, controllability, and manipulation. In this work, we introduce CityGenAgent, a natural language-driven framework for hierarchical procedural generation of high-quality 3D cities. Our approach decomposes city generation into two interpretable components, Block Program and Building Program. To ensure structural correctness and semantic alignment, we adopt a two-stage learning strategy: (1) Supervised Fine-Tuning (SFT). We train BlockGen and BuildingGen to generate valid programs that adhere to schema constraints, including non-self-intersecting polygons and complete fields; (2) Reinforcement Learning (RL). We design Spatial Alignment Reward to enhance spatial reasoning ability and Visual Consistency Reward to bridge the gap between textual descriptions and the visual modality. Benefiting from the programs and the models' generalization, CityGenAgent supports natural language editing and manipulation. Comprehensive evaluations demonstrate superior semantic alignment, visual quality, and controllability compared to existing methods, establishing a robust foundation for scalable 3D city generation.
- Abstract(参考訳): インタラクティブな3D都市の自動生成は、自動運転、バーチャルリアリティ、エンボディインテリジェンスにおける幅広い応用において重要な課題である。
生成モデルや手続き的手法の最近の進歩は、都市生成の現実性を改善する一方で、既存の手法は、しばしば高忠実な資産創出、制御可能性、操作に苦慮している。
本研究では,高品質な3D都市の階層的手続き生成のための自然言語駆動フレームワークであるCityGenAgentを紹介する。
提案手法は,都市をブロックプログラムとビルディングプログラムという2つの解釈可能な構成要素に分解する。
構造的正当性とセマンティックアライメントを確保するために,(1)スーパーバイザード・ファイン・チューニング(SFT)という2段階の学習戦略を採用した。
我々はBlockGenとBuildingGenを訓練し、非自己干渉ポリゴンや完全フィールドを含むスキーマ制約に準拠する有効なプログラムを生成する。
本研究では,空間的推論能力を高めるために空間的アライメント・リワードと,テキスト記述と視覚的モダリティのギャップを埋めるために視覚的一貫性・リワードを設計する。
CityGenAgentはプログラムとモデルの一般化から恩恵を受け、自然言語の編集と操作をサポートする。
包括的評価は,既存の手法に比べてセマンティックアライメント,視覚的品質,制御性に優れ,スケーラブルな3D都市生成のための堅牢な基盤を確立している。
関連論文リスト
- Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion [28.00050174055204]
Yo'Cityは、ユーザがカスタマイズして無限に拡張可能な3D都市生成を可能にする新しいエージェントフレームワークである。
連続的な都市の発展をシミュレートするために,Yo'Cityはユーザ対話型,関係誘導型拡張機構を導入した。
論文 参考訳(メタデータ) (2025-11-24T04:02:48Z) - Sat2RealCity: Geometry-Aware and Appearance-Controllable 3D Urban Generation from Satellite Imagery [12.88788681361607]
Sat2RealCity(サット2RealCity)は、現実世界の衛星画像から3D都市を生成するための幾何学的・外観制御可能なフレームワークである。
空間トポロジからビルディングインスタンスへの解釈可能な幾何学的生成を実現するためのOSMベースの空間先行戦略を導入する。
MLLMを用いた意味誘導型生成パイプラインを構築し,意味解釈と幾何学的再構成を行う。
論文 参考訳(メタデータ) (2025-11-14T16:42:03Z) - WorldGrow: Generating Infinite 3D World [75.81531067447203]
我々は、無限に拡張可能な3D世界、すなわちコヒーレントな幾何学と現実的な外観を持つ大規模で連続的な環境を生み出すという課題に取り組む。
本研究では,非有界な3次元シーン合成のための階層的フレームワークWorldGrowを提案する。
提案手法は,(1)高品質なシーンブロックを抽出し,シーン生成に適した3D構造化潜在表現を作成するデータキュレーションパイプライン,(2)コンテキスト認識シーン拡張を可能にする3Dブロックインペイント機構,(3)グローバルなレイアウトの妥当性と局所幾何学的/音声的忠実性の両立を保証する粗大かつ微細な生成戦略,の3つのコアコンポーネントを特徴とする。
論文 参考訳(メタデータ) (2025-10-24T17:39:52Z) - Proc-GS: Procedural Building Generation for City Assembly with 3D Gaussians [65.09942210464747]
資産の創出は労働集約的であり、設計ルールを開発するには専門的なスキルが必要である。
作成のための最近の生成モデルは、しばしばこれらのパターンを見落とし、視覚的忠実度が低く、スケーラビリティが制限される。
手続き的なコードを操作することで、このプロセスを合理化し、無限に多様な建物を生成することができます。
論文 参考訳(メタデータ) (2024-12-10T16:45:32Z) - CityX: Controllable Procedural Content Generation for Unbounded 3D Cities [50.10101235281943]
現在の生成法は多様性、可制御性または忠実度に乏しい。
本研究では,高忠実度生成のための手続き的コンテンツ生成(PCG)技術を利用する。
我々は,OSM,セマンティックマップ,衛星画像などのマルチモーダル命令を実行可能なプログラムに変換するマルチエージェントフレームワークを開発した。
提案手法はCityXと呼ばれ,多種多様で制御可能でリアルな3D都市景観の創出において,その優位性を実証するものである。
論文 参考訳(メタデータ) (2024-07-24T18:05:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。