論文の概要: MajutsuCity: Language-driven Aesthetic-adaptive City Generation with Controllable 3D Assets and Layouts
- arxiv url: http://arxiv.org/abs/2511.20415v1
- Date: Tue, 25 Nov 2025 15:40:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.532333
- Title: MajutsuCity: Language-driven Aesthetic-adaptive City Generation with Controllable 3D Assets and Layouts
- Title(参考訳): MajutsuCity: 制御可能な3Dアセットとレイアウトを備えた言語駆動型審美都市生成
- Authors: Zilong Huang, Jun He, Xiaobin Huang, Ziyi Xiong, Yang Luo, Junyan Ye, Weijia Li, Yiping Chen, Ting Han,
- Abstract要約: 本稿では,3次元都市シーンを合成するための自然言語駆動適応フレームワークであるMajutsuCityを紹介する。
MajutsuCityは、制御可能なレイアウト、資産、材料で構成された都市であり、4段階のパイプラインで運営されている。
本研究では, 構造整合性, シーンの複雑さ, 材料忠実度, 照明雰囲気など, 重要な側面をカバーする, 実用的な評価指標の開発を行う。
- 参考スコア(独自算出の注目度): 37.22973657277324
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating realistic 3D cities is fundamental to world models, virtual reality, and game development, where an ideal urban scene must satisfy both stylistic diversity, fine-grained, and controllability. However, existing methods struggle to balance the creative flexibility offered by text-based generation with the object-level editability enabled by explicit structural representations. We introduce MajutsuCity, a natural language-driven and aesthetically adaptive framework for synthesizing structurally consistent and stylistically diverse 3D urban scenes. MajutsuCity represents a city as a composition of controllable layouts, assets, and materials, and operates through a four-stage pipeline. To extend controllability beyond initial generation, we further integrate MajutsuAgent, an interactive language-grounded editing agent} that supports five object-level operations. To support photorealistic and customizable scene synthesis, we also construct MajutsuDataset, a high-quality multimodal dataset} containing 2D semantic layouts and height maps, diverse 3D building assets, and curated PBR materials and skyboxes, each accompanied by detailed annotations. Meanwhile, we develop a practical set of evaluation metrics, covering key dimensions such as structural consistency, scene complexity, material fidelity, and lighting atmosphere. Extensive experiments demonstrate MajutsuCity reduces layout FID by 83.7% compared with CityDreamer and by 20.1% over CityCraft. Our method ranks first across all AQS and RDR scores, outperforming existing methods by a clear margin. These results confirm MajutsuCity as a new state-of-the-art in geometric fidelity, stylistic adaptability, and semantic controllability for 3D city generation. We expect our framework can inspire new avenues of research in 3D city generation. Our dataset and code will be released at https://github.com/LongHZ140516/MajutsuCity.
- Abstract(参考訳): リアルな3D都市を生成することは、世界モデル、バーチャルリアリティ、ゲーム開発に欠かせないものであり、理想的な都市シーンは、スタイリスティックな多様性、きめ細やかな粒度、制御性の両方を満たす必要がある。
しかし、既存の手法は、テキストベースの生成によって提供される創造的柔軟性と、明示的な構造表現によって実現されるオブジェクトレベルの編集可能性のバランスをとるのに苦労している。
構造的に整合性があり、スタイリスティックに多様な3D都市シーンを合成するための自然言語駆動で美的適応的なフレームワークであるMajutsuCityを紹介した。
MajutsuCityは、制御可能なレイアウト、資産、材料で構成された都市であり、4段階のパイプラインで運営されている。
5つのオブジェクトレベルの操作をサポートする対話型言語基底編集エージェントであるMajutsuAgentを統合する。
光リアルでカスタマイズ可能なシーン合成を支援するために,2次元のセマンティックレイアウトと高さマップ,多種多様な3D構築資産,PBR素材とスカイボックスを備えた高品質なマルチモーダルデータセットであるMajutsuDatasetを構築した。
一方、構造整合性、シーンの複雑さ、材料忠実度、照明雰囲気といった重要な側面を網羅する、実用的な評価指標の開発を行っている。
大規模な実験では、MajutsuCityはCityDreamerと比較してレイアウトFIDを83.7%削減し、CityCraftよりも20.1%削減した。
提案手法は,AQSとRDRのスコアの合計で第1位であり,既存の手法よりも明確なマージンで優れていた。
これらの結果から,MajutsuCityは幾何学的忠実度,スタイリスティック適応性,セマンティック制御性において新たな最先端技術であることが確認された。
我々は、我々のフレームワークが3D都市世代における新たな研究の道のりを刺激できることを期待している。
データセットとコードはhttps://github.com/LongHZ140516/MajutsuCity.comで公開されます。
関連論文リスト
- Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion [28.00050174055204]
Yo'Cityは、ユーザがカスタマイズして無限に拡張可能な3D都市生成を可能にする新しいエージェントフレームワークである。
連続的な都市の発展をシミュレートするために,Yo'Cityはユーザ対話型,関係誘導型拡張機構を導入した。
論文 参考訳(メタデータ) (2025-11-24T04:02:48Z) - Compositional Generative Model of Unbounded 4D Cities [56.36624718397362]
本研究では,4次元都市を創出するのに適した構成生成モデルを提案する。
CityDreamer4Dは、インスタンス編集、都市スタイル化、都市シミュレーションなど、さまざまなダウンストリームアプリケーションをサポートしている。
論文 参考訳(メタデータ) (2025-01-15T17:59:56Z) - CityX: Controllable Procedural Content Generation for Unbounded 3D Cities [50.10101235281943]
現在の生成法は多様性、可制御性または忠実度に乏しい。
本研究では,高忠実度生成のための手続き的コンテンツ生成(PCG)技術を利用する。
我々は,OSM,セマンティックマップ,衛星画像などのマルチモーダル命令を実行可能なプログラムに変換するマルチエージェントフレームワークを開発した。
提案手法はCityXと呼ばれ,多種多様で制御可能でリアルな3D都市景観の創出において,その優位性を実証するものである。
論文 参考訳(メタデータ) (2024-07-24T18:05:13Z) - CityCraft: A Real Crafter for 3D City Generation [25.7885801163556]
CityCraftは、都市シーン生成の多様性と品質の両方を強化するために設計された革新的なフレームワークである。
提案手法は,まず拡散変圧器(DiT)モデルを用いて,多種かつ制御可能な2次元都市レイアウトを生成する。
生成したレイアウトと都市計画に基づいて,Blenderとアセット検索モジュールを用いて,正確なアセット配置とシーン構築を行う。
論文 参考訳(メタデータ) (2024-06-07T14:49:00Z) - Urban Architect: Steerable 3D Urban Scene Generation with Layout Prior [43.14168074750301]
合成3Dレイアウト表現をテキストから3Dのパラダイムに導入し、さらに先行として機能する。
単純な幾何学的構造と明示的な配置関係を持つ意味的プリミティブの集合から構成される。
また,様々なシーン編集デモを行い,ステアブルな都市景観生成の力を示す。
論文 参考訳(メタデータ) (2024-04-10T06:41:30Z) - CityDreamer: Compositional Generative Model of Unbounded 3D Cities [44.203932215464214]
CityDreamerは、非有界な3D都市向けに特別に設計された合成モデルである。
我々は、鳥の視線シーン表現を採用し、インスタンス指向と物指向のニューラルフィールドの両方にボリュームレンダリングを採用する。
CityDreamerは、現実的な3D都市を生成するだけでなく、生成された都市内の局所的な編集でも、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-09-01T17:57:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。