論文の概要: From Image Generation to Infrastructure Design: a Multi-agent Pipeline for Street Design Generation
- arxiv url: http://arxiv.org/abs/2509.05469v1
- Date: Fri, 05 Sep 2025 19:49:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.522972
- Title: From Image Generation to Infrastructure Design: a Multi-agent Pipeline for Street Design Generation
- Title(参考訳): 画像生成からインフラ設計へ:街路設計のためのマルチエージェントパイプライン
- Authors: Chenguang Wang, Xiang Yan, Yilong Dai, Ziyi Wang, Susu Xu,
- Abstract要約: 本研究では,現実世界のストリートビュー画像に基づいて,自転車施設を直接編集・再設計するマルチエージェントシステムを提案する。
このフレームワークはレーンのローカライゼーション、迅速な最適化、設計生成、自動評価を統合し、現実的で文脈的に適切な設計を合成する。
- 参考スコア(独自算出の注目度): 9.255248190497515
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Realistic visual renderings of street-design scenarios are essential for public engagement in active transportation planning. Traditional approaches are labor-intensive, hindering collective deliberation and collaborative decision-making. While AI-assisted generative design shows transformative potential by enabling rapid creation of design scenarios, existing generative approaches typically require large amounts of domain-specific training data and struggle to enable precise spatial variations of design/configuration in complex street-view scenes. We introduce a multi-agent system that edits and redesigns bicycle facilities directly on real-world street-view imagery. The framework integrates lane localization, prompt optimization, design generation, and automated evaluation to synthesize realistic, contextually appropriate designs. Experiments across diverse urban scenarios demonstrate that the system can adapt to varying road geometries and environmental conditions, consistently yielding visually coherent and instruction-compliant results. This work establishes a foundation for applying multi-agent pipelines to transportation infrastructure planning and facility design.
- Abstract(参考訳): ストリートデザインシナリオの現実的な視覚レンダリングは、アクティブな交通計画における公的な関与に不可欠である。
伝統的なアプローチは労働集約的であり、集団的な熟考と協調的な意思決定を妨げる。
AI支援による生成設計は、設計シナリオの迅速な作成を可能にすることによって、変革的なポテンシャルを示すが、既存の生成アプローチでは、通常、大量のドメイン固有のトレーニングデータを必要とし、複雑なストリートビューシーンにおける設計/構成の正確な空間的バリエーションを実現するのに苦労する。
本研究では,現実世界のストリートビュー画像に基づいて,自転車施設を直接編集・再設計するマルチエージェントシステムを提案する。
このフレームワークはレーンのローカライゼーション、迅速な最適化、設計生成、自動評価を統合し、現実的で文脈的に適切な設計を合成する。
様々な都市シナリオにおける実験により、システムは様々な道路測地や環境条件に適応でき、一貫して視覚的に一貫性があり、指示に従順な結果が得られることを示した。
この研究は、交通インフラ計画と施設設計にマルチエージェントパイプラインを適用する基盤を確立する。
関連論文リスト
- Generative AI for Urban Design: A Stepwise Approach Integrating Human Expertise with Multimodal Diffusion Models [16.15278208238539]
本研究では,マルチモーダル拡散モデルと人間の専門知識を統合した段階的都市デザインフレームワークを提案する。
単一のエンドツーエンドのプロセスで結果を生成するのではなく、このフレームワークは、確立された都市デザインに合わせた3つの重要なステージにプロセスを分割する。
各段階で、レンダリング拡散モデルは、テキストプロンプトと画像ベースの制約に基づいて予備設計を生成する。
論文 参考訳(メタデータ) (2025-05-30T06:33:48Z) - CreatiDesign: A Unified Multi-Conditional Diffusion Transformer for Creative Graphic Design [69.83433430133302]
CreatiDesignは、モデルアーキテクチャとデータセット構築の両方をカバーする、自動グラフィック設計のための体系的なソリューションである。
まず、異種設計要素の柔軟かつ正確な統合を可能にする統合されたマルチ条件駆動アーキテクチャを設計する。
さらに,各条件が指定された画像領域を正確に制御することを保証するため,マルチモーダルアテンションマスク機構を提案する。
論文 参考訳(メタデータ) (2025-05-25T12:14:23Z) - Generative AI for Urban Planning: Synthesizing Satellite Imagery via Diffusion Models [9.385767746826286]
我々は、土地利用記述、インフラ、自然環境に照らした高忠実な衛星画像を生成するために、制御ネットで拡張された最先端の安定拡散モデルを適用した。
米国の主要3都市からのデータを用いて,提案した拡散モデルが,土地利用形態,道路網,水域などによって,現実的で多様な都市景観を生成することを示す。
我々のモデルは高いFIDとKIDのスコアを達成し、多様な都市環境におけるロバスト性を実証する。
論文 参考訳(メタデータ) (2025-05-13T04:55:38Z) - PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は,ユーザのデザイン意図に基づいて編集可能なポスターを生成する自動テキスト投稿システムを開発した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z) - Street-View Image Generation from a Bird's-Eye View Layout [95.36869800896335]
近年,Bird's-Eye View (BEV) の知覚が注目されている。
自動運転のためのデータ駆動シミュレーションは、最近の研究の焦点となっている。
本稿では,現実的かつ空間的に一貫した周辺画像を合成する条件生成モデルであるBEVGenを提案する。
論文 参考訳(メタデータ) (2023-01-11T18:39:34Z) - Generative methods for Urban design and rapid solution space exploration [13.222198221605701]
本研究では,テンソル場に基づく都市モデルツールキットの実装について紹介する。
提案手法は,ウォーターフロントエッジ,地形,ビュー軸,既存道路,ランドマーク,非幾何学的設計入力などのコンテキスト制約を符号化する。
これによりユーザーは、モデル入力がほとんどない現実世界の都市に似た、多様な都市ファブリック構成を作成できる。
論文 参考訳(メタデータ) (2022-12-13T17:58:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。