論文の概要: Scene-Aware Urban Design: A Human-AI Recommendation Framework Using Co-Occurrence Embeddings and Vision-Language Models
- arxiv url: http://arxiv.org/abs/2511.06201v1
- Date: Sun, 09 Nov 2025 03:24:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.808438
- Title: Scene-Aware Urban Design: A Human-AI Recommendation Framework Using Co-Occurrence Embeddings and Vision-Language Models
- Title(参考訳): シーン対応都市デザイン:共起埋め込みと視覚言語モデルを用いた人間-AI勧告フレームワーク
- Authors: Rodrigo Gallardo, Oz Fishman, Alexander Htet Kyaw,
- Abstract要約: 本稿では、生成AIを用いて公共空間におけるマイクロスケール設計介入を提案するヒューマン・イン・ザ・ループ・コンピュータ・ビジョン・フレームワークを提案する。
- 参考スコア(独自算出の注目度): 41.99844472131922
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces a human-in-the-loop computer vision framework that uses generative AI to propose micro-scale design interventions in public space and support more continuous, local participation. Using Grounding DINO and a curated subset of the ADE20K dataset as a proxy for the urban built environment, the system detects urban objects and builds co-occurrence embeddings that reveal common spatial configurations. From this analysis, the user receives five statistically likely complements to a chosen anchor object. A vision language model then reasons over the scene image and the selected pair to suggest a third object that completes a more complex urban tactic. The workflow keeps people in control of selection and refinement and aims to move beyond top-down master planning by grounding choices in everyday patterns and lived experience.
- Abstract(参考訳): 本稿では、生成AIを用いて公共空間におけるマイクロスケールの設計介入を提案し、より継続的かつ局所的な参加を支援するヒューマン・イン・ザ・ループ・コンピュータ・ビジョン・フレームワークを提案する。
Grounding DINOとADE20Kデータセットのキュレートされたサブセットを都市構築環境のプロキシとして使用し、都市オブジェクトを検出し、共通空間構成を明らかにする共起埋め込みを構築する。
この分析から、ユーザは選択したアンカーオブジェクトに対する統計的に可能な5つの補完を受信する。
視覚言語モデルは、シーンイメージと選択されたペアに対して、より複雑な都市戦術を完成させる第3のオブジェクトを提案する。
このワークフローは、人々が選択と洗練をコントロールし、日々のパターンや生活経験に選択を根ざしてトップダウンのマスタープランニングを超えていくことを目的としています。
関連論文リスト
- GOPLA: Generalizable Object Placement Learning via Synthetic Augmentation of Human Arrangement [16.549660613125877]
GOPLAは、拡張された人間のデモンストレーションから一般化可能なオブジェクト配置を学ぶ階層的なフレームワークである。
データ不足を克服するため、私たちは、人間の配置デモを多様な合成トレーニングデータに拡張するスケーラブルなパイプラインを導入しました。
提案手法は, 位置決め精度と身体的妥当性を指標として, ランナアップよりも30.04ポイントの配置成功率を向上する。
論文 参考訳(メタデータ) (2025-10-16T12:38:14Z) - Hestia: Hierarchical Next-Best-View Exploration for Systematic Intelligent Autonomous Data Collection [23.427212631082025]
本研究は,階層的Next-Best-View Exploration for Systematic Intelligent Autonomous Data Collection (Hestia)を紹介する。
Hestiaはデータセットの選択、観察設計、アクション空間、報酬計算、学習スキームなどのコアコンポーネントを提案することで、次のベストビュータスクを体系的に定義する。
実験の結果、HestiaはNVIDIA IsaacLab環境で翻訳された3つのデータセットとオブジェクト設定に対して堅牢に動作していることがわかった。
論文 参考訳(メタデータ) (2025-08-01T18:27:23Z) - Interest Networks (iNETs) for Cities: Cross-Platform Insights and Urban Behavior Explanations [0.0]
位置情報に基づくソーシャルネットワーク(LBSN)は、iNETによる都市行動モデリングのためのリッチな基盤を提供する(関心ネットワーク)
この研究は、プラットフォーム間のiNET(Google PlacesとFoursquare)と空間的粒度を比較し、粗いレベルがより一貫性のあるクロスプラットフォームパターンを示すことを示している。
我々は,異なるユーザタイプに対して,高関心の都市部を予測するマルチレベル・説明可能なレコメンデーションシステムを開発した。
論文 参考訳(メタデータ) (2025-07-07T13:34:15Z) - Generative AI for Urban Planning: Synthesizing Satellite Imagery via Diffusion Models [9.385767746826286]
我々は、土地利用記述、インフラ、自然環境に照らした高忠実な衛星画像を生成するために、制御ネットで拡張された最先端の安定拡散モデルを適用した。
米国の主要3都市からのデータを用いて,提案した拡散モデルが,土地利用形態,道路網,水域などによって,現実的で多様な都市景観を生成することを示す。
我々のモデルは高いFIDとKIDのスコアを達成し、多様な都市環境におけるロバスト性を実証する。
論文 参考訳(メタデータ) (2025-05-13T04:55:38Z) - MetaUrban: An Embodied AI Simulation Platform for Urban Micromobility [52.0930915607703]
最近のロボティクスとエンボディードAIの進歩により、公共の都市空間はもはや人間専用ではない。
公共の都市空間における短距離移動のためのAIによって実現されるマイクロモビリティは、将来の交通システムにおいて重要な要素である。
本稿では,AI駆動型都市マイクロモビリティ研究のための構成シミュレーションプラットフォームであるMetaUrbanを紹介する。
論文 参考訳(メタデータ) (2024-07-11T17:56:49Z) - OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0399450848749]
本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文 参考訳(メタデータ) (2023-12-14T18:58:52Z) - Human-instructed Deep Hierarchical Generative Learning for Automated
Urban Planning [57.91323079939641]
我々は,最適な都市計画を生成するために,人間に指示された新しい深層階層生成モデルを構築した。
最初の段階は、機能ゾーンを発見するために、目標領域の格子に遅延関数をラベル付けすることである。
第2の段階は、都市機能投影を形成するための計画要件を理解することである。
第3の段階は、マルチアテンションを活用して、機能プロジェクションのゾーン・ゾーン・ピア依存関係をモデル化し、グリッドレベルの土地利用構成を生成することである。
論文 参考訳(メタデータ) (2022-12-01T23:06:41Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - Reimagining City Configuration: Automated Urban Planning via Adversarial
Learning [28.930624100994514]
都市計画は、土地利用形態を設計する努力を指す。
近年のディープラーニングの進歩は、機械が人間の能力で学習し、土地利用構成を自動的かつ迅速に計算することができるか、という問いを提起する動機となっている。
論文 参考訳(メタデータ) (2020-08-22T21:15:39Z) - Future Urban Scenes Generation Through Vehicles Synthesis [90.1731992199415]
本研究では,都市景観の視覚的外観を予測するためのディープラーニングパイプラインを提案する。
ループには解釈可能な情報が含まれ、各アクターは独立してモデル化される。
従来のCityFlowのシーン生成手法に比べて,このアプローチが優れていることを示す。
論文 参考訳(メタデータ) (2020-07-01T08:40:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。