論文の概要: UrbanSense:AFramework for Quantitative Analysis of Urban Streetscapes leveraging Vision Large Language Models
- arxiv url: http://arxiv.org/abs/2506.10342v1
- Date: Thu, 12 Jun 2025 04:35:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 15:37:22.568424
- Title: UrbanSense:AFramework for Quantitative Analysis of Urban Streetscapes leveraging Vision Large Language Models
- Title(参考訳): 都市感:視覚大言語モデルを用いた都市景観の定量的分析のための枠組み
- Authors: Jun Yin, Jing Zhong, Peilin Li, Pengyu Zeng, Miao Zhang, Ran Luo, Shuai Lu,
- Abstract要約: 都市文化と建築様式は、地理的、年代学的、歴史的、社会政治的な要因により、都市によって大きく異なる。
本稿では,視覚言語モデルに基づくマルチモーダル・リサーチ・フレームワークを提案する。
- 参考スコア(独自算出の注目度): 25.35768485637194
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Urban cultures and architectural styles vary significantly across cities due to geographical, chronological, historical, and socio-political factors. Understanding these differences is essential for anticipating how cities may evolve in the future. As representative cases of historical continuity and modern innovation in China, Beijing and Shenzhen offer valuable perspectives for exploring the transformation of urban streetscapes. However, conventional approaches to urban cultural studies often rely on expert interpretation and historical documentation, which are difficult to standardize across different contexts. To address this, we propose a multimodal research framework based on vision-language models, enabling automated and scalable analysis of urban streetscape style differences. This approach enhances the objectivity and data-driven nature of urban form research. The contributions of this study are as follows: First, we construct UrbanDiffBench, a curated dataset of urban streetscapes containing architectural images from different periods and regions. Second, we develop UrbanSense, the first vision-language-model-based framework for urban streetscape analysis, enabling the quantitative generation and comparison of urban style representations. Third, experimental results show that Over 80% of generated descriptions pass the t-test (p less than 0.05). High Phi scores (0.912 for cities, 0.833 for periods) from subjective evaluations confirm the method's ability to capture subtle stylistic differences. These results highlight the method's potential to quantify and interpret urban style evolution, offering a scientifically grounded lens for future design.
- Abstract(参考訳): 都市文化と建築様式は、地理的、年代学的、歴史的、社会政治的な要因により、都市によって大きく異なる。
これらの違いを理解することは、将来都市がどのように進化するかを予測するために不可欠である。
中国における歴史的連続性と近代的革新の代表例として、北京と深センは都市景観の変容を探求するための貴重な視点を提供している。
しかし、従来の都市文化研究のアプローチは専門家の解釈や歴史資料に頼っていることが多く、様々な文脈で標準化が難しい。
そこで我々は,視覚言語モデルに基づくマルチモーダル・リサーチ・フレームワークを提案する。
このアプローチは、都市形態研究の客観性とデータ駆動性を高める。
この研究の貢献は以下の通りである。 まず、異なる時代や地域の建築図を含む都市景観のキュレートされたデータセットであるUrbanDiffBenchを構築する。
第2に,都市景観分析のための視覚言語モデルに基づく最初のフレームワークであるUrbanSenseを開発し,都市スタイル表現の定量的生成と比較を可能にする。
第3に、実験の結果、生成された記述の80%以上がtテストに合格している(pは0.05未満)。
主観的評価から高Phiスコア(都市は0.912、期間は0.833)は、微妙な様式的差異を捉える方法の能力を裏付けるものである。
これらの結果は、都市スタイルの進化を定量化し解釈する手法の可能性を強調し、将来の設計に科学的に基礎を置いたレンズを提供する。
関連論文リスト
- StreetviewLLM: Extracting Geographic Information Using a Chain-of-Thought Multimodal Large Language Model [12.789465279993864]
地理空間予測は災害管理、都市計画、公衆衛生など様々な分野において重要である。
提案するStreetViewLLMは,大規模言語モデルと連鎖推論とマルチモーダルデータソースを統合した新しいフレームワークである。
このモデルは、香港、東京、シンガポール、ロサンゼルス、ニューヨーク、ロンドン、パリを含む7つの世界都市に適用されている。
論文 参考訳(メタデータ) (2024-11-19T05:15:19Z) - CityPulse: Fine-Grained Assessment of Urban Change with Street View Time
Series [12.621355888239359]
都市変革は、個人と地域社会の両方に大きな社会的影響を及ぼす。
本研究では,大規模に構築された環境における物理的変化を効果的に捉えるために,エンドツーエンドの変更検出モデルを提案する。
我々のアプローチは既存のデータセットを補完し、都市の変化をきめ細やかに正確に評価する可能性がある。
論文 参考訳(メタデータ) (2024-01-02T08:57:09Z) - Unified Data Management and Comprehensive Performance Evaluation for
Urban Spatial-Temporal Prediction [Experiment, Analysis & Benchmark] [78.05103666987655]
この研究は、多様な都市空間時間データセットにアクセスし活用する際の課題に対処する。
都市空間・時空間のビッグデータ用に設計された統合ストレージフォーマットであるアトミックファイルを導入し,40種類の多様なデータセットでその有効性を検証する。
多様なモデルとデータセットを使用して広範な実験を行い、パフォーマンスリーダーボードを確立し、有望な研究方向性を特定する。
論文 参考訳(メタデータ) (2023-08-24T16:20:00Z) - A Contextual Master-Slave Framework on Urban Region Graph for Urban
Village Detection [68.84486900183853]
都市域を階層的にモデル化する都市域グラフ(URG)を構築した。
そこで我々は,都市部をURGから効果的に検出する新しいコンテキスト・マスタ・スレーブ・フレームワークを設計した。
提案手法は,都市部における紫外線検出の一般性と特異性のバランスをとることができる。
論文 参考訳(メタデータ) (2022-11-26T18:17:39Z) - GANs for Urban Design [0.0]
本論文で検討されたトピックは、都市ブロックの設計にGenerative Adversarial Networksを応用することである。
この研究は、都市の形態学的特性に適応できる柔軟なモデルを提示する。
論文 参考訳(メタデータ) (2021-05-04T19:50:24Z) - Methodological Foundation of a Numerical Taxonomy of Urban Form [62.997667081978825]
本稿では, 生物系統学から得られた都市形態の数値分類法を提案する。
我々は同質の都市組織タイプを導出し、それら間の全体形態的類似性を決定することにより、都市形態の階層的分類を生成する。
フレーミングとプレゼンを行った後、プラハとアムステルダムの2都市でテストを行った。
論文 参考訳(メタデータ) (2021-04-30T12:47:52Z) - From Paris to Berlin: Discovering Fashion Style Influences Around the
World [108.58097776743331]
本稿では,服を着る人々の日常的なイメージから,ファッションの影響を定量化する。
我々は,他の都市がどの都市に影響を及ぼすかを,そのスタイルの伝播の観点から検出するアプローチを導入する。
次に、発見された影響パターンを活用して予測モデルに通知し、任意の都市における任意のスタイルの人気を予測します。
論文 参考訳(メタデータ) (2020-04-03T00:54:23Z) - Indexical Cities: Articulating Personal Models of Urban Preference with
Geotagged Data [0.0]
本研究は,都市空間における個人の嗜好を特徴付け,特定の観測者に対する未知の好ましくない場所のスペクトルを予測する。
多くの都市認識研究とは異なり、我々の意図は都市品質の客観的な尺度を提供する手段ではなく、都市や都市についての個人的な見解を表現することである。
論文 参考訳(メタデータ) (2020-01-23T11:00:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。