論文の概要: Diagnosing Urban Street Vitality via a Visual-Semantic and Spatiotemporal Framework for Street-Level Economics
- arxiv url: http://arxiv.org/abs/2604.19798v1
- Date: Fri, 10 Apr 2026 10:21:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.090315
- Title: Diagnosing Urban Street Vitality via a Visual-Semantic and Spatiotemporal Framework for Street-Level Economics
- Title(参考訳): 街路レベル経済学のための視覚的・時空間的枠組みによる街路ビタリティの診断
- Authors: Xinxin Zhuo, Mengyuan Niu, Ruizhe Wang, Junyan Yang, Qiao Wang,
- Abstract要約: 我々は,ストリート・エコノミック・ビタリティ・ビタリティ・インデックス(SEVI)を通したビジュアル・セマンティック・フィールドベースのブランド構造フレームワークを提案する。
我々のアプローチは、インスタンスの看板、ガラスインターフェース、ストアフロントクロージャを通じて、物理的なセマンティック解析を統合する。
- 参考スコア(独自算出の注目度): 7.733233212558134
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Micro-scale street-level economic assessment is fundamental for precision spatial resource allocation. While Street View Imagery (SVI) advances urban sensing, existing approaches remain semantically superficial and overlook brand hierarchy heterogeneity and structural recession. To address this, we propose a visual-semantic and field-based spatiotemporal framework, operationalized via the Street Economic Vitality Index (SEVI). Our approach integrates physical and semantic streetscape parsing through instance segmentation of signboards, glass interfaces, and storefront closures. A dual-stage VLM-LLM pipeline standardizes signage into global hierarchies to quantify a spatially smoothed brand premium index. To overcome static SVI limitations, we introduce a temporal lag design using Location-Based Services (LBS) data to capture realized demand. Combined with a category-weighted Gaussian spillover model, we construct a three-dimensional diagnostic system covering Commercial Activity, Spatial Utilization, and Physical Environment. Experiments based on time-lagged geographically weighted regression across eight tidal periods in Nanjing reveal quasi-causal spatiotemporal heterogeneity. Street vibrancy arises from interactions between hierarchical brand clustering and mall-induced externalities. High-quality interfaces show peak attraction during midday and evening, while structural recession produces a lagged nighttime repulsion effect. The framework offers evidence-based support for precision spatial governance.
- Abstract(参考訳): 空間的資源配分の高精度化には,マイクロスケールストリートレベルの経済評価が不可欠である。
ストリートビュー画像(SVI)は都会のセンシングを進歩させるが、既存のアプローチは意味論的に表面的であり、ブランド階層の不均一性と構造的不規則性を見落としている。
そこで我々は,Street Economic Vitality Index (SEVI) を通じて運用されている視覚的セマンティックかつフィールドベースの時空間フレームワークを提案する。
我々のアプローチは、看板、ガラスインターフェース、店頭クロージャのインスタンスセグメンテーションを通じて、物理的および意味的なストリートスケープ解析を統合する。
二段VLM-LLMパイプラインは、グローバル階層への署名を標準化し、空間的に滑らかなブランドプレミアムインデックスを定量化する。
静的なSVI制限を克服するために、ロケーションベースサービス(LBS)データを用いた時間ラグ設計を導入する。
カテゴリー重み付きガウス流出モデルと組み合わせて,商業活動,空間利用,身体環境をカバーする3次元診断システムを構築した。
南京の8つの干潟期における地理的に重み付けされた経時変化に基づく実験により,準因果時空間の不均一性が明らかとなった。
街路の鮮明さは、階層的なブランドクラスタリングとモールによって引き起こされる外部性の間の相互作用から生じる。
高品質なインターフェースは昼間と夕方にピークアトラクションを示し、構造的不況は夜間の反発効果を低下させる。
このフレームワークは、精密空間ガバナンスのためのエビデンスベースのサポートを提供する。
関連論文リスト
- Event-based SLAM Benchmark for High-Speed Maneuvers [68.148886127117]
イベントベースのカメラはバイオインスパイアされたセンサーで、独立して、マイクロ秒の解像度で明るさの変化に非同期に反応する。
既存のイベントベースのアプローチは、高速操作による動きのぼかしを緩和することに成功したが、多くの制限に悩まされた。
イベントベースの状態推定のためのベンチマークフレームワークであるEvSLAMを導入する。
論文 参考訳(メタデータ) (2026-04-27T04:36:41Z) - Learning Multi-Modal Mobility Dynamics for Generalized Next Location Recommendation [51.00494428978262]
位置推薦タスクの移動力学を特徴付けるために,マルチモーダルな時空間知識を利用する。
まず、マルチモーダル表現のための統合時空間関係グラフ(STRG)を構築する。
第二に、異なるモーダルの空間時間グラフ表現を融合するゲーティング機構を設計する。
論文 参考訳(メタデータ) (2025-12-27T14:23:04Z) - Origin-Conditional Trajectory Encoding: Measuring Urban Configurational Asymmetries through Neural Decomposition [3.4560970433900366]
本研究では,原点に依存した非対称性を保ちながら空間的および運動的表現を学習する条件付き軌道エンコーダを提案する。
この枠組みは、都市ナビゲーションを共通の認知パターンと原点固有の空間的物語に分解する。
6つの総合都市の結果と北京の西京地区における実世界検証の結果は、都市形態が体系的な認知的不平等を生み出すことを示している。
論文 参考訳(メタデータ) (2025-12-03T12:54:16Z) - Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.461213497603154]
作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。
Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。
高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文 参考訳(メタデータ) (2025-10-27T03:52:45Z) - Interpretable Multimodal Framework for Human-Centered Street Assessment: Integrating Visual-Language Models for Perceptual Urban Diagnostics [0.0]
本稿では,新しいマルチモーダルストリート評価フレームワーク(MSEF)を紹介する。
パラメータ効率適応のためにLoRAとP-Tuning v2を用いてフレームワークを微調整する。
このモデルは、客観的特徴に関するF1スコアの0.84と、集約された居住者の知覚との89.3%の一致を達成している。
論文 参考訳(メタデータ) (2025-06-05T14:34:04Z) - Rethinking Temporal Fusion with a Unified Gradient Descent View for 3D Semantic Occupancy Prediction [62.69089767730514]
視覚に基づく3次元意味的占有予測(VisionOcc)のための時間融合法であるGAFusionを提案する。
これは、VisionOccフレームワーク内の時間融合の未調査の側面を開き、時間的手がかりと融合戦略の両方に焦点を当てる。
論文 参考訳(メタデータ) (2025-04-17T14:05:33Z) - HGAurban: Heterogeneous Graph Autoencoding for Urban Spatial-Temporal Learning [36.80668790442231]
重要な課題は、空間時空間グラフで意味のある領域表現を学習する既存のニューラルネットワークの能力を制限する、空間時空間データのノイズとスパースの性質にある。
都市データ表現のための自己教師付き生成学習を生かしたヘテロジニアスな空間時間グラフマスク型オートエンコーダであるHurbanを提案する。
論文 参考訳(メタデータ) (2024-10-14T07:33:33Z) - How does spatial structure affect psychological restoration? A method
based on Graph Neural Networks and Street View Imagery [4.989590204932523]
都市部における空間構造と復元品質の関係を明らかにするために,空間依存型グラフニューラルネットワーク(GNN)を提案する。
道路のトポロジ的関係を非ユークリッド的なデータ構造としてモデル化した都市レベルのグラフは、復元の質を測定するために用いられた。
論文 参考訳(メタデータ) (2023-11-29T05:20:10Z) - Nothing Stands Still: A Spatiotemporal Benchmark on 3D Point Cloud Registration Under Large Geometric and Temporal Change [82.31647863785923]
人工空間の3次元幾何学地図の構築は、基本的なコンピュータビジョンとロボット工学である。
Not Stands Still (NSS)ベンチマークは、大きな空間的および時間的変化を行う3Dシーンの時間的登録に焦点を当てている。
NSSの一環として,建設中または改修中の大規模建築屋内環境において,3次元点雲のデータセットを連続的に取得する。
論文 参考訳(メタデータ) (2023-11-15T20:09:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。