論文の概要: From Street Views to Urban Science: Discovering Road Safety Factors with Multimodal Large Language Models
- arxiv url: http://arxiv.org/abs/2506.02242v1
- Date: Mon, 02 Jun 2025 20:40:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.075489
- Title: From Street Views to Urban Science: Discovering Road Safety Factors with Multimodal Large Language Models
- Title(参考訳): ストリートビューから都市科学へ:マルチモーダル大言語モデルによる道路安全要因の発見
- Authors: Yihong Tang, Ao Qu, Xujing Yu, Weipeng Deng, Jun Ma, Jinhua Zhao, Lijun Sun,
- Abstract要約: 都市・交通研究は長い間、重要な変数と道路安全のような社会的結果の間の統計的に意味のある関係を明らかにすることを模索してきた。
解釈可能な仮説推論のためのマルチモーダル大言語モデル(MLLM)に基づくアプローチを提案する。
- 参考スコア(独自算出の注目度): 18.69630838520861
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Urban and transportation research has long sought to uncover statistically meaningful relationships between key variables and societal outcomes such as road safety, to generate actionable insights that guide the planning, development, and renewal of urban and transportation systems. However, traditional workflows face several key challenges: (1) reliance on human experts to propose hypotheses, which is time-consuming and prone to confirmation bias; (2) limited interpretability, particularly in deep learning approaches; and (3) underutilization of unstructured data that can encode critical urban context. Given these limitations, we propose a Multimodal Large Language Model (MLLM)-based approach for interpretable hypothesis inference, enabling the automated generation, evaluation, and refinement of hypotheses concerning urban context and road safety outcomes. Our method leverages MLLMs to craft safety-relevant questions for street view images (SVIs), extract interpretable embeddings from their responses, and apply them in regression-based statistical models. UrbanX supports iterative hypothesis testing and refinement, guided by statistical evidence such as coefficient significance, thereby enabling rigorous scientific discovery of previously overlooked correlations between urban design and safety. Experimental evaluations on Manhattan street segments demonstrate that our approach outperforms pretrained deep learning models while offering full interpretability. Beyond road safety, UrbanX can serve as a general-purpose framework for urban scientific discovery, extracting structured insights from unstructured urban data across diverse socioeconomic and environmental outcomes. This approach enhances model trustworthiness for policy applications and establishes a scalable, statistically grounded pathway for interpretable knowledge discovery in urban and transportation studies.
- Abstract(参考訳): 都市・交通研究は長い間、重要な変数と道路安全のような社会的成果の間の統計的に意味のある関係を明らかにすることを模索し、都市・交通システムの計画、開発、更新を導く実用的な洞察を生み出してきた。
しかし、従来のワークフローは、(1)人間の専門家に仮説の提案を頼りにし、バイアスの確認に時間がかかりやすく、(2)限定的な解釈可能性、特に深層学習におけるアプローチ、(3)重要な都市環境をエンコードできる非構造的データの未利用など、いくつかの大きな課題に直面している。
これらの制約を考慮し,都市環境と道路安全に関する仮説の自動生成,評価,洗練を可能にする,MLLMに基づく仮説推論手法を提案する。
提案手法はMLLMを用いてストリートビュー画像(SVI)の安全関連質問を作成し,その応答から解釈可能な埋め込みを抽出し,回帰に基づく統計モデルに適用する。
UrbanXは反復仮説テストと改良をサポートし、係数の意義などの統計的証拠によって導かれることにより、これまで見過ごされていた都市設計と安全性の相関関係の厳密な科学的発見を可能にする。
マンハッタンの街路セグメントにおける実験的な評価は,提案手法が事前学習モデルより優れており,完全な解釈性を実現していることを示している。
道路安全以外にも、UrbanXは都市科学発見のための汎用的なフレームワークとして機能し、様々な社会経済と環境の成果から構造化されていない都市データから構造化された洞察を抽出することができる。
このアプローチは、政策適用に対するモデル信頼性を高め、都市・交通研究における解釈可能な知識発見のためのスケーラブルで統計的に基盤付けられた経路を確立する。
関連論文リスト
- Reimagining Urban Science: Scaling Causal Inference with Large Language Models [39.231736674554995]
本研究は,構造的ギャップを識別するための研究トピック,データソース,方法論的アプローチを分類する分析によって,現在の都市因果研究を考察する。
本稿では,仮説生成,データエンジニアリング,実験設計と実行,政策勧告による結果解釈の4つの異なるモジュールエージェントからなるAutoUrbanCI概念フレームワークを提案する。
本稿では,厳密性と透明性の評価基準を提案し,人間とAIのコラボレーション,エクイティ,説明責任に対する影響を考察する。
論文 参考訳(メタデータ) (2025-04-15T16:58:11Z) - Urban Safety Perception Assessments via Integrating Multimodal Large Language Models with Street View Images [5.799322786332704]
都市の安全知覚を測定することは、伝統的に人的資源に大きく依存する重要かつ複雑な作業である。
マルチモーダル大規模言語モデル(MLLM)の最近の進歩は、強力な推論と分析能力を示している。
都市全体の安全指標を迅速に評価するための,CLIP機能とK-Nearest Neighbors(K-NN)検索に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-07-29T06:03:13Z) - Reinforcement Learning with Human Feedback for Realistic Traffic
Simulation [53.85002640149283]
効果的なシミュレーションの鍵となる要素は、人間の知識と整合した現実的な交通モデルの導入である。
本研究では,現実主義に対する人間の嗜好のニュアンスを捉えることと,多様な交通シミュレーションモデルを統合することの2つの主な課題を明らかにする。
論文 参考訳(メタデータ) (2023-09-01T19:29:53Z) - Uncertainty Quantification for Image-based Traffic Prediction across
Cities [63.136794104678025]
不確実量化(UQ)法は確率論的推論を誘導するためのアプローチを提供する。
複数の都市にまたがる大規模画像ベース交通データセットへの適用について検討する。
モスクワ市を事例として,交通行動に対する時間的・空間的影響を考察した。
論文 参考訳(メタデータ) (2023-08-11T13:35:52Z) - A Study of Situational Reasoning for Traffic Understanding [63.45021731775964]
トラフィック領域における状況推論のための3つの新しいテキストベースのタスクを考案する。
先行作業における言語推論タスクにまたがる一般化能力を示す知識強化手法を4つ採用する。
本稿では,データ分割におけるモデル性能の詳細な解析を行い,モデル予測を分類的に検討する。
論文 参考訳(メタデータ) (2023-06-05T01:01:12Z) - Methodological Foundation of a Numerical Taxonomy of Urban Form [62.997667081978825]
本稿では, 生物系統学から得られた都市形態の数値分類法を提案する。
我々は同質の都市組織タイプを導出し、それら間の全体形態的類似性を決定することにより、都市形態の階層的分類を生成する。
フレーミングとプレゼンを行った後、プラハとアムステルダムの2都市でテストを行った。
論文 参考訳(メタデータ) (2021-04-30T12:47:52Z) - Congestion-aware Multi-agent Trajectory Prediction for Collision
Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。
学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。
実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文 参考訳(メタデータ) (2021-03-26T02:42:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。