論文の概要: Scaling Traffic Insights with AI and Language Model-Powered Camera Systems for Data-Driven Transportation Decision Making
- arxiv url: http://arxiv.org/abs/2510.09981v1
- Date: Sat, 11 Oct 2025 03:18:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.720448
- Title: Scaling Traffic Insights with AI and Language Model-Powered Camera Systems for Data-Driven Transportation Decision Making
- Title(参考訳): データ駆動型交通決定のためのAIと言語モデル駆動カメラシステムによる交通指標のスケーリング
- Authors: Fan Zuo, Donglin Zhou, Jingqin Gao, Kaan Ozbay,
- Abstract要約: 本研究では,大規模かつ高分解能な縦解析のためのエンドツーエンドAIベースのフレームワークを提案する。
局所都市シーンで訓練された微調整されたYOLOv11モデルにより,マルチモーダルトラフィック密度と分類基準をリアルタイムで抽出する。
2025年のニューヨーク市の混雑価格の早期展開で、約1000台の交通カメラから900万枚以上の画像を使ってシステムを検証した。
- 参考スコア(独自算出の注目度): 3.0273878903284266
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate, scalable traffic monitoring is critical for real-time and long-term transportation management, particularly during disruptions such as natural disasters, large construction projects, or major policy changes like New York City's first-in-the-nation congestion pricing program. However, widespread sensor deployment remains limited due to high installation, maintenance, and data management costs. While traffic cameras offer a cost-effective alternative, existing video analytics struggle with dynamic camera viewpoints and massive data volumes from large camera networks. This study presents an end-to-end AI-based framework leveraging existing traffic camera infrastructure for high-resolution, longitudinal analysis at scale. A fine-tuned YOLOv11 model, trained on localized urban scenes, extracts multimodal traffic density and classification metrics in real time. To address inconsistencies from non-stationary pan-tilt-zoom cameras, we introduce a novel graph-based viewpoint normalization method. A domain-specific large language model was also integrated to process massive data from a 24/7 video stream to generate frequent, automated summaries of evolving traffic patterns, a task far exceeding manual capabilities. We validated the system using over 9 million images from roughly 1,000 traffic cameras during the early rollout of NYC congestion pricing in 2025. Results show a 9% decline in weekday passenger vehicle density within the Congestion Relief Zone, early truck volume reductions with signs of rebound, and consistent increases in pedestrian and cyclist activity at corridor and zonal scales. Experiments showed that example-based prompts improved LLM's numerical accuracy and reduced hallucinations. These findings demonstrate the framework's potential as a practical, infrastructure-ready solution for large-scale, policy-relevant traffic monitoring with minimal human intervention.
- Abstract(参考訳): 正確な、スケーラブルな交通監視は、特に自然災害や大規模な建設計画、ニューヨーク市の最初の渋滞価格計画のような主要な政策変更など、リアルタイムおよび長期の交通管理にとって重要である。
しかし、高いインストール、メンテナンス、データ管理コストのために、広範なセンサーの配置は制限されている。
トラヒックカメラはコスト効率の良い代替手段を提供するが、既存のビデオ分析では、ダイナミックカメラの視点と大規模なカメラネットワークからの膨大なデータ量に苦戦している。
本研究では、既存の交通カメラインフラを活用して、大規模かつ高解像度の縦解析を行うエンドツーエンドAIベースのフレームワークを提案する。
局所都市シーンで訓練された微調整されたYOLOv11モデルにより,マルチモーダルトラフィック密度と分類基準をリアルタイムで抽出する。
非静止型パンティルトズームカメラの不整合に対処するために,新しいグラフベース視点正規化法を提案する。
ドメイン固有の大規模言語モデルも統合され、24/7のビデオストリームから大量のデータを処理し、進化するトラフィックパターンの頻繁かつ自動化された要約を生成する。
2025年のニューヨーク市の混雑価格の早期展開で、約1000台の交通カメラから900万枚以上の画像を使ってシステムを検証した。
その結果、渋滞救済区内の平日乗用車密度は9%減少し、リバウンドの兆候のある初期のトラック容積は減少し、回廊や地域スケールでの歩行者やサイクリストの活動は一貫して増加した。
実験の結果、サンプルベースのプロンプトによりLSMの数値精度が向上し、幻覚が減少した。
これらの知見は,人的介入を最小限に抑えた大規模かつ政策関連交通監視のための,実用的でインフラ対応のソリューションとしてのフレームワークの可能性を示している。
関連論文リスト
- Semantic Edge-Cloud Communication for Real-Time Urban Traffic Surveillance with ViT and LLMs over Mobile Networks [5.862522659881676]
インテリジェント・トランスポーテーション・システム(ITS)にとって、道路の安全を確保し、交通の流れを最適化し、車両軌道を追跡し、スマートシティでの衝突を防止するために、リアルタイムの都市交通監視が不可欠である。
本稿では,送信オーバヘッドを大幅に低減する意味コミュニケーションフレームワークを提案する。
従来の収穫画像では93%の精度で89%のLLM応答精度を維持しながら,データ伝送サイズを99.9%削減する。
論文 参考訳(メタデータ) (2025-09-25T14:53:36Z) - Spatio-Temporal Graph Neural Network for Urban Spaces: Interpolating Citywide Traffic Volume [4.188237759092441]
本稿では,新しい都市交通量推定手法であるGNNUI(Graph Neural Network for Urban Interpolation)を紹介する。
GNNUIは、学習のためにマスキングアルゴリズムを採用し、機能的な役割を捉えるためにノード機能を統合する。
このモデルに加えて、異なる交通手段をカバーする2つの新しいオープンスケール都市交通量ベンチマークを導入する。
論文 参考訳(メタデータ) (2025-05-07T13:34:00Z) - Leveraging Multimodal-LLMs Assisted by Instance Segmentation for Intelligent Traffic Monitoring [6.648291808015463]
本研究では,リアルタイムQuanser Interactive Labシミュレーションプラットフォーム上でのトラフィック監視作業にLLaVAビジュアルグラウンド・マルチモーダル大言語モデル(LLM)を利用する。
複数の都市に設置されたカメラはシミュレーションからリアルタイムの画像を収集し、LLaVAモデルに入力して分析を行う。
このシステムは、車両の位置を認識する精度が84.3%、ステアリング方向が76.4%で、従来のモデルを上回っている。
論文 参考訳(メタデータ) (2025-02-16T23:03:26Z) - Traffic Scene Parsing through the TSP6K Dataset [109.69836680564616]
高品質なピクセルレベルのアノテーションとインスタンスレベルのアノテーションを備えた,TSP6Kと呼ばれる特殊なトラフィック監視データセットを導入する。
データセットは、既存の運転シーンの何倍ものトラフィック参加者を持つ、より混雑した交通シーンをキャプチャする。
交通シーンの異なるセマンティック領域の詳細を復元するシーン解析のためのディテールリフィニングデコーダを提案する。
論文 参考訳(メタデータ) (2023-03-06T02:05:14Z) - Scalable and Real-time Multi-Camera Vehicle Detection,
Re-Identification, and Tracking [58.95210121654722]
理想化されたビデオストリームやキュレートされたビデオストリームの代わりに,リアルタイムで低解像度のCCTVを処理する,リアルタイムな都市規模のマルチカメラ車両追跡システムを提案する。
私たちの手法は、公共のリーダーボードで上位5人のパフォーマーにランク付けされています。
論文 参考訳(メタデータ) (2022-04-15T12:47:01Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - Traffic-Net: 3D Traffic Monitoring Using a Single Camera [1.1602089225841632]
我々は,1台のCCTVトラヒックカメラを用いたリアルタイムトラヒック監視のための実用的なプラットフォームを提供する。
車両・歩行者検出のためのカスタムYOLOv5ディープニューラルネットワークモデルとSORT追跡アルゴリズムの改良を行った。
また、短時間・長期の時間的ビデオデータストリームに基づく階層的なトラフィックモデリングソリューションも開発している。
論文 参考訳(メタデータ) (2021-09-19T16:59:01Z) - An Experimental Urban Case Study with Various Data Sources and a Model
for Traffic Estimation [65.28133251370055]
我々はスイスのチューリッヒの都市ネットワーク内の地域でビデオ計測による実験キャンペーンを組織した。
我々は,既存のサーマルカメラからの測定を確実にすることで,交通の流れや走行時間の観点からの交通状況の把握に注力する。
本稿では,様々なデータソースの融合による移動時間を推定するために,単純かつ効率的な多重線形回帰(MLR)モデルを提案する。
論文 参考訳(メタデータ) (2021-08-02T08:13:57Z) - Unsupervised Vehicle Counting via Multiple Camera Domain Adaptation [9.730985797769764]
市民の生活の質と都市環境を改善するためには, 都市内の車両流のモニタリングが不可欠である。
画像のヒンジを大量の注釈付きデータにカウントする現在の技術は、新しいカメラがシステムに追加されるにつれて、都市規模へのスケーラビリティを損なう。
我々は,複数のカメラ領域を適応させてラベル付きデータが少ない画像に基づく車両密度推定器を設計するための新しい手法を提案し,議論する。
論文 参考訳(メタデータ) (2020-04-20T13:00:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。