論文の概要: Leveraging Multimodal-LLMs Assisted by Instance Segmentation for Intelligent Traffic Monitoring
- arxiv url: http://arxiv.org/abs/2502.11304v1
- Date: Sun, 16 Feb 2025 23:03:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:17:13.627418
- Title: Leveraging Multimodal-LLMs Assisted by Instance Segmentation for Intelligent Traffic Monitoring
- Title(参考訳): インテリジェントトラフィックモニタリングのためのインスタンスセグメンテーションによるマルチモーダルLLMの活用
- Authors: Murat Arda Onsu, Poonam Lohan, Burak Kantarci, Aisha Syed, Matthew Andrews, Sean Kennedy,
- Abstract要約: 本研究では,リアルタイムQuanser Interactive Labシミュレーションプラットフォーム上でのトラフィック監視作業にLLaVAビジュアルグラウンド・マルチモーダル大言語モデル(LLM)を利用する。
複数の都市に設置されたカメラはシミュレーションからリアルタイムの画像を収集し、LLaVAモデルに入力して分析を行う。
このシステムは、車両の位置を認識する精度が84.3%、ステアリング方向が76.4%で、従来のモデルを上回っている。
- 参考スコア(独自算出の注目度): 6.648291808015463
- License:
- Abstract: A robust and efficient traffic monitoring system is essential for smart cities and Intelligent Transportation Systems (ITS), using sensors and cameras to track vehicle movements, optimize traffic flow, reduce congestion, enhance road safety, and enable real-time adaptive traffic control. Traffic monitoring models must comprehensively understand dynamic urban conditions and provide an intuitive user interface for effective management. This research leverages the LLaVA visual grounding multimodal large language model (LLM) for traffic monitoring tasks on the real-time Quanser Interactive Lab simulation platform, covering scenarios like intersections, congestion, and collisions. Cameras placed at multiple urban locations collect real-time images from the simulation, which are fed into the LLaVA model with queries for analysis. An instance segmentation model integrated into the cameras highlights key elements such as vehicles and pedestrians, enhancing training and throughput. The system achieves 84.3% accuracy in recognizing vehicle locations and 76.4% in determining steering direction, outperforming traditional models.
- Abstract(参考訳): スマートシティやインテリジェントトランスポーテーションシステム(ITS)では,センサとカメラを用いて車両の動きを追跡し,交通の流れを最適化し,渋滞を低減し,道路安全を向上し,リアルタイムな交通制御を可能にする,堅牢で効率的な交通監視システムが不可欠である。
交通監視モデルは、動的な都市環境を包括的に理解し、効果的な管理のための直感的なユーザインタフェースを提供する必要がある。
本研究では,LLaVAビジュアルグラウンド・マルチモーダル・大規模言語モデル(LLM)をリアルタイムクアンサー・インタラクティブ・ラボ・シミュレーション・プラットフォーム上での交通監視作業に適用し,交差点,混雑,衝突などのシナリオをカバーする。
複数の都市に設置されたカメラはシミュレーションからリアルタイムの画像を収集し、LLaVAモデルに入力して分析を行う。
カメラに組み込まれたインスタンスセグメンテーションモデルは、車両や歩行者などの重要な要素を強調し、トレーニングとスループットを向上させる。
このシステムは、車両の位置を認識する精度が84.3%、ステアリング方向が76.4%で、従来のモデルを上回っている。
関連論文リスト
- GARLIC: GPT-Augmented Reinforcement Learning with Intelligent Control for Vehicle Dispatching [81.82487256783674]
GARLIC: GPT拡張強化学習のフレームワーク。
本稿では,GPT強化強化学習とインテリジェント制御のフレームワークであるGARLICについて紹介する。
論文 参考訳(メタデータ) (2024-08-19T08:23:38Z) - Traffic control using intelligent timing of traffic lights with reinforcement learning technique and real-time processing of surveillance camera images [0.0]
信号機の最適タイミングを判定し、複数のパラメータに従って適用する。
YOLOv9-Cモデルを用いた車両検出には深層学習法が用いられた。
イランの車の画像にトランスファーラーニングとモデルの再訓練を併用することで、モデルの精度が向上した。
論文 参考訳(メタデータ) (2024-05-22T00:04:32Z) - Real-Time Detection and Analysis of Vehicles and Pedestrians using Deep Learning [0.0]
現在の交通監視システムは、小さな物体や歩行者をリアルタイムで効果的に認識する上で大きな困難に直面している。
本研究は、車や人の正確なリアルタイム認識のための複雑な視覚入力を処理できる高度なディープラーニングフレームワークの作成と検証に重点を置いている。
YOLOv8 大型モデルは、特に歩行者認識において最も効果的で、精度と堅牢性が高いことが判明した。
論文 参考訳(メタデータ) (2024-04-11T18:42:14Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Real-Time Vehicle Detection and Urban Traffic Behavior Analysis Based on
UAV Traffic Videos on Mobile Devices [14.30857727025523]
本稿では,ドローン技術,iOS開発,深層学習技術を統合し,モバイル端末上での交通映像取得,物体検出,物体追跡,交通行動解析機能を統合する。
車両物体検出は精度98.27%、リコール率87.93%に達し、リアルタイム処理能力は毎秒30フレームで安定している。
論文 参考訳(メタデータ) (2024-02-26T02:09:36Z) - TrafficBots: Towards World Models for Autonomous Driving Simulation and
Motion Prediction [149.5716746789134]
我々は,データ駆動型交通シミュレーションを世界モデルとして定式化できることを示した。
動作予測とエンドツーエンドの運転に基づくマルチエージェントポリシーであるTrafficBotsを紹介する。
オープンモーションデータセットの実験は、TrafficBotsが現実的なマルチエージェント動作をシミュレートできることを示している。
論文 参考訳(メタデータ) (2023-03-07T18:28:41Z) - Traffic-Net: 3D Traffic Monitoring Using a Single Camera [1.1602089225841632]
我々は,1台のCCTVトラヒックカメラを用いたリアルタイムトラヒック監視のための実用的なプラットフォームを提供する。
車両・歩行者検出のためのカスタムYOLOv5ディープニューラルネットワークモデルとSORT追跡アルゴリズムの改良を行った。
また、短時間・長期の時間的ビデオデータストリームに基づく階層的なトラフィックモデリングソリューションも開発している。
論文 参考訳(メタデータ) (2021-09-19T16:59:01Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Artificial Intelligence Enabled Traffic Monitoring System [3.085453921856008]
本稿では,深層畳み込みニューラルネットワークを用いたリアルタイム交通映像の自動監視手法を提案する。
提案システムは、さまざまなトラフィック監視ニーズを自動化するために、最先端のディープラーニングアルゴリズムをデプロイする。
論文 参考訳(メタデータ) (2020-10-02T22:28:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。