論文の概要: HazardNet: A Small-Scale Vision Language Model for Real-Time Traffic Safety Detection at Edge Devices
- arxiv url: http://arxiv.org/abs/2502.20572v1
- Date: Thu, 27 Feb 2025 22:21:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-03 13:43:49.911812
- Title: HazardNet: A Small-Scale Vision Language Model for Real-Time Traffic Safety Detection at Edge Devices
- Title(参考訳): HazardNet:エッジデバイスにおけるリアルタイム交通安全検出のための小型ビジョン言語モデル
- Authors: Mohammad Abu Tami, Mohammed Elhenawy, Huthaifa I. Ashqar,
- Abstract要約: 本稿では,交通安全を高めるために設計された小型ビジョン言語モデルHazardNetを紹介する。
既存のQwen2-VL-2Bモデルを微調整してHazardNetを構築した。
本稿では,現実のシナリオでHazardNetをトレーニングするために構築された,視覚質問回答データセットHazardQAを紹介する。
- 参考スコア(独自算出の注目度): 5.233512464561313
- License:
- Abstract: Traffic safety remains a vital concern in contemporary urban settings, intensified by the increase of vehicles and the complicated nature of road networks. Traditional safety-critical event detection systems predominantly rely on sensor-based approaches and conventional machine learning algorithms, necessitating extensive data collection and complex training processes to adhere to traffic safety regulations. This paper introduces HazardNet, a small-scale Vision Language Model designed to enhance traffic safety by leveraging the reasoning capabilities of advanced language and vision models. We built HazardNet by fine-tuning the pre-trained Qwen2-VL-2B model, chosen for its superior performance among open-source alternatives and its compact size of two billion parameters. This helps to facilitate deployment on edge devices with efficient inference throughput. In addition, we present HazardQA, a novel Vision Question Answering (VQA) dataset constructed specifically for training HazardNet on real-world scenarios involving safety-critical events. Our experimental results show that the fine-tuned HazardNet outperformed the base model up to an 89% improvement in F1-Score and has comparable results with improvement in some cases reach up to 6% when compared to larger models, such as GPT-4o. These advancements underscore the potential of HazardNet in providing real-time, reliable traffic safety event detection, thereby contributing to reduced accidents and improved traffic management in urban environments. Both HazardNet model and the HazardQA dataset are available at https://huggingface.co/Tami3/HazardNet and https://huggingface.co/datasets/Tami3/HazardQA, respectively.
- Abstract(参考訳): 交通安全は、車両の増加と道路網の複雑な性質によって強化され、現代の都市環境において重要な関心事である。
従来の安全クリティカルなイベント検出システムは、主にセンサーベースのアプローチと従来の機械学習アルゴリズムに依存しており、交通安全規則に従うために広範なデータ収集と複雑なトレーニングプロセスを必要とする。
本稿では,先進言語と視覚モデルの推論能力を活用して交通安全を高めるために設計された,小型の視覚言語モデルであるHazardNetを紹介する。
我々は、オープンソースの代替品の中でも優れた性能と20億のパラメータのコンパクトなサイズで、事前訓練されたQwen2-VL-2Bモデルを微調整してHazardNetを構築した。
これにより、効率的な推論スループットを備えたエッジデバイスへのデプロイが容易になる。
さらに,ハザードネットを安全クリティカルイベントを含む現実のシナリオでトレーニングするために構築された,視覚質問回答(VQA)データセットであるHazardQAを紹介する。
実験結果から,微調整HazardNetはF1スコアを89%向上させ,GPT-4oなどの大型モデルに比べて6%向上した。
これらの進歩は、リアルタイムで信頼性の高い交通安全イベント検出を提供することで、都市環境における事故の低減と交通管理の改善に寄与するハザードネットの可能性を強調している。
HazardNetモデルとHazardQAデータセットは、それぞれhttps://huggingface.co/Tami3/HazardNetとhttps://huggingface.co/datasets/Tami3/HazardQAで利用可能である。
関連論文リスト
- INSIGHT: Enhancing Autonomous Driving Safety through Vision-Language Models on Context-Aware Hazard Detection and Edge Case Evaluation [7.362380225654904]
INSIGHTは、危険検出とエッジケース評価を強化するために設計された階層型視覚言語モデル(VLM)フレームワークである。
本手法は,マルチモーダルデータ融合を用いて意味表現と視覚表現を統合し,運転シナリオの正確な解釈を可能にする。
BDD100Kデータセットの実験結果は、既存のモデルよりもハザード予測の正確性と正確性を大幅に改善したことを示している。
論文 参考訳(メタデータ) (2025-02-01T01:43:53Z) - Real-time Accident Anticipation for Autonomous Driving Through Monocular Depth-Enhanced 3D Modeling [18.071748815365005]
我々は、現在のSOTA(State-of-the-art)2Dベースの手法を超えて予測能力を著しく向上させる革新的なフレームワークであるAccNetを導入する。
本稿では,交通事故データセットにおけるスキュードデータ分散の課題に対処するため,早期予測のためのバイナリ適応損失(BA-LEA)を提案する。
論文 参考訳(メタデータ) (2024-09-02T13:46:25Z) - Digital Twin-based Driver Risk-Aware Intelligent Mobility Analytics for Urban Transportation Management [18.015270631863665]
本稿では,デジタルツインをベースとしたドライバリスク認識知能モビリティ分析システムを提案する。
DT-DIMAシステムはパンティルトカメラからのリアルタイムトラフィック情報を統合する。
このシステムは、ネットワーク全体のモビリティと安全性のリスクをリアルタイムで予測する。
論文 参考訳(メタデータ) (2024-07-03T01:44:22Z) - CAT: Closed-loop Adversarial Training for Safe End-to-End Driving [54.60865656161679]
Adversarial Training (CAT) は、自動運転車における安全なエンドツーエンド運転のためのフレームワークである。
Catは、安全クリティカルなシナリオでエージェントを訓練することで、運転エージェントの安全性を継続的に改善することを目的としている。
猫は、訓練中のエージェントに対抗する敵シナリオを効果的に生成できる。
論文 参考訳(メタデータ) (2023-10-19T02:49:31Z) - Smart City Transportation: Deep Learning Ensemble Approach for Traffic
Accident Detection [0.0]
本稿では,スマートシティ交通監視システムにおける事故検出に適した軽量ソリューションであるI3D-CONVLSTM2Dモデルアーキテクチャを提案する。
I3D-CONVLSTM2D RGB + Optical-Flow (Trainable) モデルでは, 平均精度が87%, 平均精度が87%であった。
我々の研究は、スマート都市インフラ内のエッジIoTデバイスへのリアルタイム統合を前提とした、高度な視覚ベースの事故検出システムへの道筋を照らしている。
論文 参考訳(メタデータ) (2023-10-16T03:47:08Z) - Evaluating Model-free Reinforcement Learning toward Safety-critical
Tasks [70.76757529955577]
本稿では、国家安全RLの観点から、この領域における先行研究を再考する。
安全最適化と安全予測を組み合わせた共同手法であるUnrolling Safety Layer (USL)を提案する。
この領域のさらなる研究を容易にするため、我々は関連するアルゴリズムを統一パイプラインで再現し、SafeRL-Kitに組み込む。
論文 参考訳(メタデータ) (2022-12-12T06:30:17Z) - Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。
コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。
ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文 参考訳(メタデータ) (2022-10-03T08:38:38Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Network-level Safety Metrics for Overall Traffic Safety Assessment: A
Case Study [7.8191100993403495]
本稿では,道路インフラストラクチャセンサによる画像の処理による交通流の安全性評価のための,ネットワークレベルの新しい安全性指標について述べる。
安全性指標とクラッシュデータの統合解析により,代表的なネットワークレベルの安全性指標とクラッシュ頻度との洞察力のある時間的および空間的相関が明らかになった。
論文 参考訳(メタデータ) (2022-01-27T19:07:08Z) - A model for traffic incident prediction using emergency braking data [77.34726150561087]
道路交通事故予測におけるデータ不足の根本的な課題を、事故の代わりに緊急ブレーキイベントをトレーニングすることで解決します。
メルセデス・ベンツ車両の緊急ブレーキデータに基づくドイツにおける交通事故予測モデルを実装したプロトタイプを提案する。
論文 参考訳(メタデータ) (2021-02-12T18:17:12Z) - Cautious Adaptation For Reinforcement Learning in Safety-Critical
Settings [129.80279257258098]
都市運転のような現実の安全クリティカルな目標設定における強化学習(RL)は危険である。
非安全クリティカルな「ソース」環境でエージェントが最初に訓練する「安全クリティカル適応」タスクセットを提案する。
多様な環境における事前経験がリスクを見積もるためにエージェントに装備するという直感に基づくソリューションアプローチであるCARLを提案する。
論文 参考訳(メタデータ) (2020-08-15T01:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。