論文の概要: Understanding Real-World Traffic Safety through RoadSafe365 Benchmark
- arxiv url: http://arxiv.org/abs/2602.07212v1
- Date: Fri, 06 Feb 2026 21:48:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.509088
- Title: Understanding Real-World Traffic Safety through RoadSafe365 Benchmark
- Title(参考訳): RoadSafe365ベンチマークによる現実世界の交通安全の理解
- Authors: Xinyu Liu, Darryl C. Jacob, Yuxin Liu, Xinsong Du, Muchao Ye, Bolei Zhou, Pan He,
- Abstract要約: RoadSafe365は、交通安全分析のための大規模ビジョンベンチマークである。
広範囲で多様な実世界のビデオデータ収集からの交通安全のきめ細かい分析をサポートする。
RoadSafe365は、階層的な分類法を用いて、独立にキュレーションされ、体系的に組織化されている。
- 参考スコア(独自算出の注目度): 34.52836638662823
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although recent traffic benchmarks have advanced multimodal data analysis, they generally lack systematic evaluation aligned with official safety standards. To fill this gap, we introduce RoadSafe365, a large-scale vision-language benchmark that supports fine-grained analysis of traffic safety from extensive and diverse real-world video data collections. Unlike prior works that focus primarily on coarse accident identification, RoadSafe365 is independently curated and systematically organized using a hierarchical taxonomy that refines and extends foundational definitions of crash, incident, and violation to bridge official traffic safety standards with data-driven traffic understanding systems. RoadSafe365 provides rich attribute annotations across diverse traffic event types, environmental contexts, and interaction scenarios, yielding 36,196 annotated clips from both dashcam and surveillance cameras. Each clip is paired with multiple-choice question-answer sets, comprising 864K candidate options, 8.4K unique answers, and 36K detailed scene descriptions collectively designed for vision-language understanding and reasoning. We establish strong baselines and observe consistent gains when fine-tuning on RoadSafe365. Cross-domain experiments on both real and synthetic datasets further validate its effectiveness. Designed for large-scale training and standardized evaluation, RoadSafe365 provides a comprehensive benchmark to advance reproducible research in real-world traffic safety analysis.
- Abstract(参考訳): 最近の交通ベンチマークでは、高度なマルチモーダルデータ分析が実施されているが、一般には、公式の安全基準に沿った体系的な評価を欠いている。
このギャップを埋めるために、我々は大規模なビジョンベンチマークであるRoadSafe365を紹介した。
主に粗い事故の特定に焦点を当てた以前の研究とは異なり、RoadSafe365は、データ駆動の交通理解システムで公式の交通安全基準を橋渡しする事故、事故、違反の基本的な定義を洗練・拡張する階層的な分類法を用いて、独立にキュレーションされ、体系的に組織されている。
RoadSafe365は、さまざまなトラフィックイベントタイプ、環境コンテキスト、インタラクションシナリオにまたがる豊富な属性アノテーションを提供し、ダッシュカムと監視カメラの両方から36,196の注釈付きクリップを生成する。
各クリップには864Kの候補オプション、8.4Kのユニークな回答、視覚言語による理解と推論のためにまとめられた36Kの詳細なシーン記述を含む複数の質問応答セットが組み合わされている。
RoadSafe365の微調整時に,強いベースラインを確立し,一貫した利得を観測する。
実データと合成データの両方に関するクロスドメイン実験は、その有効性をさらに検証する。
大規模トレーニングと標準化された評価のために設計されたRoadSafe365は、現実世界の交通安全分析において再現可能な研究を進めるための包括的なベンチマークを提供する。
関連論文リスト
- SafeDriveRAG: Towards Safe Autonomous Driving with Knowledge Graph-based Retrieval-Augmented Generation [27.135615596331263]
視覚言語モデル(VLM)は、自律運転システムの安全性を高めるために利用することができる。
既存の研究は、交通安全クリティカルな運転シナリオにおけるこれらのモデルの評価を概ね見落としている。
本稿では,視覚的質問応答のための知識グラフに基づく検索拡張生成を用いたVLMに基づく新しいベースラインを提案する。
論文 参考訳(メタデータ) (2025-07-29T08:40:17Z) - Towards Reliable and Interpretable Traffic Crash Pattern Prediction and Safety Interventions Using Customized Large Language Models [14.53510262691888]
TrafficSafeは、テキストレベルの推論として、再フレームのクラッシュ予測と機能属性に適応するフレームワークである。
飲酒運転が深刻な事故の要因となっている。
TrafficSafeは、戦略的クラッシュデータ収集の改善を導くモデルトレーニングにおいて、重要な機能を強調している。
論文 参考訳(メタデータ) (2025-05-18T21:02:30Z) - SafeAuto: Knowledge-Enhanced Safe Autonomous Driving with Multimodal Foundation Models [63.71984266104757]
我々は、構造化されていない知識と構造化されていない知識の両方を取り入れることで、MLLMベースの自動運転を強化するフレームワークであるSafeAutoを提案する。
安全知識を明示的に統合するため,交通ルールを一階述語論理に変換する推論コンポーネントを開発した。
我々のマルチモーダル検索・拡張生成モデルは、過去の運転経験から学ぶために、ビデオ、制御信号、環境特性を活用する。
論文 参考訳(メタデータ) (2025-02-28T21:53:47Z) - When language and vision meet road safety: leveraging multimodal large language models for video-based traffic accident analysis [6.213279061986497]
SeeUnsafeは、ビデオベースの交通事故分析を、よりインタラクティブで対話的なアプローチに変換するフレームワークである。
本フレームワークでは,様々な長さの動画をマルチモーダル・アグリゲーション・ストラテジーで処理し,レビューと評価のために構造化された応答を生成する。
本研究では,トヨタウーブン交通安全データセットについて広範な実験を行い,SeeUnsafeが事故対応ビデオ分類と視覚的グラウンド化を効果的に実施できることを実証した。
論文 参考訳(メタデータ) (2025-01-17T23:35:34Z) - Traffic and Safety Rule Compliance of Humans in Diverse Driving Situations [48.924085579865334]
安全な運転プラクティスを再現する自律システムを開発するためには、人間のデータを分析することが不可欠だ。
本稿では,複数の軌道予測データセットにおける交通・安全規則の適合性の比較評価を行う。
論文 参考訳(メタデータ) (2024-11-04T09:21:00Z) - Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文 参考訳(メタデータ) (2024-06-16T03:10:16Z) - Leveraging Driver Field-of-View for Multimodal Ego-Trajectory Prediction [69.29802752614677]
RouteFormerは、GPSデータ、環境コンテキスト、運転者の視野を組み合わせた新しいエゴ軌道予測ネットワークである。
データ不足に対処し、多様性を高めるために、同期運転場と視線データに富んだ都市運転シナリオのデータセットであるGEMを導入する。
論文 参考訳(メタデータ) (2023-12-13T23:06:30Z) - Network-level Safety Metrics for Overall Traffic Safety Assessment: A
Case Study [7.8191100993403495]
本稿では,道路インフラストラクチャセンサによる画像の処理による交通流の安全性評価のための,ネットワークレベルの新しい安全性指標について述べる。
安全性指標とクラッシュデータの統合解析により,代表的なネットワークレベルの安全性指標とクラッシュ頻度との洞察力のある時間的および空間的相関が明らかになった。
論文 参考訳(メタデータ) (2022-01-27T19:07:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。