論文の概要: Is Your VLM for Autonomous Driving Safety-Ready? A Comprehensive Benchmark for Evaluating External and In-Cabin Risks
- arxiv url: http://arxiv.org/abs/2511.14592v1
- Date: Tue, 18 Nov 2025 15:33:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:53.184784
- Title: Is Your VLM for Autonomous Driving Safety-Ready? A Comprehensive Benchmark for Evaluating External and In-Cabin Risks
- Title(参考訳): 自動運転安全のためのVLM : 外部および車室内リスク評価のための総合的ベンチマーク
- Authors: Xianhui Meng, Yuchen Zhang, Zhijian Huang, Zheng Lu, Ziling Ji, Yaoyao Yin, Hongyuan Zhang, Guangfeng Jiang, Yandan Lin, Long Chen, Hangjun Ye, Li Zhang, Jun Liu, Xiaoshuai Hao,
- Abstract要約: VLM(Vision-Language Models)は自律走行には大きな可能性を秘めているが、安全クリティカルなシナリオには適していない。
この問題は、外部環境リスクとキャビン内運転行動の安全性の両方を同時に評価する包括的なベンチマークが欠如していることから生じる。
我々は,VLMの各種安全リスクに対する認識を統一的に評価するための,最初の総合運転安全ベンチマークであるDSBenchを紹介する。
- 参考スコア(独自算出の注目度): 24.48209914161689
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision-Language Models (VLMs) show great promise for autonomous driving, but their suitability for safety-critical scenarios is largely unexplored, raising safety concerns. This issue arises from the lack of comprehensive benchmarks that assess both external environmental risks and in-cabin driving behavior safety simultaneously. To bridge this critical gap, we introduce DSBench, the first comprehensive Driving Safety Benchmark designed to assess a VLM's awareness of various safety risks in a unified manner. DSBench encompasses two major categories: external environmental risks and in-cabin driving behavior safety, divided into 10 key categories and a total of 28 sub-categories. This comprehensive evaluation covers a wide range of scenarios, ensuring a thorough assessment of VLMs' performance in safety-critical contexts. Extensive evaluations across various mainstream open-source and closed-source VLMs reveal significant performance degradation under complex safety-critical situations, highlighting urgent safety concerns. To address this, we constructed a large dataset of 98K instances focused on in-cabin and external safety scenarios, showing that fine-tuning on this dataset significantly enhances the safety performance of existing VLMs and paves the way for advancing autonomous driving technology. The benchmark toolkit, code, and model checkpoints will be publicly accessible.
- Abstract(参考訳): VLM(Vision-Language Models)は、自動運転には大きな可能性を秘めているが、安全クリティカルなシナリオに対する適合性はほとんど探索されていないため、安全性の懸念が高まる。
この問題は、外部環境リスクとキャビン内運転行動の安全性の両方を同時に評価する包括的なベンチマークが欠如していることから生じる。
この重要なギャップを埋めるために,我々は,VLMの様々な安全リスクに対する認識を統一的に評価するために設計された,最初の総合運転安全ベンチマークであるDSBenchを紹介する。
DSBenchは、外部環境リスクとキャビン内運転行動の安全性の2つの主要なカテゴリを含み、10つの主要なカテゴリと合計28のサブカテゴリに分けられる。
この総合的な評価は幅広いシナリオをカバーし、安全クリティカルな状況下でのVLMの性能を徹底的に評価する。
様々な主要なオープンソースおよびクローズドソースVLMの広範な評価は、複雑な安全クリティカルな状況下での大幅なパフォーマンス低下を示し、緊急の安全上の懸念を浮き彫りにしている。
そこで我々は,車室内と外部の安全シナリオに着目した98Kインスタンスの大規模なデータセットを構築し,このデータセットの微調整によって既存のVLMの安全性が大幅に向上し,自動運転技術の進歩への道が拓かれたことを示す。
ベンチマークツールキット、コード、モデルチェックポイントが一般公開される。
関連論文リスト
- SafeAgent: Safeguarding LLM Agents via an Automated Risk Simulator [77.86600052899156]
LLM(Large Language Model)ベースのエージェントは、現実のアプリケーションにますますデプロイされる。
完全自動合成データ生成によるエージェント安全性を体系的に向上する最初のフレームワークであるAutoSafeを提案する。
AutoSafeは安全性のスコアを平均で45%向上させ、現実世界のタスクでは28.91%の改善を実現している。
論文 参考訳(メタデータ) (2025-05-23T10:56:06Z) - Evaluation of Safety Cognition Capability in Vision-Language Models for Autonomous Driving [17.07863649672461]
本稿では,自律運転シナリオにおける視覚言語モデル(VLM)の安全性認知能力を評価するためのフレームワークであるSCD-Benchを紹介する。
データアノテーションのスケーラビリティ問題に対処するために,半自動ラベリングシステムであるADA(Autonomous Driving )を導入する。
運転環境におけるVLMと安全認知の連携という課題に対処するため,我々は,このタスクに適した最初の大規模データセットであるSCD-Trainingを構築した。
論文 参考訳(メタデータ) (2025-03-09T07:53:19Z) - SafeDrive: Knowledge- and Data-Driven Risk-Sensitive Decision-Making for Autonomous Vehicles with Large Language Models [14.790308656087316]
SafeDriveは、自律運転の安全性と適応性を高めるための、知識とデータ駆動型リスクに敏感な意思決定フレームワークである。
知識駆動型洞察と適応学習機構を統合することにより、不確実な条件下での堅牢な意思決定を保証する。
論文 参考訳(メタデータ) (2024-12-17T16:45:27Z) - Safe Inputs but Unsafe Output: Benchmarking Cross-modality Safety Alignment of Large Vision-Language Model [73.8765529028288]
我々は、モダリティ間の安全アライメントを評価するために、セーフインプットとアンセーフアウトプット(SIUO)と呼ばれる新しい安全アライメントの課題を導入する。
この問題を実証的に調査するため,我々はSIUOを作成した。SIUOは,自己修復,違法行為,プライバシー侵害など,9つの重要な安全領域を含むクロスモダリティベンチマークである。
以上の結果から, クローズドおよびオープンソース両方のLVLMの安全性上の重大な脆弱性が明らかとなり, 複雑で現実的なシナリオを確実に解釈し, 応答する上で, 現行モデルが不十分であることが示唆された。
論文 参考訳(メタデータ) (2024-06-21T16:14:15Z) - Safety-aware Causal Representation for Trustworthy Offline Reinforcement
Learning in Autonomous Driving [33.672722472758636]
オフライン強化学習(RL)アプローチは、オフラインデータセットからのシーケンシャルな意思決定問題に対処する上で、顕著な効果を示す。
一般化可能なエンドツーエンド駆動ポリシの学習を容易にするために,saFety-aware strUctured Scenario representation (Fusion)を導入した。
様々な運転シナリオにおける実証的な証拠は、フュージョンが自律運転エージェントの安全性と一般化性を著しく向上させることを証明している。
論文 参考訳(メタデータ) (2023-10-31T18:21:24Z) - A Counterfactual Safety Margin Perspective on the Scoring of Autonomous
Vehicles' Riskiness [52.27309191283943]
本稿では,異なるAVの行動のリスクを評価するためのデータ駆動型フレームワークを提案する。
本稿では,衝突を引き起こす可能性のある名目行動から最小限の偏差を示す,対実的安全マージンの概念を提案する。
論文 参考訳(メタデータ) (2023-08-02T09:48:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。