論文の概要: SG-CADVLM: A Context-Aware Decoding Powered Vision Language Model for Safety-Critical Scenario Generation
- arxiv url: http://arxiv.org/abs/2601.18442v2
- Date: Wed, 28 Jan 2026 06:14:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.948274
- Title: SG-CADVLM: A Context-Aware Decoding Powered Vision Language Model for Safety-Critical Scenario Generation
- Title(参考訳): SG-CADVLM:安全批判シナリオ生成のためのコンテキスト認識型パワードビジョン言語モデル
- Authors: Hongyi Zhao, Shuo Wang, Qijie He, Ziyuan Pu,
- Abstract要約: 本稿では、コンテキスト認識デコーディングとマルチモーダルな入力処理を統合し、安全クリティカルなシナリオを生成するフレームワークであるSG-CADVLMを提案する。
このフレームワークは、道路形状と車両軌道の同時生成を可能にしながら、VLM幻覚の問題を緩和する。
- 参考スコア(独自算出の注目度): 8.490714399662453
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous vehicle safety validation requires testing on safety-critical scenarios, but these events are rare in real-world driving and costly to test due to collision risks. Crash reports provide authentic specifications of safety-critical events, offering a vital alternative to scarce real-world collision trajectory data. This makes them valuable sources for generating realistic high-risk scenarios through simulation. Existing approaches face significant limitations because data-driven methods lack diversity due to their reliance on existing latent distributions, whereas adversarial methods often produce unrealistic scenarios lacking physical fidelity. Large Language Model (LLM) and Vision Language Model (VLM)-based methods show significant promise. However, they suffer from context suppression issues where internal parametric knowledge overrides crash specifications, producing scenarios that deviate from actual accident characteristics. This paper presents SG-CADVLM (A Context-Aware Decoding Powered Vision Language Model for Safety-Critical Scenario Generation), a framework that integrates Context-Aware Decoding with multi-modal input processing to generate safety-critical scenarios from crash reports and road network diagrams. The framework mitigates VLM hallucination issues while enabling the simultaneous generation of road geometry and vehicle trajectories. The experimental results demonstrate that SG-CADVLM generates critical risk scenarios at a rate of 84.4% compared to 12.5% for the baseline methods, representing an improvement of 469%, while producing executable simulations for autonomous vehicle testing.
- Abstract(参考訳): 自動運転車の安全性検証には、安全クリティカルなシナリオのテストが必要であるが、これらのイベントは現実の運転ではまれであり、衝突リスクによるテストに費用がかかる。
クラッシュレポートは、安全クリティカルな事象の真正な仕様を提供し、現実世界の衝突軌跡の少ないデータに欠かせない代替手段を提供する。
これにより、シミュレーションを通じて現実的なハイリスクシナリオを生成するための貴重な情報源となる。
既存のアプローチは、データ駆動手法が既存の潜伏分布に依存しているため多様性を欠いているため、重大な制限に直面している。
大規模言語モデル (LLM) と視覚言語モデル (VLM) に基づく手法は大きな可能性を秘めている。
しかし、内部のパラメトリック知識がクラッシュ仕様を覆い、実際の事故特性から逸脱するシナリオを生み出すような状況抑制の問題に悩まされている。
本稿では,SG-CADVLM(A Context-Aware Decoding Powered Vision Language Model for Safety-Critical Scenario Generation)を提案する。
このフレームワークは、道路形状と車両軌道の同時生成を可能にしながら、VLM幻覚の問題を緩和する。
実験の結果、SG-CADVLMは、ベースライン法では12.5%に比べて84.4%の速さで臨界リスクシナリオを発生し、469%の改善を示した。
関連論文リスト
- Automating Steering for Safe Multimodal Large Language Models [58.36932318051907]
基礎モデルの微調整を必要とせず,モジュール型かつ適応型推論時間介入技術であるAutoSteerを導入する。
AutoSteerは,(1)モデル内部層間の最も安全性に関連のある識別を自動的に行う新しい安全意識スコア(SAS),(2)中間表現から有害な出力の可能性を推定するために訓練された適応安全プローバ,(3)安全性のリスクが検出された場合に生成を選択的に介入する軽量な拒絶ヘッドの3つのコアコンポーネントを組み込んだ。
論文 参考訳(メタデータ) (2025-07-17T16:04:55Z) - CrashAgent: Crash Scenario Generation via Multi-modal Reasoning [34.42773413989066]
CrashAgentは,マルチモーダルな実世界の交通事故レポートを解釈するフレームワークである。
生成した衝突シナリオを,レイアウト再構成の精度,衝突速度,多様性など,複数の観点から評価した。
結果、高品質で大規模なクラッシュデータセットが公開され、安全な運転アルゴリズムの開発がサポートされる。
論文 参考訳(メタデータ) (2025-05-23T19:55:32Z) - Towards Reliable and Interpretable Traffic Crash Pattern Prediction and Safety Interventions Using Customized Large Language Models [14.53510262691888]
TrafficSafeは、テキストレベルの推論として、再フレームのクラッシュ予測と機能属性に適応するフレームワークである。
飲酒運転が深刻な事故の要因となっている。
TrafficSafeは、戦略的クラッシュデータ収集の改善を導くモデルトレーニングにおいて、重要な機能を強調している。
論文 参考訳(メタデータ) (2025-05-18T21:02:30Z) - From Words to Collisions: LLM-Guided Evaluation and Adversarial Generation of Safety-Critical Driving Scenarios [6.681744368557208]
大規模言語モデル(LLM)と構造化シナリオ解析と迅速なエンジニアリングは、安全クリティカルな運転シナリオを生成するために使用される。
2次元シミュレーションフレームワークと複数の事前学習LDMを用いて,本手法の有効性を検証した。
ドメインインフォームドプロンプト技術を備えたLLMは、安全クリティカルな運転シナリオを効果的に評価し、生成することができると結論付けている。
論文 参考訳(メタデータ) (2025-02-04T09:19:13Z) - Generating Out-Of-Distribution Scenarios Using Language Models [58.47597351184034]
大規模言語モデル(LLM)は自動運転において有望であることを示している。
本稿では,多様なOF-Distribution(OOD)駆動シナリオを生成するためのフレームワークを提案する。
我々は、広範囲なシミュレーションを通じてフレームワークを評価し、新しい"OOD-ness"メトリクスを導入する。
論文 参考訳(メタデータ) (2024-11-25T16:38:17Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Generating and Characterizing Scenarios for Safety Testing of Autonomous
Vehicles [86.9067793493874]
最先端運転シミュレータを用いて,テストシナリオを特徴付け,生成するための効率的なメカニズムを提案する。
次世代シミュレーション(NGSIM)プロジェクトにおける実運転データの特徴付けに本手法を用いる。
事故回避の複雑さに基づいてメトリクスを定義してシナリオをランク付けし、事故発生の可能性を最小限に抑えるための洞察を提供します。
論文 参考訳(メタデータ) (2021-03-12T17:00:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。