論文の概要: VLM as Strategist: Adaptive Generation of Safety-critical Testing Scenarios via Guided Diffusion
- arxiv url: http://arxiv.org/abs/2512.02844v1
- Date: Tue, 02 Dec 2025 14:56:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-03 21:04:45.936175
- Title: VLM as Strategist: Adaptive Generation of Safety-critical Testing Scenarios via Guided Diffusion
- Title(参考訳): ストラテジストとしてのVLM:ガイド拡散による安全クリティカルテストシナリオの適応生成
- Authors: Xinzheng Wu, Junyi Chen, Naiting Zhong, Yong Shen,
- Abstract要約: 本稿では,安全クリティカルなテストシナリオ生成フレームワークを提案する。
視覚言語モデル(VLM)の高レベル意味理解機能と適応誘導拡散モデルの微粒化生成機能を統合する。
実験結果から,提案手法は現実的かつ多種多様で,高度にインタラクティブな安全クリティカルテストシナリオを効率的に生成できることが示された。
- 参考スコア(独自算出の注目度): 3.981488921870863
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The safe deployment of autonomous driving systems (ADSs) relies on comprehensive testing and evaluation. However, safety-critical scenarios that can effectively expose system vulnerabilities are extremely sparse in the real world. Existing scenario generation methods face challenges in efficiently constructing long-tail scenarios that ensure fidelity, criticality, and interactivity, while particularly lacking real-time dynamic response capabilities to the vehicle under test (VUT). To address these challenges, this paper proposes a safety-critical testing scenario generation framework that integrates the high-level semantic understanding capabilities of Vision Language Models (VLMs) with the fine-grained generation capabilities of adaptive guided diffusion models. The framework establishes a three-layer hierarchical architecture comprising a strategic layer for VLM-directed scenario generation objective determination, a tactical layer for guidance function formulation, and an operational layer for guided diffusion execution. We first establish a high-quality fundamental diffusion model that learns the data distribution of real driving scenarios. Next, we design an adaptive guided diffusion method that enables real-time, precise control of background vehicles (BVs) in closed-loop simulation. The VLM is then incorporated to autonomously generate scenario generation objectives and guidance functions through deep scenario understanding and risk reasoning, ultimately guiding the diffusion model to achieve VLM-directed scenario generation. Experimental results demonstrate that the proposed method can efficiently generate realistic, diverse, and highly interactive safety-critical testing scenarios. Furthermore, case studies validate the adaptability and VLM-directed generation performance of the proposed method.
- Abstract(参考訳): 自律運転システム(ADS)の安全な配置は、包括的なテストと評価に依存している。
しかし、システム脆弱性を効果的に暴露できる安全クリティカルなシナリオは、現実世界では極めて少ない。
既存のシナリオ生成手法は、特にテスト中の車両(VUT)に対するリアルタイムな動的応答能力を欠きながら、忠実さ、臨界性、相互作用性を確実にするロングテールシナリオを効率的に構築する上で、課題に直面している。
これらの課題に対処するために,視覚言語モデル(VLM)の高レベル意味理解機能と適応誘導拡散モデルの微粒化機能を統合する安全クリティカルなテストシナリオ生成フレームワークを提案する。
本フレームワークは、VLM指向シナリオ生成目標決定のための戦略層と、誘導関数定式化のための戦術層と、誘導拡散実行のための操作層とからなる3層階層アーキテクチャを確立する。
まず,実走行シナリオのデータ分布を学習する,高品質な基本拡散モデルを構築した。
次に,閉ループシミュレーションにおける背景車両(BV)のリアルタイムかつ高精度な制御を可能にする適応誘導拡散法を設計する。
VLMは、深いシナリオ理解とリスク推論を通じてシナリオ生成目標とガイダンス関数を自律的に生成するために組み込まれ、最終的にVLM指向のシナリオ生成を実現するための拡散モデルが導かれる。
実験結果から,提案手法は現実的かつ多様で,高度にインタラクティブな安全クリティカルテストシナリオを効率的に生成できることが示された。
さらに,本手法の適応性とVLM指向生成性能の検証を行った。
関連論文リスト
- Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。
我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。
本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文 参考訳(メタデータ) (2025-09-24T13:35:15Z) - LD-Scene: LLM-Guided Diffusion for Controllable Generation of Adversarial Safety-Critical Driving Scenarios [3.6585028071015007]
LD-Sceneは、Large Language Models (LLMs)とLatent Diffusion Models (LDMs)を統合する新しいフレームワークである。
提案手法は,現実的な運転分布をキャプチャするLCMと,ユーザクエリを逆損失関数に変換するLCMベースのガイダンスモジュールを備える。
我々のフレームワークは、敵行動のきめ細かい制御を提供し、特定の運転シナリオに合わせたより効果的なテストを容易にする。
論文 参考訳(メタデータ) (2025-05-16T13:41:05Z) - Safety-Critical Traffic Simulation with Guided Latent Diffusion Model [8.011306318131458]
安全クリティカルな交通シミュレーションは、自動運転システムを評価する上で重要な役割を果たす。
本稿では,物理的に現実的で逆向きなシナリオを生成可能なガイド付き潜時拡散モデル(LDM)を提案する。
我々の研究は、現実的な安全クリティカルなシナリオシミュレーションのための効果的なツールを提供し、自律運転システムのより堅牢な評価の道を開く。
論文 参考訳(メタデータ) (2025-05-01T13:33:34Z) - From Words to Collisions: LLM-Guided Evaluation and Adversarial Generation of Safety-Critical Driving Scenarios [6.681744368557208]
大規模言語モデル(LLM)と構造化シナリオ解析と迅速なエンジニアリングは、安全クリティカルな運転シナリオを生成するために使用される。
2次元シミュレーションフレームワークと複数の事前学習LDMを用いて,本手法の有効性を検証した。
ドメインインフォームドプロンプト技術を備えたLLMは、安全クリティカルな運転シナリオを効果的に評価し、生成することができると結論付けている。
論文 参考訳(メタデータ) (2025-02-04T09:19:13Z) - Generating Out-Of-Distribution Scenarios Using Language Models [58.47597351184034]
大規模言語モデル(LLM)は自動運転において有望であることを示している。
本稿では,多様なOF-Distribution(OOD)駆動シナリオを生成するためのフレームワークを提案する。
我々は、広範囲なシミュレーションを通じてフレームワークを評価し、新しい"OOD-ness"メトリクスを導入する。
論文 参考訳(メタデータ) (2024-11-25T16:38:17Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。
LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。
適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文 参考訳(メタデータ) (2023-11-28T03:13:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。