論文の概要: LSRE: Latent Semantic Rule Encoding for Real-Time Semantic Risk Detection in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2512.24712v2
- Date: Sun, 04 Jan 2026 02:50:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 14:31:43.820847
- Title: LSRE: Latent Semantic Rule Encoding for Real-Time Semantic Risk Detection in Autonomous Driving
- Title(参考訳): LSRE: 自律運転におけるリアルタイムセマンティックリスク検出のための潜在セマンティックルール符号化
- Authors: Qian Cheng, Weitao Zhou, Cheng Jing, Nanshan Deng, Junze Wen, Zhaoyang Liu, Kun Jiang, Diange Yang,
- Abstract要約: 潜在セマンティックルールフレームワークは、スパースサンプリングされたVLM判断を、繰り返し世界モデルの潜在空間内の決定境界に変換する。
CARLAにおける6つのセマンティック障害シナリオの実験は、LSREが大きなVLMベースラインに匹敵するセマンティックリスク検出精度を得ることを示した。
LSREはさらに、セマンティック類似のテストケースがほとんど見られないように一般化し、言語誘導潜在分類が自律運転におけるセマンティックセーフティ監視に効果的でデプロイ可能なメカニズムを提供することを示している。
- 参考スコア(独自算出の注目度): 14.484350661315212
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world autonomous driving must adhere to complex human social rules that extend beyond legally codified traffic regulations. Many of these semantic constraints, such as yielding to emergency vehicles, complying with traffic officers' gestures, or stopping for school buses, are intuitive for humans yet difficult to encode explicitly. Although large vision-language models (VLMs) can interpret such semantics, their inference cost makes them impractical for real-time deployment. This work proposes LSRE, a Latent Semantic Rule Encoding framework that converts sparsely sampled VLM judgments into decision boundaries within the latent space of a recurrent world model. By encoding language-defined safety semantics into a lightweight latent classifier, LSRE enables real-time semantic risk assessment at 10 Hz without per-frame VLM queries. Experiments on six semantic-failure scenarios in CARLA demonstrate that LSRE attains semantic risk detection accuracy comparable to a large VLM baseline, while providing substantially earlier hazard anticipation and maintaining low computational latency. LSRE further generalizes to rarely seen semantic-similar test cases, indicating that language-guided latent classification offers an effective and deployable mechanism for semantic safety monitoring in autonomous driving.
- Abstract(参考訳): 現実の自動運転車は、法的に規定された交通規制を超えて広がる複雑な人間の社会ルールに従わなければならない。
これらの意味的制約の多くは、緊急車両への送付、交通警官のジェスチャーの遵守、スクールバスの停留などであり、人間にとって明示的に符号化することは困難である。
大規模な視覚言語モデル (VLM) はそのような意味論を解釈できるが、その推論コストはリアルタイムな展開には実用的ではない。
本研究はLSRE(Latent Semantic Rule Encoding framework)を提案する。このフレームワークは、細かなサンプル化されたVLMの判断を、リカレントワールドモデルの潜在空間内の決定境界に変換する。
言語定義の安全性セマンティクスを軽量な潜在分類器に符号化することにより、LSREはフレームごとのVLMクエリなしで10Hzでリアルタイムなセマンティクスリスク評価を可能にする。
CARLAにおける6つのセマンティック障害シナリオの実験では、LSREは大きなVLMベースラインに匹敵するセマンティックリスク検出精度を達成し、かなり早くハザード予測を提供し、低計算レイテンシを維持できることを示した。
LSREはさらに、セマンティック類似のテストケースがほとんど見られないように一般化し、言語誘導潜在分類が自律運転におけるセマンティックセーフティ監視に効果的でデプロイ可能なメカニズムを提供することを示している。
関連論文リスト
- Enhancing LLM-based Autonomous Driving with Modular Traffic Light and Sign Recognition [15.4994260281059]
大規模言語モデル(LLM)は、自律運転における意思決定と計画にますます利用されている。
LLMをベースとした自律走行エージェントを明示的な信号と信号認識で拡張するモジュール冗長層であるTLS-Assistを導入する。
LMDriveを14%,BEVDriverを7%,運転性能を14%向上させた。
論文 参考訳(メタデータ) (2025-11-18T11:52:52Z) - BLIP-FusePPO: A Vision-Language Deep Reinforcement Learning Framework for Lane Keeping in Autonomous Vehicles [0.0]
自律車線維持(LK)のためのマルチモーダル強化学習(RL)のための新しいフレームワークを提案する。
提案手法により,エージェントは周囲を認識し,理解しやすい運転ルールを学習することができる。
セマンティックアライメント、LK精度、障害物回避、速度制御を含むハイブリッド報酬関数は、学習をより効率的で一般化しやすいものにするのに役立つ。
論文 参考訳(メタデータ) (2025-10-25T17:27:08Z) - Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。
我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。
本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文 参考訳(メタデータ) (2025-09-24T13:35:15Z) - LD-Scene: LLM-Guided Diffusion for Controllable Generation of Adversarial Safety-Critical Driving Scenarios [3.6585028071015007]
LD-Sceneは、Large Language Models (LLMs)とLatent Diffusion Models (LDMs)を統合する新しいフレームワークである。
提案手法は,現実的な運転分布をキャプチャするLCMと,ユーザクエリを逆損失関数に変換するLCMベースのガイダンスモジュールを備える。
我々のフレームワークは、敵行動のきめ細かい制御を提供し、特定の運転シナリオに合わせたより効果的なテストを容易にする。
論文 参考訳(メタデータ) (2025-05-16T13:41:05Z) - SafeAuto: Knowledge-Enhanced Safe Autonomous Driving with Multimodal Foundation Models [63.71984266104757]
我々は、構造化されていない知識と構造化されていない知識の両方を取り入れることで、MLLMベースの自動運転を強化するフレームワークであるSafeAutoを提案する。
安全知識を明示的に統合するため,交通ルールを一階述語論理に変換する推論コンポーネントを開発した。
我々のマルチモーダル検索・拡張生成モデルは、過去の運転経験から学ぶために、ビデオ、制御信号、環境特性を活用する。
論文 参考訳(メタデータ) (2025-02-28T21:53:47Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。
LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。
適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文 参考訳(メタデータ) (2023-11-28T03:13:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。