論文の概要: GuardAD: Safeguarding Autonomous Driving MLLMs via Markovian Safety Logic
- arxiv url: http://arxiv.org/abs/2605.10386v1
- Date: Mon, 11 May 2026 11:28:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.767877
- Title: GuardAD: Safeguarding Autonomous Driving MLLMs via Markovian Safety Logic
- Title(参考訳): GuardAD: Markovian Safety Logicによる自動走行MLLMの保護
- Authors: Tianyuan Zhang, Peng Yue, Zihao Peng, Jiangfan Liu, Zonghao Ying, Jiakai Wang, Tianlin Li, Jian Yang, Yaodong Yang, Aishan Liu, Xianglong Liu,
- Abstract要約: MLLM(Multimodal large language model)は、自律運転システムに統合されつつある。
それらは、特に事故を起こしやすいシナリオにおいて、多様な安全上の脅威に弱いままである。
我々は,AD安全性を進化するマルコフ論理状態として定式化するモデル非依存型安全ガードであるGardadを提案する。
- 参考スコア(独自算出の注目度): 51.85782253444399
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal large language models (MLLMs) are increasingly integrated into autonomous driving (AD) systems; however, they remain vulnerable to diverse safety threats, particularly in accident-prone scenarios. Recent safeguard mechanisms have shown promise by incorporating logical constraints, yet most rely on static formulations that lack temporally grounded safety reasoning over evolving traffic interactions, resulting in limited robustness in dynamic driving environments. To address these limitations, we propose GuardAD, a model-agnostic safeguard that formulates AD safety as an evolving Markovian logical state. GuardAD introduces Neuro-Symbolic Logic Formalization, which represents safety predicates over heterogeneous traffic participants and continuously induces them via n-th order Markovian Logic Induction. This design enables the inference of emerging and latent hazards beyond single-step observations. Rather than simply vetoing unsafe actions, GuardAD performs Logic-Driven Action Revision, where inferred safety states actively guide action refinement without modifying the underlying MLLM. Extensive experiments on multiple benchmarks and AD-MLLMs demonstrate that GuardAD substantially reduces accident rates (-32.07%) while slightly improving task performance (+6.85%). Moreover, closed-loop simulation evaluations, together with physical-world vehicle studies, further validate the effectiveness and potential of GuardAD.
- Abstract(参考訳): MLLM(Multimodal large language model)は、自律運転(AD)システムにますます統合されているが、特に事故発生のシナリオにおいて、様々な安全上の脅威に弱いままである。
近年の安全保護機構は、論理的制約を組み込むことによって約束されているが、ほとんどの場合、交通相互作用の進化に対する時間的根拠のない安全推論を欠いた静的な定式化に依存しており、動的運転環境におけるロバスト性は制限されている。
これらの制約に対処するため、我々は、AD安全性を進化するマルコフ論理状態として定式化するモデルに依存しない安全ガードであるGardadを提案する。
GuardADは、異種交通参加者に対する安全予測を表現し、n次マルコフ論理誘導を通じて連続的に誘導するニューロシンボリック論理形式化を導入している。
この設計により、単一段階の観測を超えた、創発的および潜伏的なハザードの推測が可能になる。
安全でないアクションに拒否権を行使するのではなく、GuardADはLogic-Driven Action Revisionを実行する。
複数のベンチマークとAD-MLLMの大規模な実験により、ガードADは事故率(32.07%)を大幅に削減し、タスク性能(+6.85%)をわずかに改善した。
さらに、クローズドループシミュレーションの評価は、物理世界の研究とともに、ガードADの有効性と可能性をさらに検証した。
関連論文リスト
- RoboSafe: Safeguarding Embodied Agents via Executable Safety Logic [56.38397499463889]
視覚言語モデル(VLM)を利用するエージェントは、複雑な現実世界のタスクを実行する能力がますます高まっている。
しかし、安全でない行動を引き起こす可能性のある危険な指示に弱いままである。
提案するRoboSafeは,実行可能述語ベースの安全ロジックを通じて,エージェントを具体化するためのランタイムセーフガードである。
論文 参考訳(メタデータ) (2025-12-24T15:01:26Z) - Automating Steering for Safe Multimodal Large Language Models [58.36932318051907]
基礎モデルの微調整を必要とせず,モジュール型かつ適応型推論時間介入技術であるAutoSteerを導入する。
AutoSteerは,(1)モデル内部層間の最も安全性に関連のある識別を自動的に行う新しい安全意識スコア(SAS),(2)中間表現から有害な出力の可能性を推定するために訓練された適応安全プローバ,(3)安全性のリスクが検出された場合に生成を選択的に介入する軽量な拒絶ヘッドの3つのコアコンポーネントを組み込んだ。
論文 参考訳(メタデータ) (2025-07-17T16:04:55Z) - SCANS: Mitigating the Exaggerated Safety for LLMs via Safety-Conscious Activation Steering [56.92068213969036]
悪意のある命令から脅威を守るために、LLM(Large Language Models)には安全アライメントが不可欠である。
近年の研究では、過大な安全性の問題により、安全性に配慮したLCMは、良質な問い合わせを拒否する傾向にあることが明らかになっている。
過大な安全性の懸念を和らげるために,SCANS法を提案する。
論文 参考訳(メタデータ) (2024-08-21T10:01:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。