論文の概要: I'm Sorry Driver, I'm Afraid I Can't Do That: Appraising the Safety of LLMs within Automotive Contexts
- arxiv url: http://arxiv.org/abs/2606.14327v1
- Date: Fri, 12 Jun 2026 10:18:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.864681
- Title: I'm Sorry Driver, I'm Afraid I Can't Do That: Appraising the Safety of LLMs within Automotive Contexts
- Title(参考訳): 自動車のコンテキストにおけるLLMの安全性の確保
- Authors: Shaun Feakins, Ibrahim Habli, Kim Littler, Robert Palin,
- Abstract要約: 本稿では、AI開発における最近のフレームワークを評価し、LLMを自動車環境における制御タスクに統合する。
現在、これらのフレームワークは、リアルタイムの安全クリティカルなコンテキストにおける有効性を制限し、重大な課題に直面している。
- 参考スコア(独自算出の注目度): 0.9309655246559091
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper appraises recent frameworks within AI development to integrate LLMs into control tasks in automotive contexts from the perspective of safety assurance. This work has built upon the rapid integration of LLMs across automotive settings. However, we find that at present, these frameworks face significant challenges, limiting their efficacy in real-time safety-critical contexts. Firstly, we consider conceptual challenges, including the fact that deployers are faced with a dual challenge, wherein they must assure a model which has been developed upstream, i.e. as general-purpose tools by the large AI labs, in a downstream context, i.e. into specific vehicle architectures. Secondly, we consider concrete challenges from across existing standards. We show that there are currently both fundamental engineering constraints covered in ISO21448, such as latency, and novel LLM-specific issues, such as alignment-related issues covered in ISO/PAS8800. We ground both examples in a concrete introductory, experimental case study exploring an existing open-source repository, Talk2Drive. We present a safety argument in order to make explicit the limitations of existing solutions. Nonetheless, given that the use of LLMs in automotive contexts is being explored at a technical level and operationalised, we propose potential assurance mechanisms for LLM-related hazardous events going forward.
- Abstract(参考訳): 本稿では、安全保証の観点から、AI開発における最近のフレームワークを評価し、LLMを自動車のコンテキストにおける制御タスクに統合する。
この研究は、自動車の環境にまたがるLSMの迅速な統合に基づいている。
しかし、これらのフレームワークは、現在、リアルタイムの安全クリティカルな文脈における有効性を制限し、重大な課題に直面している。
まず、デプロイが2つの課題に直面しているという事実、すなわち、大規模なAIラボによる汎用ツール、すなわち特定の車両アーキテクチャへのダウンストリームコンテキストで、上流で開発されたモデルを保証する必要があるという事実など、概念的な課題について考察する。
第二に、既存の標準にまたがる具体的な課題について検討する。
現在,ISO21448では,レイテンシや,ISO/PAS8800ではアライメントに関連する問題など,新たなLCM固有の問題など,基本的なエンジニアリング上の制約が存在することが示されている。
どちらの例も具体的な導入事例として,既存のオープンソースリポジトリであるTalk2Driveを探索する実験ケーススタディとして紹介する。
既存のソリューションの限界を明確にするために,安全性の議論を行う。
いずれにせよ,LLMを自動車の文脈での利用が技術的に検討され,運用されていることから,今後,LLM関連有害事象の潜在的な保証機構が提案される。
関連論文リスト
- Building Trust in the Skies: A Knowledge-Grounded LLM-based Framework for Aviation Safety [5.177763855644263]
LLM(Large Language Models)の航空安全決定への統合は、重要な技術的進歩を示している。
スタンドアローンの応用は、事実の不正確さ、幻覚、妥当性の欠如など、固有の制限のために重大なリスクを引き起こす。
本稿では,安全性分析の信頼性を高めるために,LLMと知識グラフ(KG)を組み合わせた新しいエンドツーエンドフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-10T12:59:46Z) - A Comprehensive Survey in LLM(-Agent) Full Stack Safety: Data, Training and Deployment [320.24207137356495]
本稿では, LLM のトレーニング, 展開, 商業化のプロセス全体を通して, 安全問題を体系的に検討する "フルスタック" の安全性の概念を紹介する。
我々の研究は800以上の論文を網羅的にレビューし、包括的カバレッジとセキュリティ問題の体系的な組織化を確保しています。
本研究は,データ生成の安全性,アライメント技術,モデル編集,LLMベースのエージェントシステムなど,有望な研究方向を特定する。
論文 参考訳(メタデータ) (2025-04-22T05:02:49Z) - SG-Bench: Evaluating LLM Safety Generalization Across Diverse Tasks and Prompt Types [21.683010095703832]
本研究では,大規模言語モデル(LLM)の安全性を様々なタスクやプロンプトタイプにまたがる一般化を評価するための新しいベンチマークを開発する。
このベンチマークは、生成的および識別的評価タスクを統合し、LLMの安全性に対する迅速なエンジニアリングとジェイルブレイクの影響を調べるための拡張データを含む。
評価の結果,ほとんどのLDMは生成的タスクよりも差別的タスクが悪く,プロンプトに非常に敏感であり,安全アライメントの一般化が不十分であることが示唆された。
論文 参考訳(メタデータ) (2024-10-29T11:47:01Z) - Multimodal Situational Safety [73.63981779844916]
マルチモーダル・シチュエーション・セーフティ(Multimodal situational Safety)と呼ばれる新しい安全課題の評価と分析を行う。
MLLMが言語やアクションを通じても安全に応答するためには、言語クエリが対応する視覚的コンテキスト内での安全性への影響を評価する必要があることが多い。
我々は,現在のMLLMの状況安全性能を評価するためのマルチモーダル状況安全ベンチマーク(MSSBench)を開発した。
論文 参考訳(メタデータ) (2024-10-08T16:16:07Z) - A Superalignment Framework in Autonomous Driving with Large Language Models [2.650382010271]
大規模言語モデル (LLM) と多モード大規模言語モデル (MLLM) は、自律運転において広く使われている。
その重要性にもかかわらず、自動運転におけるLLMのセキュリティの側面は未解明のままである。
本研究は,マルチエージェントLLMアプローチを利用した,自動運転車の新たなセキュリティフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-09T05:26:38Z) - Building Guardrails for Large Language Models [19.96292920696796]
LLMの入力や出力をフィルタリングするガードレールは、コアセーフガード技術として登場した。
このポジションペーパーでは、現在のオープンソースソリューション(Llama Guard, Nvidia NeMo, Guardrails AI)を詳しく調べ、より完全なソリューションを構築するための課題と道筋について論じる。
論文 参考訳(メタデータ) (2024-02-02T16:35:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。