論文の概要: Engineering Safety Requirements for Autonomous Driving with Large Language Models
- arxiv url: http://arxiv.org/abs/2403.16289v1
- Date: Sun, 24 Mar 2024 20:40:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 16:36:49.006611
- Title: Engineering Safety Requirements for Autonomous Driving with Large Language Models
- Title(参考訳): 大規模言語モデルを用いた自律走行のための工学的安全要件
- Authors: Ali Nouri, Beatriz Cabrero-Daniel, Fredrik Törner, Hȧkan Sivencrona, Christian Berger,
- Abstract要約: 大きな言語モデル(LLM)は、更新毎に要求を自動的に精錬し、分解する上で重要な役割を果たす。
本研究では、アイテム定義を受信し、安全要件の形でソリューションを出力するプロンプトとLCMのパイプラインのプロトタイプを提案する。
- 参考スコア(独自算出の注目度): 0.6699222582814232
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Changes and updates in the requirement artifacts, which can be frequent in the automotive domain, are a challenge for SafetyOps. Large Language Models (LLMs), with their impressive natural language understanding and generating capabilities, can play a key role in automatically refining and decomposing requirements after each update. In this study, we propose a prototype of a pipeline of prompts and LLMs that receives an item definition and outputs solutions in the form of safety requirements. This pipeline also performs a review of the requirement dataset and identifies redundant or contradictory requirements. We first identified the necessary characteristics for performing HARA and then defined tests to assess an LLM's capability in meeting these criteria. We used design science with multiple iterations and let experts from different companies evaluate each cycle quantitatively and qualitatively. Finally, the prototype was implemented at a case company and the responsible team evaluated its efficiency.
- Abstract(参考訳): 自動車領域で頻繁に見られる要件アーティファクトの変更と更新は、SafetyOpsの課題である。
大きな言語モデル(LLM)は、その印象的な自然言語理解と生成能力を持ち、更新後の要求を自動的に精錬し、分解する上で重要な役割を担います。
本研究では、アイテム定義を受信し、安全要件の形でソリューションを出力するプロンプトとLCMのパイプラインのプロトタイプを提案する。
このパイプラインは要件データセットのレビューも行い、冗長あるいは矛盾した要件を特定する。
まず、まずharaの実行に必要な特性を特定し、これらの基準を満たすためのLCMの能力を評価するためのテストを定義した。
デザインサイエンスを複数のイテレーションで使い、さまざまな企業の専門家にそれぞれのサイクルを定量的に質的に評価させました。
最後に、プロトタイプはケース会社で実装され、責任あるチームはその効率を評価した。
関連論文リスト
- Can Long-Context Language Models Subsume Retrieval, RAG, SQL, and More? [54.667202878390526]
長文言語モデル(LCLM)は、従来、検索システムやデータベースといった外部ツールに依存していたタスクへのアプローチに革命をもたらす可能性がある。
実世界のタスクのベンチマークであるLOFTを導入し、文脈内検索と推論においてLCLMの性能を評価するために設計された数百万のトークンを出力する。
以上の結果からLCLMは,これらのタスクを明示的に訓練したことがないにも関わらず,最先端の検索システムやRAGシステムと競合する驚くべき能力を示した。
論文 参考訳(メタデータ) (2024-06-19T00:28:58Z) - Welcome Your New AI Teammate: On Safety Analysis by Leashing Large Language Models [0.6699222582814232]
「ハザード分析・リスクアセスメント」は、安全要件仕様の策定に欠かせないステップである。
本稿では,Large Language Models (LLMs) を用いた HARA の高度自動化を支援するフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-14T16:56:52Z) - Quantitative Assurance and Synthesis of Controllers from Activity
Diagrams [4.419843514606336]
確率的モデル検査は、定性的および定量的な性質を自動検証するために広く用いられている形式的検証手法である。
これにより、必要な知識を持っていない研究者やエンジニアにはアクセスできない。
本稿では,確率時間の新しいプロファイル,品質アノテーション,3つのマルコフモデルにおけるADの意味論的解釈,アクティビティ図からPRISM言語への変換ルールのセットなど,ADの総合的な検証フレームワークを提案する。
最も重要なことは、モデルをベースとした手法を用いて、完全自動検証のための変換アルゴリズムを開発し、QASCADと呼ばれるツールで実装したことです。
論文 参考訳(メタデータ) (2024-02-29T22:40:39Z) - PROXYQA: An Alternative Framework for Evaluating Long-Form Text Generation with Large Language Models [72.57329554067195]
ProxyQAは、長文生成を評価するための革新的なフレームワークである。
さまざまなドメインにまたがる詳細なヒューマンキュレートされたメタクエストで構成されており、それぞれに事前にアノテートされた回答を持つ特定のプロキシクエストが伴っている。
プロキシクエリに対処する際の評価器の精度を通じて、生成されたコンテンツの品質を評価する。
論文 参考訳(メタデータ) (2024-01-26T18:12:25Z) - TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z) - CLOMO: Counterfactual Logical Modification with Large Language Models [109.60793869938534]
本稿では,新しいタスク,CLOMO(Counterfactual Logical Modification)と高品質な人間アノテーションベンチマークを紹介する。
このタスクでは、LLMは所定の論理的関係を維持するために、与えられた議論的テキストを順応的に変更しなければなりません。
LLMの自然言語出力を直接評価する革新的な評価指標である自己評価スコア(SES)を提案する。
論文 参考訳(メタデータ) (2023-11-29T08:29:54Z) - Advancing Requirements Engineering through Generative AI: Assessing the
Role of LLMs [10.241642683713467]
大規模言語モデル(LLM)は、自然言語処理、コード生成、プログラム理解など、さまざまな領域において大きな可能性を示している。
本章では、要件関連タスクの効率性と正確性の向上を目的とした、要件エンジニアリングプロセスの駆動におけるLLMの可能性について論じる。
論文 参考訳(メタデータ) (2023-10-21T11:29:31Z) - Generative Judge for Evaluating Alignment [84.09815387884753]
本稿では,これらの課題に対処するために,13Bパラメータを持つ生成判断器Auto-Jを提案する。
我々のモデルは,大規模な実環境シナリオ下でのユーザクエリとLLM生成応答に基づいて訓練されている。
実験的に、Auto-Jはオープンソースモデルとクローズドソースモデルの両方を含む、強力なライバルのシリーズを上回っている。
論文 参考訳(メタデータ) (2023-10-09T07:27:15Z) - Natural Language Processing for Requirements Formalization: How to
Derive New Approaches? [0.32885740436059047]
我々はNLPの分野における主要な考え方と最先端の方法論について論じる。
我々は2つの異なるアプローチを詳細に議論し、ルールセットの反復的開発を強調した。
提案手法は, 自動車分野と鉄道分野の2つの産業分野において実証された。
論文 参考訳(メタデータ) (2023-09-23T05:45:19Z) - Technical Report on Neural Language Models and Few-Shot Learning for
Systematic Requirements Processing in MDSE [1.6286277560322266]
本論文は,自動車要件のオープンソースセットの分析に基づくものである。
ドメイン固有の言語構造を導き、要求の不明瞭さを回避し、形式性のレベルを上げるのに役立ちます。
論文 参考訳(メタデータ) (2022-11-16T18:06:25Z) - A Research Agenda for Artificial Intelligence in the Field of Flexible
Production Systems [53.47496941841855]
生産会社は、需要変動や要求の変化に対して生産制御を迅速に適応することに関して、問題に直面します。
サービスという意味で生産機能をカプセル化することを目的とした制御手法は,サイバー物理生産システムの柔軟性を高めるために有望であることが示されている。
しかし、そのようなアプローチの既存の課題は、要求された機能と提供された機能の間に直接(統語的)一致がない場合に、一連の要求に対して提供された機能に基づいて生産計画を見つけることである。
論文 参考訳(メタデータ) (2021-12-31T14:38:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。