Fugu-MT 論文翻訳(概要): Can Large Language Models assist in Hazard Analysis?

論文の概要: Can Large Language Models assist in Hazard Analysis?

arxiv url: http://arxiv.org/abs/2303.15473v1
Date: Sat, 25 Mar 2023 19:43:27 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-29 17:55:52.494779
Title: Can Large Language Models assist in Hazard Analysis?
Title（参考訳）: 大規模言語モデルは危険分析に役立つか?
Authors: Simon Diemert, Jens H Weber
Abstract要約: 大規模言語モデル(LLM)は、目覚ましい自然言語処理と生成能力を示している。本稿では,LLMを安全クリティカルシステムのハザード解析に組み込む可能性について検討する。
参考スコア（独自算出の注目度）: 1.599072005190786
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs), such as GPT-3, have demonstrated remarkable natural language processing and generation capabilities and have been applied to a variety tasks, such as source code generation. This paper explores the potential of integrating LLMs in the hazard analysis for safety-critical systems, a process which we refer to as co-hazard analysis (CoHA). In CoHA, a human analyst interacts with an LLM via a context-aware chat session and uses the responses to support elicitation of possible hazard causes. In this experiment, we explore CoHA with three increasingly complex versions of a simple system, using Open AI's ChatGPT service. The quality of ChatGPT's responses were systematically assessed to determine the feasibility of CoHA given the current state of LLM technology. The results suggest that LLMs may be useful for supporting human analysts performing hazard analysis.
Abstract（参考訳）: GPT-3のような大規模言語モデル(LLM)は、顕著な自然言語処理と生成能力を示し、ソースコード生成など様々なタスクに適用されている。本稿では,コハザード分析(CoHA)と呼ばれる安全クリティカルシステムのハザード解析におけるLSMの統合の可能性について検討する。 CoHAでは、人間アナリストがコンテキスト対応のチャットセッションを通じてLLMと対話し、その応答を使用して、潜在的な危険原因の誘発を支援する。本実験では,Open AIのChatGPTサービスを用いて,より複雑な3つの単純なシステムのCoHAを探索する。 LLM技術の現状を踏まえ、ChatGPTの応答の質を体系的に評価し、CoHAの有効性を判定した。その結果,llmはハザード分析を行う人の分析支援に有用である可能性が示唆された。

関連論文リスト

Multimodal Behavioral Patterns Analysis with Eye-Tracking and LLM-Based Reasoning [12.054910727620154]
視線追跡データは、ユーザの認知状態に関する貴重な洞察を明らかにするが、その構造化された非言語的な性質のために分析することは困難である。本稿では、視線追跡信号からの認知パターン抽出を促進するために、マルチモーダルな人間-AI協調フレームワークを提案する。
論文参考訳（メタデータ） (2025-07-24T09:49:53Z)
Advancing Harmful Content Detection in Organizational Research: Integrating Large Language Models with Elo Rating System [0.0]
大規模言語モデル(LLM)は、組織研究に有望な機会を提供する。彼らの内蔵モデレーションシステムは、研究者が有害なコンテンツを分析しようとすると、問題を引き起こす可能性がある。本稿では,有害コンテンツ分析のためのLCM性能を大幅に向上するElo評価手法を提案する。
論文参考訳（メタデータ） (2025-06-19T20:01:12Z)
The Risks of Using Large Language Models for Text Annotation in Social Science Research [3.276333240221372]
我々は,大規模言語モデル(LLM)をコーディングタスクに使用することの約束とリスクを体系的に評価する。社会科学者がLLMをテキストアノテーションに組み込むためのフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-27T23:33:36Z)
Potential and Perils of Large Language Models as Judges of Unstructured Textual Data [0.631976908971572]
本研究では,LLM-as-judgeモデルの有効性を検討した。 LLM-as-judgeは、人間に匹敵するスケーラブルなソリューションを提供するが、人間は微妙で文脈固有のニュアンスを検出するのに優れている。
論文参考訳（メタデータ） (2025-01-14T14:49:14Z)
Navigating the Risks: A Survey of Security, Privacy, and Ethics Threats in LLM-Based Agents [67.07177243654485]
この調査は、大規模言語モデルに基づくエージェントが直面するさまざまな脅威を収集、分析する。 LLMをベースとしたエージェントの6つの重要な特徴を概説する。 4つの代表エージェントをケーススタディとして選択し,実践的に直面する可能性のあるリスクを分析した。
論文参考訳（メタデータ） (2024-11-14T15:40:04Z)
Generative LLM Powered Conversational AI Application for Personalized Risk Assessment: A Case Study in COVID-19 [6.367429891237191]
大規模言語モデル(LLM)は、様々な自然言語タスクにおいて顕著な能力を示している。本研究は,ヒトとAIの会話をストリーミングすることで,LSMを用いた新たな疾病リスク評価手法を示す。
論文参考訳（メタデータ） (2024-09-23T13:55:13Z)
SHIELD: LLM-Driven Schema Induction for Predictive Analytics in EV Battery Supply Chain Disruptions [52.90276059116822]
ShiELDは、大型言語モデル(LLM)とEVバッテリサプライチェーンリスクアセスメントのためのドメインの専門知識を組み合わせたものだ。 365の資料(2022-2023)から12,070段落を評価したところ、ShiELDは破壊予測においてベースラインGCNとLLM+prompt法より優れていた。
論文参考訳（メタデータ） (2024-08-09T22:08:12Z)
CIBench: Evaluating Your LLMs with a Code Interpreter Plugin [68.95137938214862]
データサイエンスタスクにコードインタプリタを利用するLLMの能力を総合的に評価する,CIBenchという対話型評価フレームワークを提案する。評価データセットは,LLM-人的協調手法を用いて構築され,連続的かつ対話的なIPythonセッションを活用することによって,実際のワークフローをシミュレートする。コードインタプリタの利用において, CIBench 上で 24 個の LLM の能力を解析し, 将来の LLM に対する貴重な洞察を提供するため, 広範囲にわたる実験を行った。
論文参考訳（メタデータ） (2024-07-15T07:43:55Z)
AI Safety in Generative AI Large Language Models: A Survey [14.737084887928408]
生成的AI能力を示す大規模言語モデル(LLM)は、採用とイノベーションの加速に直面している。生成AI(GAI)は、これらのモデルに関連するリスクと安全性に関する懸念を必然的に高める。本稿では,コンピュータ科学者の視点からAI安全研究の最新の動向について報告する。
論文参考訳（メタデータ） (2024-07-06T09:00:18Z)
Online Safety Analysis for LLMs: a Benchmark, an Assessment, and a Path Forward [9.218557081971708]
大規模言語モデル(LLM)は多くの分野にまたがって広く応用されている。その限定的な解釈可能性によって、複数の側面からの安全な操作が懸念される。近年,LLMの品質保証手法の開発が進められている。
論文参考訳（メタデータ） (2024-04-12T14:55:16Z)
Mapping LLM Security Landscapes: A Comprehensive Stakeholder Risk Assessment Proposal [0.0]
本稿では,従来のシステムにおけるリスク評価手法のようなツールを用いたリスク評価プロセスを提案する。我々は、潜在的な脅威要因を特定し、脆弱性要因に対して依存するシステムコンポーネントをマッピングするためのシナリオ分析を行う。 3つの主要株主グループに対する脅威もマップ化しています。
論文参考訳（メタデータ） (2024-03-20T05:17:22Z)
LLM Inference Unveiled: Survey and Roofline Model Insights [62.92811060490876]
大規模言語モデル(LLM)推論は急速に進化しており、機会と課題のユニークなブレンドを提示している。本調査は, 研究状況を要約するだけでなく, 屋上モデルに基づく枠組みを導入することによって, 従来の文献レビューから際立っている。このフレームワークは、ハードウェアデバイスにLSMをデプロイする際のボトルネックを特定し、実用上の問題を明確に理解する。
論文参考訳（メタデータ） (2024-02-26T07:33:05Z)
Large Language Models for Code Analysis: Do LLMs Really Do Their Job? [13.48555476110316]
大規模言語モデル(LLM)は、自然言語理解とプログラミングコード処理タスクの領域において大きな可能性を証明している。本稿では、コード解析タスクの実行におけるLLMの能力を総合的に評価する。
論文参考訳（メタデータ） (2023-10-18T22:02:43Z)
Sentiment Analysis in the Era of Large Language Models: A Reality Check [69.97942065617664]
本稿では,大規模言語モデル(LLM)の様々な感情分析タスクの実行能力について検討する。 26のデータセット上の13のタスクのパフォーマンスを評価し、ドメイン固有のデータセットに基づいて訓練された小言語モデル(SLM)と比較した。
論文参考訳（メタデータ） (2023-05-24T10:45:25Z)
Trojaning Language Models for Fun and Profit [53.45727748224679]
TROJAN-LMは、悪質に製作されたLMがホストNLPシステムを故障させる新しいタイプのトロイの木馬攻撃である。セキュリティクリティカルなNLPタスクにおいて、3つの最先端のLMを実証的に研究することにより、TROJAN-LMが以下の特性を持つことを示す。
論文参考訳（メタデータ） (2020-08-01T18:22:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。