Fugu-MT 論文翻訳(概要): LLM-based Property-based Test Generation for Guardrailing Cyber-Physical Systems

論文の概要: LLM-based Property-based Test Generation for Guardrailing Cyber-Physical Systems

arxiv url: http://arxiv.org/abs/2505.23549v1
Date: Thu, 29 May 2025 15:27:52 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-30 18:14:07.939559
Title: LLM-based Property-based Test Generation for Guardrailing Cyber-Physical Systems
Title（参考訳）: LLMを用いたガードレール型サイバー物理システムのための特性ベーステスト生成
Authors: Khashayar Etemadi, Marjan Sirjani, Mahshid Helali Moghadam, Per Strandberg, Paul Pettersson,
Abstract要約: サイバー物理システム(サイバー物理システム、CPS)は、物理、計算、通信サブシステムを統合する複雑なシステムである。本稿では,Large Language Models (LLMs) が生成するプロパティベーステスト (PBTs) を用いたCPSの自動ガードレール手法を提案する。
参考スコア（独自算出の注目度）: 4.399669126285083
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: Cyber-physical systems (CPSs) are complex systems that integrate physical, computational, and communication subsystems. The heterogeneous nature of these systems makes their safety assurance challenging. In this paper, we propose a novel automated approach for guardrailing cyber-physical systems using property-based tests (PBTs) generated by Large Language Models (LLMs). Our approach employs an LLM to extract properties from the code and documentation of CPSs. Next, we use the LLM to generate PBTs that verify the extracted properties on the CPS. The generated PBTs have two uses. First, they are used to test the CPS before it is deployed, i.e., at design time. Secondly, these PBTs can be used after deployment, i.e., at run time, to monitor the behavior of the system and guardrail it against unsafe states. We implement our approach in ChekProp and conduct preliminary experiments to evaluate the generated PBTs in terms of their relevance (how well they match manually crafted properties), executability (how many run with minimal manual modification), and effectiveness (coverage of the input space partitions). The results of our experiments and evaluation demonstrate a promising path forward for creating guardrails for CPSs using LLM-generated property-based tests.
Abstract（参考訳）: サイバー物理システム(サイバー物理システム、CPS)は、物理、計算、通信サブシステムを統合する複雑なシステムである。これらのシステムの異種性は、安全性の保証を困難にしている。本稿では,Large Language Models (LLMs) が生成するプロパティベーステスト (PBTs) を用いて,サイバー物理システムをガードレールする新しい手法を提案する。我々のアプローチでは、CPSのコードとドキュメントからプロパティを抽出するためにLLMを使用します。次に, LLM を用いて, CPS の抽出特性を検証する PBT を生成する。生成されたPBTには2つの用途がある。まず、CPSがデプロイされる前に、すなわち設計時にテストするために使用される。第二に、これらのPBTはデプロイ後に、すなわち実行時にシステムの動作を監視し、安全でない状態から保護するために使用することができる。我々は、ChekPropに我々のアプローチを実装し、その関連性(手作業によるプロパティの適合性)、実行可能性(手作業による修正の少ない実行数)、有効性(入力空間分割のカバレッジ)の観点から、生成されたPBTを評価するための予備実験を行った。実験結果と評価結果から,LCM生成特性を用いたCPS用ガードレールの開発が期待できる道筋が示された。

関連論文リスト

Vulnerability Mitigation System (VMS): LLM Agent and Evaluation Framework for Autonomous Penetration Testing [0.0]
人間の介入なしに侵入試験を行うことのできる脆弱性軽減システム(VMS)を提案する。 VMSには、計画のための2つのアーキテクチャと、コマンドの生成とフィードバックの処理を可能にするSummarizerがある。テストの標準化のために,PicoCTFとOverTheWireをベースとした2つの新しいCapture the Flagベンチマークを設計した。
論文参考訳（メタデータ） (2025-07-14T06:19:17Z)
Private GPTs for LLM-driven testing in software development and machine learning [0.0]
要求に基づいて実行可能なテストコードを自動的に生成する,プライベートGPTの能力について検討する。私たちは受け入れ基準を入力として使用し、エピックやストーリーの一部として定式化します。
論文参考訳（メタデータ） (2025-06-06T20:05:41Z)
Training Language Models to Generate Quality Code with Program Analysis Feedback [66.0854002147103]
大規模言語モデル(LLM)によるコード生成は、ますます本番環境で採用されているが、コード品質の保証には失敗している。実運用品質のコードを生成するためにLLMにインセンティブを与える強化学習フレームワークであるREALを提案する。
論文参考訳（メタデータ） (2025-05-28T17:57:47Z)
Defending against Indirect Prompt Injection by Instruction Detection [81.98614607987793]
本稿では, 外部データを入力として取り込んで, 前方および後方の伝搬中におけるLCMの動作状態を利用して, 潜在的なIPI攻撃を検出する手法を提案する。提案手法は,ドメイン内設定で99.60%,ドメイン外設定で96.90%,攻撃成功率でBIPIAベンチマークで0.12%に低下する。
論文参考訳（メタデータ） (2025-05-08T13:04:45Z)
Federated Learning for Cyber Physical Systems: A Comprehensive Survey [49.54239703000928]
近年,フェデレートラーニング(FL)が普及している。この記事では、FLが、インテリジェントトランスポートシステム、サイバーセキュリティサービス、スマートシティ、スマートヘルスケアソリューションなど、重要なCPSアプリケーションでどのように利用されるのかを精査する。
論文参考訳（メタデータ） (2025-05-08T01:17:15Z)
AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文参考訳（メタデータ） (2024-11-02T13:24:30Z)
Get my drift? Catching LLM Task Drift with Activation Deltas [55.75645403965326]
タスクドリフトは攻撃者がデータを流出させたり、LLMの出力に影響を与えたりすることを可能にする。そこで, 簡易線形分類器は, 分布外テストセット上で, ほぼ完全なLOC AUCでドリフトを検出することができることを示す。このアプローチは、プロンプトインジェクション、ジェイルブレイク、悪意のある指示など、目に見えないタスクドメインに対して驚くほどうまく一般化する。
論文参考訳（メタデータ） (2024-06-02T16:53:21Z)
Large Language Models to Generate System-Level Test Programs Targeting Non-functional Properties [3.3305233186101226]
本稿では,テストプログラムを生成するためのLarge Language Models (LLM)を提案する。我々は、DUTの非機能特性を最適化するために、事前訓練されたLLMがテストプログラム生成でどのように機能するかを、一目で見てみる。
論文参考訳（メタデータ） (2024-03-15T08:01:02Z)
Test Case Generation and Test Oracle Support for Testing CPSs using Hybrid Models [2.6166087473624313]
サイバー物理システム(CPS)は、幅広い自律物理システムの振る舞いにおいて中心的な役割を果たす。 CPSはしばしば、シミュレーションシステムを介してテストできる異なるレベルのモデルのシーケンスとして反復的に指定される。そのようなモデルの1つはハイブリッドオートマトンであり、これらはCPSアプリケーションで頻繁に使用され、連続したCPS動作と離散的なCPS動作の両方をカプセル化する利点がある。
論文参考訳（メタデータ） (2023-09-14T19:08:09Z)
Can Large Language Models Write Good Property-Based Tests? [5.671039991090038]
プロパティベースのテスト(PBT)は、現実世界のソフトウェアではいまだにあまり使われていない。 2つのプロンプト手法を用いて,近代言語モデルを用いてPSTを自動的に合成する。最適なモデルとプロンプトアプローチにより,有効かつ健全なPBTを平均2.4サンプルで合成できることが判明した。
論文参考訳（メタデータ） (2023-07-10T05:09:33Z)
Stress Testing Control Loops in Cyber-Physical Systems [2.195923771201972]
制御とソフトウェア技術者が協調してソフトウェアを開発する制御ベースCPSの試験について検討する。制御ベースのCPSのストレステストは、そのような設計仮定を偽装するテストを生成するものとして定義する。我々は,ドローン,連続電流モータ,航空機を含む3つのケーススタディシステムに対するアプローチを評価した。
論文参考訳（メタデータ） (2023-02-27T16:01:38Z)
Prompt Tuning for Discriminative Pre-trained Language Models [96.04765512463415]
最近の研究は、自然言語処理(NLP)タスクに事前訓練言語モデル(PLM)を刺激する際の迅速なチューニングの有望な結果を示している。 ELECTRAのような差別的なPLMが、いかに効果的に迅速なチューニングが可能かは、まだ不明である。 DPTは,NLPタスクを識別言語モデリング問題に書き換える,識別型PLMの最初のプロンプトチューニングフレームワークである。
論文参考訳（メタデータ） (2022-05-23T10:11:50Z)
Dynamic Causal Effects Evaluation in A/B Testing with a Reinforcement Learning Framework [68.96770035057716]
A/Bテスト(A/B Testing)は、新しい製品を製薬、技術、伝統産業の古い製品と比較するビジネス戦略である。本稿では,オンライン実験においてA/Bテストを実施するための強化学習フレームワークを提案する。
論文参考訳（メタデータ） (2020-02-05T10:25:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。