論文の概要: LLM-based Property-based Test Generation for Guardrailing Cyber-Physical Systems
- arxiv url: http://arxiv.org/abs/2505.23549v1
- Date: Thu, 29 May 2025 15:27:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.939559
- Title: LLM-based Property-based Test Generation for Guardrailing Cyber-Physical Systems
- Title(参考訳): LLMを用いたガードレール型サイバー物理システムのための特性ベーステスト生成
- Authors: Khashayar Etemadi, Marjan Sirjani, Mahshid Helali Moghadam, Per Strandberg, Paul Pettersson,
- Abstract要約: サイバー物理システム(サイバー物理システム、CPS)は、物理、計算、通信サブシステムを統合する複雑なシステムである。
本稿では,Large Language Models (LLMs) が生成するプロパティベーステスト (PBTs) を用いたCPSの自動ガードレール手法を提案する。
- 参考スコア(独自算出の注目度): 4.399669126285083
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Cyber-physical systems (CPSs) are complex systems that integrate physical, computational, and communication subsystems. The heterogeneous nature of these systems makes their safety assurance challenging. In this paper, we propose a novel automated approach for guardrailing cyber-physical systems using property-based tests (PBTs) generated by Large Language Models (LLMs). Our approach employs an LLM to extract properties from the code and documentation of CPSs. Next, we use the LLM to generate PBTs that verify the extracted properties on the CPS. The generated PBTs have two uses. First, they are used to test the CPS before it is deployed, i.e., at design time. Secondly, these PBTs can be used after deployment, i.e., at run time, to monitor the behavior of the system and guardrail it against unsafe states. We implement our approach in ChekProp and conduct preliminary experiments to evaluate the generated PBTs in terms of their relevance (how well they match manually crafted properties), executability (how many run with minimal manual modification), and effectiveness (coverage of the input space partitions). The results of our experiments and evaluation demonstrate a promising path forward for creating guardrails for CPSs using LLM-generated property-based tests.
- Abstract(参考訳): サイバー物理システム(サイバー物理システム、CPS)は、物理、計算、通信サブシステムを統合する複雑なシステムである。
これらのシステムの異種性は、安全性の保証を困難にしている。
本稿では,Large Language Models (LLMs) が生成するプロパティベーステスト (PBTs) を用いて,サイバー物理システムをガードレールする新しい手法を提案する。
我々のアプローチでは、CPSのコードとドキュメントからプロパティを抽出するためにLLMを使用します。
次に, LLM を用いて, CPS の抽出特性を検証する PBT を生成する。
生成されたPBTには2つの用途がある。
まず、CPSがデプロイされる前に、すなわち設計時にテストするために使用される。
第二に、これらのPBTはデプロイ後に、すなわち実行時にシステムの動作を監視し、安全でない状態から保護するために使用することができる。
我々は、ChekPropに我々のアプローチを実装し、その関連性(手作業によるプロパティの適合性)、実行可能性(手作業による修正の少ない実行数)、有効性(入力空間分割のカバレッジ)の観点から、生成されたPBTを評価するための予備実験を行った。
実験結果と評価結果から,LCM生成特性を用いたCPS用ガードレールの開発が期待できる道筋が示された。
関連論文リスト
- Training Language Models to Generate Quality Code with Program Analysis Feedback [66.0854002147103]
大規模言語モデル(LLM)によるコード生成は、ますます本番環境で採用されているが、コード品質の保証には失敗している。
実運用品質のコードを生成するためにLLMにインセンティブを与える強化学習フレームワークであるREALを提案する。
論文 参考訳(メタデータ) (2025-05-28T17:57:47Z) - Federated Learning for Cyber Physical Systems: A Comprehensive Survey [49.54239703000928]
近年,フェデレートラーニング(FL)が普及している。
この記事では、FLが、インテリジェントトランスポートシステム、サイバーセキュリティサービス、スマートシティ、スマートヘルスケアソリューションなど、重要なCPSアプリケーションでどのように利用されるのかを精査する。
論文 参考訳(メタデータ) (2025-05-08T01:17:15Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - Get my drift? Catching LLM Task Drift with Activation Deltas [55.75645403965326]
タスクドリフトは攻撃者がデータを流出させたり、LLMの出力に影響を与えたりすることを可能にする。
そこで, 簡易線形分類器は, 分布外テストセット上で, ほぼ完全なLOC AUCでドリフトを検出することができることを示す。
このアプローチは、プロンプトインジェクション、ジェイルブレイク、悪意のある指示など、目に見えないタスクドメインに対して驚くほどうまく一般化する。
論文 参考訳(メタデータ) (2024-06-02T16:53:21Z) - Large Language Models to Generate System-Level Test Programs Targeting Non-functional Properties [3.3305233186101226]
本稿では,テストプログラムを生成するためのLarge Language Models (LLM)を提案する。
我々は、DUTの非機能特性を最適化するために、事前訓練されたLLMがテストプログラム生成でどのように機能するかを、一目で見てみる。
論文 参考訳(メタデータ) (2024-03-15T08:01:02Z) - Test Case Generation and Test Oracle Support for Testing CPSs using
Hybrid Models [2.6166087473624313]
サイバー物理システム(CPS)は、幅広い自律物理システムの振る舞いにおいて中心的な役割を果たす。
CPSはしばしば、シミュレーションシステムを介してテストできる異なるレベルのモデルのシーケンスとして反復的に指定される。
そのようなモデルの1つはハイブリッドオートマトンであり、これらはCPSアプリケーションで頻繁に使用され、連続したCPS動作と離散的なCPS動作の両方をカプセル化する利点がある。
論文 参考訳(メタデータ) (2023-09-14T19:08:09Z) - Can Large Language Models Write Good Property-Based Tests? [5.671039991090038]
プロパティベースのテスト(PBT)は、現実世界のソフトウェアではいまだにあまり使われていない。
2つのプロンプト手法を用いて,近代言語モデルを用いてPSTを自動的に合成する。
最適なモデルとプロンプトアプローチにより,有効かつ健全なPBTを平均2.4サンプルで合成できることが判明した。
論文 参考訳(メタデータ) (2023-07-10T05:09:33Z) - Stress Testing Control Loops in Cyber-Physical Systems [2.195923771201972]
制御とソフトウェア技術者が協調してソフトウェアを開発する制御ベースCPSの試験について検討する。
制御ベースのCPSのストレステストは、そのような設計仮定を偽装するテストを生成するものとして定義する。
我々は,ドローン,連続電流モータ,航空機を含む3つのケーススタディシステムに対するアプローチを評価した。
論文 参考訳(メタデータ) (2023-02-27T16:01:38Z) - Dynamic Causal Effects Evaluation in A/B Testing with a Reinforcement
Learning Framework [68.96770035057716]
A/Bテスト(A/B Testing)は、新しい製品を製薬、技術、伝統産業の古い製品と比較するビジネス戦略である。
本稿では,オンライン実験においてA/Bテストを実施するための強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-05T10:25:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。