論文の概要: Exploring the Potential of Large Language Models in Simulink-Stateflow Mutant Generation
- arxiv url: http://arxiv.org/abs/2602.04066v1
- Date: Tue, 03 Feb 2026 23:01:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.301797
- Title: Exploring the Potential of Large Language Models in Simulink-Stateflow Mutant Generation
- Title(参考訳): Simulink-Stateflow Mutant 生成における大規模言語モデルの可能性を探る
- Authors: Pablo Valle, Shaukat Ali, Aitor Arrieta,
- Abstract要約: LLM(Large Language Models)は、Simulink-Stateflowモデルのための高品質でドメイン固有のミュータントを生成する。
LLMは手作業による突然変異ベースのベースラインの最大13倍の速度でミュータントを生成する。
分析の結果,低-ナトリウム温度値と組み合わせることで最適な結果が得られることがわかった。
- 参考スコア(独自算出の注目度): 11.706481833926818
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mutation analysis is a powerful technique for assessing test-suite adequacy, yet conventional approaches suffer from generating redundant, equivalent, or non-executable mutants. These challenges are particularly amplified in Simulink-Stateflow models due to the hierarchical structure these models have, which integrate continuous dynamics with discrete-event behaviors and are widely deployed in safety-critical Cyber-Physical Systems (CPSs). While prior work has explored machine learning and manually engineered mutation operators, these approaches remain constrained by limited training data and scalability issues. Motivated by recent advances in Large Language Models (LLMs), we investigate their potential to generate high-quality, domain-specific mutants for Simulink-Stateflow models. We develop an automated pipeline that converts Simulink-Stateflow models to structured JSON representations and systematically evaluates different mutation and prompting strategies across eight state-of-the-art LLMs. Through a comprehensive empirical study involving 38,400 LLM-generated mutants across four Simulink-Stateflow models, we demonstrate that LLMs generate mutants up to 13x faster than a manually engineered mutation-based baseline while producing significantly fewer equivalent and duplicate mutants and consistently achieving superior mutant quality. Moreover, our analysis reveals that few-shot prompting combined with low-to-medium temperature values yields optimal results. We provide an open-source prototype tool and release our complete dataset to facilitate reproducibility and advance future research in this domain.
- Abstract(参考訳): 突然変異解析はテスト適合性を評価する強力な手法であるが、従来の手法では冗長性、等価性、あるいは実行不可能な突然変異を生成することに苦しむ。
これらの課題は、特にSimulink-Stateflowモデルにおいて、これらのモデルが持つ階層構造により増幅され、連続力学と離散的な振る舞いを統合し、安全クリティカルなサイバー物理システム(CPS)に広く展開される。
これまでの研究では、機械学習と手作業による突然変異演算子について検討されてきたが、これらのアプローチは、限られたトレーニングデータとスケーラビリティの問題によって制約を受け続けている。
近年のLarge Language Models (LLMs) の進歩により,Simulink-Stateflowモデルのための高品質なドメイン固有変異体を生成する可能性について検討した。
我々は,Simulink-Stateflowモデルから構造化JSON表現に変換する自動パイプラインを開発し,異なる変異を体系的に評価し,8つの最先端LCMの戦略を推し進める。
4つのSimulink-Stateflowモデルにわたる38,400個のLPM生成変異体に関する総合的な実証研究を通じて、LSMは手作業による突然変異ベースラインよりも最大13倍高速に変異を発生し、同値で重複した変異体は著しく少なく、一貫して優れた変異品質を実現することを実証した。
さらに, 分析の結果, 低-ナトリウム温度値と組み合わせることで, 最適な結果が得られることがわかった。
私たちはオープンソースのプロトタイプツールを提供し、この領域における再現性を促進し、将来の研究を進めるために、完全なデータセットをリリースします。
関連論文リスト
- A Flow Model with Low-Rank Transformers for Incomplete Multimodal Survival Analysis [36.102030480314816]
本稿では,低ランクトランスフォーマーとフローベース生成モデルを組み合わせた,堅牢かつ柔軟なマルチモーダルサバイバル予測手法を提案する。
提案手法は, 完全モダリティ条件下での最先端性能を実現するだけでなく, 不完全モダリティシナリオ下での堅牢かつ優れた精度も維持する。
論文 参考訳(メタデータ) (2025-10-22T02:27:05Z) - Dynamicasome: a molecular dynamics-guided and AI-driven pathogenicity prediction catalogue for all genetic mutations [1.5071448753819772]
分子動力学シミュレーションから抽出した詳細なコンフォメーションデータをAIモデルに組み込むことで予測能力を向上することを示す。
疾患遺伝子PMM2の抜本的変異解析およびMDSに対する各変異体の構造モデルについて検討した。
我々の最高のパフォーマンスモデルである神経ネットワークモデルもまた、現在未知のシグニカンスと見なされているいくつかのPMM2変異の病原性を予測する。
論文 参考訳(メタデータ) (2025-09-23T17:33:05Z) - Transition Models: Rethinking the Generative Learning Objective [68.16330673177207]
有限時間間隔で状態遷移を解析的に定義する連続時間力学方程式を導入する。
これは、任意のステップ遷移に適応する新しい生成パラダイムである遷移モデル(TiM)をもたらす。
TiMは最先端のパフォーマンスを達成し、SD3.5 (8Bパラメータ)やFLUX.1 (12Bパラメータ)といった主要なモデルを超える。
論文 参考訳(メタデータ) (2025-09-04T17:05:59Z) - AI enhanced data assimilation and uncertainty quantification applied to
Geological Carbon Storage [0.0]
本稿では,Surrogate-based hybrid ESMDA (SH-ESMDA)を導入し,Surrogate-based hybrid ESMDA (SH-ESMDA)について述べる。
また,SurrogateをベースとしたHybrid RML(SH-RML)も導入する。
以上の結果より,SH-RMLは従来のESMDAと比較して不確実性が高いことが示唆された。
論文 参考訳(メタデータ) (2024-02-09T00:24:46Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Multi-fidelity Hierarchical Neural Processes [79.0284780825048]
多要素代理モデリングは、異なるシミュレーション出力を融合させることで計算コストを削減する。
本稿では,多階層型階層型ニューラルネットワーク(MF-HNP)を提案する。
疫学および気候モデリングタスクにおけるMF-HNPの評価を行い、精度と不確実性評価の観点から競合性能を達成した。
論文 参考訳(メタデータ) (2022-06-10T04:54:13Z) - Bayesian Active Learning for Discrete Latent Variable Models [19.852463786440122]
アクティブラーニングは、モデルのパラメータに適合するために必要なデータ量を削減しようとする。
潜在変数モデルは神経科学、心理学、その他の様々な工学、科学分野において重要な役割を果たす。
論文 参考訳(メタデータ) (2022-02-27T19:07:12Z) - Closed-form Continuous-Depth Models [99.40335716948101]
連続深度ニューラルモデルは高度な数値微分方程式解法に依存している。
我々は,CfCネットワークと呼ばれる,記述が簡単で,少なくとも1桁高速な新しいモデル群を提示する。
論文 参考訳(メタデータ) (2021-06-25T22:08:51Z) - Exploring the potential of transfer learning for metamodels of
heterogeneous material deformation [0.0]
転送学習は,低忠実度シミュレーションデータとシミュレーションデータの両方を利用することができることを示す。
我々は、大きな変形を受ける異種材料のオープンソースベンチマークデータセットであるMechanical MNISTを拡張した。
これらの低忠実度シミュレーション結果に基づいて学習したメタモデルに蓄積された知識の伝達は、高忠実度シミュレーションの結果を予測するのに使用されるメタモデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2020-10-28T12:43:46Z) - Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。