論文の概要: Using Large Language Models for Black-Box Testing of FMU-Based Simulations
- arxiv url: http://arxiv.org/abs/2604.25650v1
- Date: Tue, 28 Apr 2026 13:48:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.884354
- Title: Using Large Language Models for Black-Box Testing of FMU-Based Simulations
- Title(参考訳): 大規模言語モデルを用いたFMUシミュレーションのブラックボックステスト
- Authors: Abdullah Mughees, Gaadha Sudheerbabu, Tanwir Ahmad, Dragos Truscan, Mikael Manngård, Kristian Klemets,
- Abstract要約: 目標は、動的シミュレーションモデルのテストシナリオ定義における手作業の削減である。
このアプローチは、FMUの機能とインターフェースの仕様を入力として、LLMに構造化シナリオの目標を生成するよう促す。
オーバーレイ、アグリゲートパスレート、ゴールごとの結果を含む各シナリオの統計を示す、人間可読なログとプロットを生成する。
- 参考スコア(独自算出の注目度): 1.6624933615451842
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a human in the loop approach for black-box testing of Functional Mock-up Units (FMUs) using Large Language Models (LLMs). The goal is to reduce the manual effort in defining test scenarios for dynamic simulation models and to improve the interpretability of results. The approach takes the functional and interface specifications of an FMU as input, and prompts an LLM to generate structured scenario goals in Given-When-Then format that define the initial input conditions of the simulation, a possible change in those conditions, and the expected output behaviour of the system against those changes. The corresponding scenario plans specify input patterns and add assertion oracles that describe expected output patterns defined in scenario goals. The approach generates a complete input time series for the scenario plans, runs the FMU simulation, and evaluates assertions on the recorded outputs. It produces human-readable logs and plots that show statistics for each scenario with overlays, aggregate pass rates, and per-goal outcomes. The generated scenarios and results are stored for evaluation and later re-execution. We evaluate the approach on a Lube Oil Cooling system and discuss design choices that make the approach practical for everyday use. Results suggest that LLM-assisted scenario generation can facilitate automatic test design and verification of dynamic simulation models.
- Abstract(参考訳): 本稿では,Large Language Models (LLM) を用いたFMU(Functional Mock-up Units) のブラックボックステストのためのループ手法を提案する。
目標は、動的シミュレーションモデルのテストシナリオ定義における手作業の労力を削減し、結果の解釈可能性を改善することである。
このアプローチは、FMUの機能的およびインターフェース的仕様を入力として、シミュレーションの初期入力条件、それらの条件の変更の可能性、およびそれらの変更に対するシステムの期待される出力動作を定義するGiven-When-Thenフォーマットで、LLMに構造化されたシナリオ目標を生成するよう促す。
対応するシナリオプランでは、入力パターンを指定し、シナリオゴールで定義された期待出力パターンを記述するアサーションオラクルを追加する。
このアプローチはシナリオ計画のための完全な入力時系列を生成し、FMUシミュレーションを実行し、記録された出力に対するアサーションを評価する。
オーバーレイ、アグリゲートパスレート、ゴールごとの結果を含む各シナリオの統計を示す、人間可読なログとプロットを生成する。
生成されたシナリオと結果は、評価とその後の再実行のために格納される。
本稿では,Lub油冷システムへのアプローチを評価し,そのアプローチを日常的に活用するための設計選択について議論する。
その結果, LLMを用いたシナリオ生成により, 動的シミュレーションモデルの自動設計と検証が容易であることが示唆された。
関連論文リスト
- Matching Features, Not Tokens: Energy-Based Fine-Tuning of Language Models [102.20309135516186]
クロスエントロピー(CE)トレーニングは、言語モデルの密集したスケーラブルな監視を提供する。
言語モデル微調整のための特徴マッチング手法を提案する。
この目的を効率的に最適化するために,エネルギーベースファインチューニングを提案する。
論文 参考訳(メタデータ) (2026-03-12T17:57:50Z) - Declarative Scenario-based Testing with RoadLogic [2.2107822884016404]
宣言型OS2仕様と実行可能なシミュレーションを橋渡しするRoadLogicを提案する。
結果は、RoadLogicが数分で、現実的で、仕様に満足するシミュレーションを一貫して生成していることを示している。
論文 参考訳(メタデータ) (2026-03-10T10:11:09Z) - Model-Based Policy Adaptation for Closed-Loop End-to-End Autonomous Driving [54.46325690390831]
本稿では,事前学習したE2E運転エージェントのロバスト性と安全性を高めるための汎用フレームワークとして,モデルベースポリシー適応(MPA)を提案する。
MPAは、ジオメトリ一貫性のあるシミュレーションエンジンを用いて、まず様々な対物軌道を生成する。
MPAは拡散ベースのポリシーアダプタを訓練し、基本方針の予測を洗練させ、Q値モデルを多段階に分けて長期的な結果を評価する。
論文 参考訳(メタデータ) (2025-11-26T17:01:41Z) - AI for Distributed Systems Design: Scalable Cloud Optimization Through Repeated LLMs Sampling And Simulators [3.1594665317979698]
大規模言語モデルからのコード生成と決定論的検証をドメイン固有シミュレータで組み合わせ,AI駆動型分散システムポリシー設計について検討する。
複数のモデル間のスループット改善に関する予備的な結果を報告する。
我々は、AIが新しいシミュレータのブートストラップを支援することで、この方法論のスケールアップに不可欠であると推測する。
論文 参考訳(メタデータ) (2025-10-20T16:10:24Z) - Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。
私たちのフレームワークは、3つの新しい目標のファミリーにつながります。
Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文 参考訳(メタデータ) (2024-10-10T17:18:30Z) - Learning to Simulate: Generative Metamodeling via Quantile Regression [2.0613075946076904]
従来のメタモデリング技術は、シミュレータ入力と単一出力要約統計量の間の関係を学習する。
生成メタモデリングという新しい概念を提案する。
生成メタモデルは、入力仕様に基づいて多数のランダム出力を高速に生成することができる。
論文 参考訳(メタデータ) (2023-11-29T16:46:24Z) - Likelihood-Free Inference in State-Space Models with Unknown Dynamics [71.94716503075645]
本研究では、状態空間モデルにおいて、観測をシミュレートすることしかできず、遷移ダイナミクスが不明な潜在状態の推測と予測を行う手法を提案する。
本研究では,限られた数のシミュレーションで状態予測と状態予測を行う手法を提案する。
論文 参考訳(メタデータ) (2021-11-02T12:33:42Z) - Modular Deep Reinforcement Learning for Continuous Motion Planning with
Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。
LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。
モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文 参考訳(メタデータ) (2021-02-24T01:11:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。