論文の概要: Multi-Agent Specification-based Metamorphic Testing of FMU-Based Simulations
- arxiv url: http://arxiv.org/abs/2605.25101v1
- Date: Sun, 24 May 2026 14:30:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.826059
- Title: Multi-Agent Specification-based Metamorphic Testing of FMU-Based Simulations
- Title(参考訳): マルチエージェント仕様に基づくFMUシミュレーションのメタモルフィックテスト
- Authors: Ashir Kulshreshtha, Abdullah Mughees, Gaadha Sudheerbabu, Tanwir Ahmad, Kristian Klemets, Dragos Truscan, Mikael Manngård,
- Abstract要約: 産業領域では、FMI(Functional Mock-up Interface)はシミュレーションモデルをFMU(Functional Mock-up Units)として交換するために使用される。
これらのシミュレーションモデルに有効なオーラクルを導出することは、明確な期待出力がないため、依然として困難である。
本稿では,FMUに基づくシミュレーションモデルの仕様ベースメタモルフィックテストのためのLLMを用いたマルチエージェントワークフローを提案する。
- 参考スコア(独自算出の注目度): 1.58310730488265
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In many industrial domains, the Functional Mock-up Interface (FMI) is used to exchange simulation models as Functional Mock-up Units (FMUs) across different partners using various modelling tools. This opens up the possibilities for simulation-based verification and validation using FMUs for ensuring reliable system behaviour. However, deriving effective test oracles for these simulation models remains challenging due to the absence of explicit expected outputs. This limits the applicability of conventional testing approaches, which require access to the internal workings of the systems. Metamorphic testing (MT) addresses this limitation by leveraging metamorphic relations (MRs), but extracting such relations from specifications remains largely a manual and error-prone process. To address this challenge, we propose an LLM-powered multi-agent workflow for specification-based metamorphic testing of FMU-based simulation models. The approach takes functional and interface specifications as input and orchestrates multiple agents to extract requirements and derive MRs. These MRs are expressed using Given-When-Then patterns to structure input conditions (Given), transformations (When), and expected output behaviours (Then). These relations are then used to generate metamorphic test cases, execute simulations, and evaluate output consistency across multiple sessions. We evaluate the approach on a Lube Oil Cooling system FMU, demonstrating its ability to automatically generate meaningful MRs and corresponding test cases. Preliminary results indicate that the proposed workflow can effectively support the systematic verification and validation of dynamic simulation models by reducing manual effort and improving test generation.
- Abstract(参考訳): 多くの産業領域において、FMI(Functional Mock-up Interface)は、様々なモデリングツールを使用して、異なるパートナー間でFMU(Functional Mock-up Units)としてシミュレーションモデルを交換するために使用される。
これにより、信頼性の高いシステム動作を保証するために、FMUを使用したシミュレーションベースの検証と検証の可能性が開ける。
しかしながら、これらのシミュレーションモデルに有効なオーラクルを導出することは、明確な期待出力がないため、依然として困難である。
これにより、システムの内部動作へのアクセスを必要とする従来のテストアプローチの適用性が制限される。
メタモルフィック・テスト(MT)は、メタモルフィック・リレーション(MR)を利用してこの制限に対処するが、仕様からそのようなリレーションシップを抽出することは、主に手動およびエラーを起こしやすいプロセスである。
この課題に対処するために、FMUシミュレーションモデルの仕様に基づくメタモルフィックテストのためのLLMを利用したマルチエージェントワークフローを提案する。
この手法は,入力条件 (Given), 変換 (When), 期待出力動作 (Then) を構成するために,Given-When-Then パターンを用いて表現される。
これらの関係は、メタモルフィックテストケースを生成し、シミュレーションを実行し、複数のセッションで出力一貫性を評価するために使用される。
我々は,Lub油冷システムFMUのアプローチを評価し,有意義なMRとそれに対応するテストケースを自動生成できることを実証した。
予備的な結果は,手作業の削減とテスト生成の改善により,動的シミュレーションモデルの体系的検証と検証を効果的に支援できることを示唆している。
関連論文リスト
- LiveFMBench: Unveiling the Power and Limits of Agentic Workflows in Specification Generation [75.05397479715576]
大規模言語モデル(LLM)とエージェントは有望な進歩を示しているが、その真の能力と失敗モードは未だ不明である。
CプログラムのためのLCMおよびエージェントベースの形式仕様生成に関する、最初の体系的および汚染に配慮した研究を提案する。
論文 参考訳(メタデータ) (2026-05-02T11:31:33Z) - Using Large Language Models for Black-Box Testing of FMU-Based Simulations [1.6624933615451842]
目標は、動的シミュレーションモデルのテストシナリオ定義における手作業の削減である。
このアプローチは、FMUの機能とインターフェースの仕様を入力として、LLMに構造化シナリオの目標を生成するよう促す。
オーバーレイ、アグリゲートパスレート、ゴールごとの結果を含む各シナリオの統計を示す、人間可読なログとプロットを生成する。
論文 参考訳(メタデータ) (2026-04-28T13:48:24Z) - SimMOF: AI agent for Automated MOF Simulations [1.5280683380195148]
金属-有機フレームワーク(MOF)は広大な設計空間を提供する。
SimMOFは、自然言語クエリからエンドツーエンドのMOFシミュレーションを変換する、大規模言語モデルベースのマルチエージェントフレームワークを自動化する。
SimMOF のユーザリクエストを依存性を意識した計画に入力し、実行可能な入力を生成し、シミュレーションを実行するために複数のエージェントを編成し、ユーザクエリに整合した結果を要約する。
論文 参考訳(メタデータ) (2026-03-31T02:08:50Z) - Model Utility Law: Evaluating LLMs beyond Performance through Mechanism Interpretable Metric [99.56567010306807]
大規模言語モデル(LLM)は、学術、産業、そして日々のアプリケーションに欠かせないものになっている。
大規模言語モデル (LLM) 時代における評価の課題の1つは一般化問題である。
従来の性能スコアを補完するメカニズムの解釈可能性向上指標であるモデル利用指数(MUI)を提案する。
論文 参考訳(メタデータ) (2025-04-10T04:09:47Z) - Revisit Mixture Models for Multi-Agent Simulation: Experimental Study within a Unified Framework [19.558523263211942]
マルチエージェントシミュレーションでは、行動多様性や閉ループ分布シフトが主な課題である。
本研究では,マルチモーダルエージェントの挙動を生成するための混合モデルを再検討し,本研究の主流となる手法について述べる。
本研究では,混合モデルに適したクローズドループサンプル生成手法を導入し,分散シフトを緩和する。
論文 参考訳(メタデータ) (2025-01-28T15:26:25Z) - Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。
私たちのフレームワークは、3つの新しい目標のファミリーにつながります。
Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文 参考訳(メタデータ) (2024-10-10T17:18:30Z) - MetaOpenFOAM: an LLM-based multi-agent framework for CFD [11.508919041921942]
MetaOpenFOAMは、新しいマルチエージェントコラボレーションフレームワークである。
入力として自然言語のみを用いてCFDシミュレーションタスクを完了することを目的としている。
MetaGPTのアセンブリラインパラダイムのパワーを利用する。
論文 参考訳(メタデータ) (2024-07-31T04:01:08Z) - Towards a Complete Metamorphic Testing Pipeline [56.75969180129005]
システムアンダーテスト(SUT)の連続実行における入出力ペア間の関係を調べてテストオラクル問題に対処するメタモルフィックテスト(MT)
これらの関係は、メタモルフィック関係 (MRs) と呼ばれ、特定の入力変化に起因する期待される出力変化を規定する。
本研究の目的は,MR の生成,制約の定義,MR 結果の説明可能性の提供を支援する手法とツールの開発である。
論文 参考訳(メタデータ) (2023-09-30T10:49:22Z) - Relational Reasoning via Set Transformers: Provable Efficiency and
Applications to MARL [154.13105285663656]
置換不変エージェントフレームワークを用いたMARL(Multi-A gent R einforcement Learning)は,実世界のアプリケーションにおいて大きな実証的成功を収めた。
残念なことに、このMARL問題の理論的理解は、多くのエージェントの呪いと、既存の著作における関係推論の限定的な探索によって欠落している。
モデルフリーアルゴリズムとモデルベースアルゴリズムの最適度差は各エージェント数に独立して対数的であり、多くのエージェントの呪いを和らげる。
論文 参考訳(メタデータ) (2022-09-20T16:42:59Z) - Calibrating Over-Parametrized Simulation Models: A Framework via
Eligibility Set [3.862247454265944]
厳密な頻繁な統計的保証を満たす校正手法を開発するための枠組みを開発する。
本手法は,書籍市場シミュレータのキャリブレーションへの応用を含む,いくつかの数値例で実証する。
論文 参考訳(メタデータ) (2021-05-27T00:59:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。