論文の概要: Structure- and Event-Driven Frameworks for State Machine Modeling with Large Language Models
- arxiv url: http://arxiv.org/abs/2604.00275v1
- Date: Tue, 31 Mar 2026 22:01:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.74206
- Title: Structure- and Event-Driven Frameworks for State Machine Modeling with Large Language Models
- Title(参考訳): 大規模言語モデルを用いた状態マシンモデリングのための構造とイベント駆動フレームワーク
- Authors: Samer Abdulkarim, Evan Boyd, Karl Bridi, Alec Tufenkjian, Boqi Chen, Gunter Mussbacher,
- Abstract要約: 我々は、ステート・マシン・フレームワーク(SMF)を介して、ステート・マシン・ジェネレーションを完全に自動化する現在の大規模言語モデルの能力について検討する。
単一ステップと複数ステップのアプローチを用いて2種類の最先端LCMを評価し、単一プロンプトベースラインからの出力を初期ドラフト状態マシンとして利用する新しいハイブリッドアプローチを提案する。
- 参考スコア(独自算出の注目度): 3.6256722508266273
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: UML state machine design is a critical process in software engineering. Traditionally, state machines are manually crafted by experienced engineers based on natural language requirements-a time-consuming and error-prone procedure. Many automated approaches exist but they require structured NL requirements. In this paper, we investigate the capabilities of current Large Language Models to fully automate UML state machine generation via specialized State Machine Frameworks (SMFs) from non-structured NL requirements. We evaluate two types of state-of-the-art LLMs using single-step and multi-step prompting approaches: a non-reasoning LLM GPT-4o and a reasoning-focused LLM Claude 3.5 Sonnet, and introduce a novel Hybrid Approach that uses the output from a Single-Prompt Baseline as an initial draft state machine, which is then refined through an SMF. In our study, two distinct SMFs are developed based on human approaches: (i) a Structure-Driven SMF, in which state machine components (states, transitions, guards, actions, etc.) are generated in sequential steps, and (ii) an Event-Driven SMF, where identified events iteratively guide state machine construction. Our experiments indicate that while LLMs demonstrate a promising ability to generate state machine models from the Single-Prompt Baseline (e.g., F1-scores of 0.90 for states and 0.75 for transitions using Claude 3.5 Sonnet), their performance is not yet fully sufficient for a fully automated solution (e.g., F1-scores of 0.23 for guards and 0.00 for actions for GPT-4o). Our proposed Hybrid Approach improves the performance of the non-reasoning LLM (GPT-4o) to a similar level as the reasoning LLM (Claude 3.5 Sonnet) but does not further improve the reasoning LLM. Our evaluation highlights both the potential and the limitations of current LLMs for automated state machine design, providing a baseline for future research in this domain.
- Abstract(参考訳): UMLステートマシン設計は、ソフトウェア工学において重要なプロセスである。
従来、ステートマシンは、自然言語の要求に基づいて経験豊富なエンジニアによって手作業で作成される。
多くの自動化アプローチが存在するが、それらは構造化されたNL要求を必要とする。
本稿では,非構造化NL要求からの特殊状態マシンフレームワーク(SMF)を介してUML状態マシン生成を完全自動化する,現在の大規模言語モデルの能力について検討する。
単段および複数段のプロンプトアプローチを用いて,非推論型LCM GPT-4oと推論型LCM Claude 3.5 Sonnetの2種類の最先端LCMを評価し,単一プロンプトベースラインからの出力を初期ドラフトステートマシンとして利用するハイブリッドアプローチを導入し,SMFにより洗練する。
本研究では,2つの異なるSMFを人間のアプローチに基づいて開発する。
一 状態機械部品(状態、遷移、警備、行動等)を順次に生成する構造駆動型SMF
i) イベント駆動SMF(Event-Driven SMF)。
LLMは単一プロンプトベースラインからステートマシンモデルを生成する有望な能力を示す(例えば、状態は0.90、遷移は0.75、Claude 3.5 Sonnet)が、完全に自動化されたソリューション(例えば、ガードはF1スコア、GPT-4oは0.23スコア、GPT-4oは0.00スコア)には不十分である。
提案手法は,非共振LLM(GPT-4o)の性能を,推論LLM(Claude 3.5 Sonnet)と同等に向上させるが,推論LLMをさらに改善しない。
本評価では, 自動状態機械設計における現在のLLMの可能性と限界を両立させ, この領域における今後の研究のベースラインを提供する。
関連論文リスト
- Class Model Generation from Requirements using Large Language Models [5.685497917524985]
大規模言語モデル(LLM)は、自然言語要求から自動的にクラス図を生成することができる。
本稿では,GPT-5,Claude Sonnet 4.0,Gemini 2.5 Flash Thinking,Llama-3.1-8-B-Instructなどの最先端LLMの能力について検討する。
論文 参考訳(メタデータ) (2026-03-10T02:20:35Z) - CFD-copilot: leveraging domain-adapted large language model and model context protocol to enhance simulation automation [6.71937346130764]
CFD-copilotは、セットアップから後処理までの自然言語駆動CFDシミュレーションを容易にするために設計されたフレームワークである。
後処理では、外部ツールの実行からLCM推論を分離するオープンスタンダードであるMCP(Model context Protocol)を利用する。
この枠組みはNACA0012翼と3要素30P-30N翼を含むベンチマークで評価された。
論文 参考訳(メタデータ) (2025-12-08T11:42:32Z) - Mono-InternVL-1.5: Towards Cheaper and Faster Monolithic Multimodal Large Language Models [70.59376970630387]
本稿では,モノリシックなマルチモーダル大言語モデル(MLLM)について述べる。
モノリシックMLLMの既存の構造と事前学習戦略は不安定な最適化と破滅的な忘れ込みに悩まされることが多い。
これらの課題に対処するために、我々は、新しい視覚パラメータ空間を事前訓練されたLLMに組み込むことで、デルタチューニングによるノイズの多いデータから視覚知識の安定した学習を可能にする。
論文 参考訳(メタデータ) (2025-07-16T18:31:23Z) - FusionFactory: Fusing LLM Capabilities with Multi-LLM Log Data [60.09659670497899]
大規模言語モデル(LLM)は、さまざまなモデルのランドスケープを持ち、それぞれが異なるタスクで優れています。
この多様性は、研究者に複数のLLMを実際に採用させ、貴重なマルチLLMログデータを残します。
1)実世界のサービスシナリオ(例えば、ローカルおよびAPIベースのサービス)との互換性と、(2)様々なユーザニーズを満たすためにLLMパイプラインの異なる段階での運用の柔軟性である。
論文 参考訳(メタデータ) (2025-07-14T17:58:02Z) - Autonomous Control Leveraging LLMs: An Agentic Framework for Next-Generation Industrial Automation [0.0]
本稿では,大規模言語モデル(LLM)を個別のフォールトリカバリ計画と継続的プロセス制御の両方に活用する統合エージェントフレームワークを提案する。
その結果、構造化されたフィードバックとモジュラーエージェントにより、LLMは高レベルな記号計画と低レベルな連続制御を統一できることを示した。
論文 参考訳(メタデータ) (2025-07-03T11:20:22Z) - Self-Steering Language Models [113.96916935955842]
DisCIPL は "self-steering" 言語モデル (LM) の手法である。
DisCIPLは、Followerモデルの集団によって実行されるタスク固有の推論プログラムを生成する。
我々の研究は、高度に並列化されたモンテカルロ推論戦略の設計空間を開く。
論文 参考訳(メタデータ) (2025-04-09T17:54:22Z) - AutoM3L: An Automated Multimodal Machine Learning Framework with Large Language Models [6.496539724366041]
本稿では,革新的マルチモーダル機械学習フレームワークAutoM3Lを紹介する。
AutoM3Lはデータモダリティを理解し、ユーザ要求に基づいて適切なモデルを選択する。
6つの多様なマルチモーダルデータセット上でのAutoM3Lの性能評価を行った。
論文 参考訳(メタデータ) (2024-08-01T16:01:51Z) - Verbalized Machine Learning: Revisiting Machine Learning with Language Models [63.10391314749408]
言語化機械学習(VML)の枠組みを紹介する。
VMLはパラメータ空間を人間の解釈可能な自然言語に制限する。
我々は,VMLの有効性を実証的に検証し,VMLがより強力な解釈可能性を実現するためのステップストーンとして機能することを期待する。
論文 参考訳(メタデータ) (2024-06-06T17:59:56Z) - Fine-Tuning and Prompt Engineering for Large Language Models-based Code Review Automation [4.941630596191807]
コードレビュー自動化にLLM(Large Language Models)を利用する場合、ファインチューニングとプロンプトが一般的なアプローチである。
LLMベースのコードレビュー自動化では、モデルファインチューニングと推論技術(ゼロショット学習、少数ショット学習、ペルソナ)を使用します。
その結果、ゼロショット学習によるGPT-3.5は、Guoらのアプローチよりも73.17%-74.23%高いEMが得られることがわかった。
論文 参考訳(メタデータ) (2024-02-01T03:10:26Z) - Language Models Enable Simple Systems for Generating Structured Views of Heterogeneous Data Lakes [54.13559879916708]
EVAPORATEは大規模言語モデル(LLM)を利用したプロトタイプシステムである。
コード合成は安価だが、各文書をLSMで直接処理するよりもはるかに正確ではない。
直接抽出よりも優れた品質を実現する拡張コード実装EVAPORATE-CODE+を提案する。
論文 参考訳(メタデータ) (2023-04-19T06:00:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。