論文の概要: SimuAgent: An LLM-Based Simulink Modeling Assistant Enhanced with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2601.05187v1
- Date: Thu, 08 Jan 2026 18:10:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.327185
- Title: SimuAgent: An LLM-Based Simulink Modeling Assistant Enhanced with Reinforcement Learning
- Title(参考訳): SimuAgent:強化学習で強化されたLLMベースのシミュリンクモデリングアシスタント
- Authors: Yanchang Liang, Xiaowei Zhao,
- Abstract要約: 我々は,Simulinkに適したモデリングおよびシミュレーションエージェントであるSimuAgentを紹介する。
SimuAgentはXMLを簡潔な辞書スタイルのPython表現に置き換え、トークン数を劇的に削減する。
2段階で訓練された軽量な計画実行アーキテクチャは、エージェントに低レベルのツールスキルと高レベルの設計推論の両方を装備する。
- 参考スコア(独自算出の注目度): 3.1436750864792375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) have revolutionized text-based code automation, but their potential in graph-oriented engineering workflows remains under-explored. We introduce SimuAgent, an LLM-powered modeling and simulation agent tailored for Simulink. SimuAgent replaces verbose XML with a concise, dictionary-style Python representation, dramatically cutting token counts, improving interpretability, and enabling fast, in-process simulation. A lightweight plan-execute architecture, trained in two stages, equips the agent with both low-level tool skills and high-level design reasoning. To tackle sparse rewards in long-horizon tasks, we propose Reflection-GRPO (ReGRPO), which augments Group Relative Policy Optimization (GRPO) with self-reflection traces that supply rich intermediate feedback, accelerating convergence and boosting robustness. Experiments on SimuBench, our newly released benchmark comprising 5300 multi-domain modeling tasks, show that a Qwen2.5-7B model fine-tuned with SimuAgent converges faster and achieves higher modeling accuracy than standard RL baselines, and even surpasses GPT-4o when evaluated with few-shot prompting on the same benchmark. Ablations confirm that the two-stage curriculum and abstract-reconstruct data augmentation further enhance generalization. SimuAgent trains and runs entirely on-premise with modest hardware, delivering a privacy-preserving, cost-effective solution for industrial model-driven engineering. SimuAgent bridges the gap between LLMs and graphical modeling environments, offering a practical solution for AI-assisted engineering design in industrial settings.
- Abstract(参考訳): 大規模言語モデル(LLM)は、テキストベースのコード自動化に革命をもたらしたが、グラフ指向のエンジニアリングワークフローにおけるそのポテンシャルは、まだ探索されていない。
我々は,Simulinkに適したモデリングおよびシミュレーションエージェントであるSimuAgentを紹介する。
SimuAgentは冗長なXMLを簡潔な辞書スタイルのPython表現に置き換え、トークン数を劇的に削減し、解釈性を改善し、高速でプロセス内シミュレーションを可能にする。
2段階で訓練された軽量な計画実行アーキテクチャは、エージェントに低レベルのツールスキルと高レベルの設計推論の両方を装備する。
長期タスクにおけるスパース報酬に対処するため,グループ相対政策最適化(GRPO)を強化したリフレクション-GRPO(Respection-GRPO)を提案する。
5300個のマルチドメインモデリングタスクからなる新しいベンチマークであるSimuBenchの実験では、SimuAgentで微調整されたQwen2.5-7Bモデルが標準のRLベースラインよりも高速に収束し、モデリング精度が向上し、同じベンチマークで数発のプロンプトで評価すると、GPT-4oを超えている。
アブレーションは、2段階のカリキュラムと抽象的再構成データ拡張により、さらなる一般化が促進されることを確認した。
SimuAgentは、業界モデル駆動エンジニアリングのためのプライバシ保護で費用対効果の高いソリューションを提供する、控えめなハードウェアで、完全にオンプレミスで運用されている。
SimuAgentは、LLMとグラフィカルモデリング環境のギャップを埋め、産業環境におけるAI支援エンジニアリング設計の実践的なソリューションを提供する。
関連論文リスト
- Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models [78.73992315826035]
ネイティブエージェントインテリジェンスと高い計算効率を調和させる軽量言語モデルであるYoutu-LLMを紹介する。
Youtu-LLMは、スクラッチから体系的に推論と計画能力の育成まで事前訓練されている。
論文 参考訳(メタデータ) (2025-12-31T04:25:11Z) - DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning [56.887047551101574]
大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。
開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。
デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文 参考訳(メタデータ) (2024-02-27T12:26:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。