Fugu-MT 論文翻訳(概要): ModiGen: A Large Language Model-Based Workflow for Multi-Task Modelica Code Generation

論文の概要: ModiGen: A Large Language Model-Based Workflow for Multi-Task Modelica Code Generation

arxiv url: http://arxiv.org/abs/2503.18460v1
Date: Mon, 24 Mar 2025 09:04:49 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-25 16:32:17.176328
Title: ModiGen: A Large Language Model-Based Workflow for Multi-Task Modelica Code Generation
Title（参考訳）: ModiGen: マルチタスクモデリングコード生成のための大規模言語モデルベースのワークフロー
Authors: Jiahui Xiang, Tong Ye, Peiyu Liu, Yinan Zhang, Wenhai Wang,
Abstract要約: 大規模言語モデル(LLM)は、コード生成において有望な能力を示しているが、モデリングへの応用はいまだに未検討である。我々の評価では、生成されたコードがうまくシミュレートできない場合が多いため、現在のLLMのかなりの制限が明らかになっている。本稿では、教師付き微調整、グラフ検索拡張生成、フィードバック最適化を統合して、Modelicaコード生成の精度と信頼性を向上させるためのワークフローを提案する。
参考スコア（独自算出の注目度）: 26.965467452327445
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Modelica is a widely adopted language for simulating complex physical systems, yet effective model creation and optimization require substantial domain expertise. Although large language models (LLMs) have demonstrated promising capabilities in code generation, their application to modeling remains largely unexplored. To address this gap, we have developed benchmark datasets specifically designed to evaluate the performance of LLMs in generating Modelica component models and test cases. Our evaluation reveals substantial limitations in current LLMs, as the generated code often fails to simulate successfully. To overcome these challenges, we propose a specialized workflow that integrates supervised fine-tuning, graph retrieval-augmented generation, and feedback optimization to improve the accuracy and reliability of Modelica code generation. The evaluation results demonstrate significant performance gains: the maximum improvement in pass@1 reached 0.3349 for the component generation task and 0.2457 for the test case generation task. This research underscores the potential of LLMs to advance intelligent modeling tools and offers valuable insights for future developments in system modeling and engineering applications.
Abstract（参考訳）: Modelicaは複雑な物理システムをシミュレートする言語として広く採用されているが、効果的なモデル生成と最適化には相当な専門知識が必要である。大規模言語モデル (LLM) はコード生成において有望な能力を示しているが、モデリングへの応用はいまだに未検討である。このギャップに対処するために、Modelicaコンポーネントモデルとテストケースを生成する際のLCMの性能を評価するためのベンチマークデータセットを開発した。我々の評価では、生成されたコードがうまくシミュレートできない場合が多いため、現在のLLMのかなりの制限が明らかになっている。これらの課題を克服するために、教師付き微調整、グラフ検索拡張生成、フィードバック最適化を統合して、Modelicaコード生成の精度と信頼性を向上させる特殊なワークフローを提案する。その結果,Pas@1の最大改善はコンポーネント生成タスクで0.3349,テストケース生成タスクで0.2457に達した。この研究は、LLMがインテリジェントモデリングツールを進化させる可能性を強調し、システムモデリングおよびエンジニアリングアプリケーションにおける将来の発展に貴重な洞察を提供する。

関連論文リスト

Efficient Model Selection for Time Series Forecasting via LLMs [52.31535714387368]
本稿では,Large Language Models (LLM) をモデル選択の軽量な代替手段として活用することを提案する。提案手法は, LLMの固有知識と推論能力を活用することで, 明示的な性能行列の必要性を解消する。
論文参考訳（メタデータ） (2025-04-02T20:33:27Z)
Evaluating the Process Modeling Abilities of Large Language Models -- Preliminary Foundations and Results [1.3812010983144802]
大規模言語モデル(LLM)は自然言語処理に革命をもたらした。 LLMがどの程度優れたプロセスモデルを生成するか、現在議論中である。我々はこれらの課題を詳細に議論し、これらの課題に科学的に取り組むための将来の実験について議論する。
論文参考訳（メタデータ） (2025-03-14T18:52:18Z)
Learning to Solve and Verify: A Self-Play Framework for Code and Test Generation [69.62857948698436]
大規模言語モデル(LLM)の最近の進歩は、コーディングベンチマークのパフォーマンスを改善している。しかし、手軽に利用できる高品質なデータの枯渇により、改善は停滞している。本稿では,単一モデルのコードとテスト生成能力を共同で改善するセルフプレイ・ソルバ検証フレームワークであるSol-Verを提案する。
論文参考訳（メタデータ） (2025-02-20T18:32:19Z)
Applying Large Language Models in Knowledge Graph-based Enterprise Modeling: Challenges and Opportunities [0.0]
エンタープライズモデリングにおける大規模言語モデル(LLM)は、最近、学術研究から産業応用へとシフトし始めている。本稿では,企業モデリングにおける知識グラフに基づくアプローチを採用し,LLMの潜在的なメリットについて検討する。
論文参考訳（メタデータ） (2025-01-07T06:34:17Z)
Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文参考訳（メタデータ） (2024-10-22T06:43:28Z)
On the Modeling Capabilities of Large Language Models for Sequential Decision Making [52.128546842746246]
大規模な事前訓練されたモデルでは、推論や計画タスクのパフォーマンスがますます向上している。我々は、直接的または間接的に、意思決定ポリシーを作成する能力を評価する。未知の力学を持つ環境において、合成データを用いた微調整LDMが報酬モデリング能力を大幅に向上させる方法について検討する。
論文参考訳（メタデータ） (2024-10-08T03:12:57Z)
Towards Synthetic Trace Generation of Modeling Operations using In-Context Learning Approach [1.8874331450711404]
本稿では,イベントログのモデリング,インテリジェントなモデリングアシスタント,モデリング操作の生成を組み合わせた概念的フレームワークを提案する。特に、アーキテクチャは、設計者がシステムを指定するのを助け、その操作をグラフィカルなモデリング環境内で記録し、関連する操作を自動的に推奨する、モデリングコンポーネントから構成される。
論文参考訳（メタデータ） (2024-08-26T13:26:44Z)
UICoder: Finetuning Large Language Models to Generate User Interface Code through Automated Feedback [21.858896845159208]
大規模言語モデル(LLM)は、視覚的に関連する設計をコンパイルし、生成するUIコードを生成するのに苦労する。生成を改善するための既存のアプローチは、高価な人間のフィードバックやプロプライエタリなモデルを蒸留することに依存している。提案手法は,既存のLLMから始まり,大規模合成データセットを自己生成することにより,改良されたモデルを反復的に生成する。
論文参考訳（メタデータ） (2024-06-11T21:53:46Z)
ORLM: A Customizable Framework in Training Large Models for Automated Optimization Modeling [15.67321902882617]
最適化モデルのための半自動データ合成フレームワークOR-Instructを紹介する。また,実用的なOR問題を解く上で,LLMを評価するための最初の産業ベンチマークであるIndustrialORを紹介した。
論文参考訳（メタデータ） (2024-05-28T01:55:35Z)
Enhancing Code Generation Performance of Smaller Models by Distilling the Reasoning Ability of LLMs [36.409470894115074]
我々は、LLMのコード生成推論機能をより小さなモデルに転送することを目的としたCodePLANフレームワークを提案する。提案手法は,APPSベンチマークにおいて,より小さなモデルのコード生成性能を130%以上向上させる。
論文参考訳（メタデータ） (2024-03-20T03:09:54Z)
LLM-Assisted Code Cleaning For Training Accurate Code Generators [53.087019724256606]
コードの品質を調査した結果,より構造化され,読みやすくなれば,コード生成性能が向上することがわかった。私たちは、これらの原則を使って既存のプログラムを変換する、新しいデータクリーニングパイプラインを構築します。提案手法を2つのアルゴリズムコード生成ベンチマークで評価した結果,微調整のCodeLLaMa-7Bでは,元のデータセットの微調整に比べて最大30%性能が向上していることがわかった。
論文参考訳（メタデータ） (2023-11-25T02:45:50Z)
Quantitatively Assessing the Benefits of Model-driven Development in Agent-based Modeling and Simulation [80.49040344355431]
本稿では,MDD とABMS プラットフォームの利用状況と開発ミスについて比較する。その結果、MDD4ABMSはNetLogoと類似した設計品質のシミュレーションを開発するのに、より少ない労力を必要とすることがわかった。
論文参考訳（メタデータ） (2020-06-15T23:29:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。