論文の概要: Toward Automated Simulation Research Workflow through LLM Prompt Engineering Design
- arxiv url: http://arxiv.org/abs/2408.15512v3
- Date: Wed, 15 Jan 2025 09:12:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-16 15:50:57.101308
- Title: Toward Automated Simulation Research Workflow through LLM Prompt Engineering Design
- Title(参考訳): LLMプロンプト工学設計によるシミュレーション研究ワークフローの自動化に向けて
- Authors: Zhihan Liu, Yubo Chai, Jianfeng Li,
- Abstract要約: 本研究では,Large Language Models (LLM) を用いた自律型シミュレーションエージェント (ASA) の実現可能性について検討する。
実験ケースとして, 高分子鎖配座のよく研究されたシミュレーション問題を用いて, 異なるLCMを用いたASAの長期化と信頼性について検討した。
その結果,ASA-GPT-4oは指定された研究ミッションでほぼ不当に実行された。
- 参考スコア(独自算出の注目度): 5.03859766090879
- License:
- Abstract: The advent of Large Language Models (LLMs) has created new opportunities for the automation of scientific research spanning both experimental processes and computational simulations. This study explores the feasibility of constructing an autonomous simulation agent (ASA) powered by LLMs through prompt engineering and automated program design to automate the entire simulation research process according to a human-provided research plan. This process includes experimental design, remote upload and simulation execution, data analysis, and report compilation. Using a well-studied simulation problem of polymer chain conformations as a test case, we assessed the long-task completion and reliability of ASAs powered by different LLMs, including GPT-4o, Claude-3.5, etc. Our findings revealed that ASA-GPT-4o achieved near-flawless execution on designated research missions, underscoring the potential of methods like ASA to achieve automation in simulation research processes to enhance research efficiency. The outlined automation can be iteratively performed for up to 20 cycles without human intervention, illustrating the potential of ASA for long-task workflow automation. Additionally, we discussed the intrinsic traits of ASA in managing extensive tasks, focusing on self-validation mechanisms, and the balance between local attention and global oversight.
- Abstract(参考訳): LLM(Large Language Models)の出現は、実験プロセスと計算シミュレーションの両方にまたがる科学研究の自動化の新たな機会を生み出した。
本研究では,人為的な研究計画に従ってシミュレーション研究プロセス全体を自動化するために,LLMを用いた自律シミュレーションエージェント(ASA)の構築の実現可能性について検討した。
このプロセスには、実験的な設計、リモートアップロードとシミュレーションの実行、データ分析、レポートコンパイルが含まれる。
GPT-4o や Claude-3.5 など,様々な LLM を用いた ASA の長期化と信頼性について検討した。
その結果, ASA-GPT-4oは, 研究の効率を高めるためのシミュレーション研究プロセスにおける自動化を実現するために, ASAのような手法の可能性を秘めていることがわかった。
概説された自動化は、人間の介入なしに最大20サイクル反復的に実施することができ、長時間タスクのワークフロー自動化におけるASAの可能性を示している。
さらに,大規模なタスク管理におけるASAの本質的な特徴について考察し,自己検証機構に着目し,局所的な注意とグローバルな監視のバランスについて考察した。
関連論文リスト
- MDCrow: Automating Molecular Dynamics Workflows with Large Language Models [0.6130124744675498]
分子動力学シミュレーションを自動化可能なエージェントLLMアシスタントであるMDCrowを紹介する。
必要なサブタスクと難易度が異なる25タスクにまたがるMDCrowの性能を評価し,難易度と易易度の両方に対するエージェントの頑健さを評価する。
論文 参考訳(メタデータ) (2025-02-13T18:19:20Z) - LLM-Agents Driven Automated Simulation Testing and Analysis of small Uncrewed Aerial Systems [11.183147511573717]
小型無人航空機の正確な挙動を検証するためには, 粗いシミュレーション試験が重要である。
開発者をサポートするために様々なsUASシミュレーションツールが存在するが、シミュレーションテストの作成、実行、分析のプロセス全体が、手作業で面倒な作業である。
複数のLLMエージェントが協調してsUASシミュレーションテストプロセスをサポートするフレームワークであるAutoSimTestを提案する。
論文 参考訳(メタデータ) (2025-01-21T03:42:21Z) - The Potential of LLMs in Automating Software Testing: From Generation to Reporting [0.0]
手動テストは効果的だが、時間とコストがかかり、自動化メソッドの需要が増大する。
大規模言語モデル(LLM)の最近の進歩は、ソフトウェア工学に大きな影響を与えている。
本稿では,人間の介入を減らし,テスト効率を向上させるため,LSMを用いた自動ソフトウェアテストに対するエージェント指向アプローチについて検討する。
論文 参考訳(メタデータ) (2024-12-31T02:06:46Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - AutoFLUKA: A Large Language Model Based Framework for Automating Monte Carlo Simulations in FLUKA [6.571041942559539]
モンテカルロ (MC) シミュレーションは、科学と工学の分野で現実世界のシナリオを再現するために不可欠である。
堅牢性と汎用性にもかかわらず、FLUKAは自動化と外部の後処理ツールとの統合において大きな制限に直面している。
本研究では,これらの制約に対処するLarge Language Models(LLM)とAIエージェントの可能性について検討する。
本稿では、LangChain Python Frameworkを用いて開発され、FLUKAの典型的なMCシミュレーションを自動化するAIエージェントであるAutoFLUKAを紹介する。
論文 参考訳(メタデータ) (2024-10-19T21:50:11Z) - AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.565200973244146]
自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文 参考訳(メタデータ) (2024-10-03T20:01:09Z) - The Foundations of Computational Management: A Systematic Approach to
Task Automation for the Integration of Artificial Intelligence into Existing
Workflows [55.2480439325792]
本稿では,タスク自動化の体系的アプローチである計算管理を紹介する。
この記事では、ワークフロー内でAIを実装するプロセスを開始するための、ステップバイステップの手順を3つ紹介する。
論文 参考訳(メタデータ) (2024-02-07T01:45:14Z) - TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z) - ProAgent: From Robotic Process Automation to Agentic Process Automation [87.0555252338361]
LLM(Large Language Models)は、人間のような知性を持つ言語である。
本稿では,ALMをベースとしたエージェントを用いた高度な自動化のための基盤的自動化パラダイムであるエージェントプロセス自動化(APA)を紹介する。
そして、人間の指示を駆使し、特殊エージェントの調整によって複雑な決定を下すように設計されたエージェントであるProAgentをインスタンス化する。
論文 参考訳(メタデータ) (2023-11-02T14:32:16Z) - OmniForce: On Human-Centered, Large Model Empowered and Cloud-Edge
Collaborative AutoML System [85.8338446357469]
我々は人間中心のAutoMLシステムであるOmniForceを紹介した。
我々は、OmniForceがAutoMLシステムを実践し、オープン環境シナリオにおける適応型AIを構築する方法について説明する。
論文 参考訳(メタデータ) (2023-03-01T13:35:22Z) - Integrating Machine Learning with HPC-driven Simulations for Enhanced
Student Learning [0.0]
シミュレーション出力を生成するためのHPC駆動型シミュレーションとMLサロゲート手法の両方をサポートするWebアプリケーションを開発した。
授業内フィードバックと調査を通じて評価した結果,ML強化ツールは動的かつ応答性のあるシミュレーション環境を提供することがわかった。
論文 参考訳(メタデータ) (2020-08-24T22:48:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。