Fugu-MT 論文翻訳(概要): Enhancing LLMs for Power System Simulations: A Feedback-driven Multi-agent Framework

論文の概要: Enhancing LLMs for Power System Simulations: A Feedback-driven Multi-agent Framework

arxiv url: http://arxiv.org/abs/2411.16707v1
Date: Thu, 21 Nov 2024 19:01:07 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-04 19:03:11.148435
Title: Enhancing LLMs for Power System Simulations: A Feedback-driven Multi-agent Framework
Title（参考訳）: 電力系統シミュレーションのためのLLMの強化:フィードバック駆動型マルチエージェントフレームワーク
Authors: Mengshuo Jia, Zeyu Cui, Gabriela Hug,
Abstract要約: 電力系統のシミュレーションを管理するためのフィードバック駆動型マルチエージェントフレームワークを提案する。このフレームワークは、DalineとMATPOWERの69種類のタスクでそれぞれ93.13%と96.85%の成功率を達成した。また、高速で費用対効果の高いタスク実行をサポートし、トークンの平均コスト0.014 USDで各シミュレーションを約30秒で完了する。
参考スコア（独自算出の注目度）: 1.4255659581428337
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: The integration of experimental technologies with large language models (LLMs) is transforming scientific research, positioning AI as a versatile research assistant rather than a mere problem-solving tool. In the field of power systems, however, managing simulations -- one of the essential experimental technologies -- remains a challenge for LLMs due to their limited domain-specific knowledge, restricted reasoning capabilities, and imprecise handling of simulation parameters. To address these limitations, we propose a feedback-driven, multi-agent framework that incorporates three proposed modules: an enhanced retrieval-augmented generation (RAG) module, an improved reasoning module, and a dynamic environmental acting module with an error-feedback mechanism. Validated on 69 diverse tasks from Daline and MATPOWER, this framework achieves success rates of 93.13% and 96.85%, respectively, significantly outperforming the latest LLMs (ChatGPT 4o and o1-preview), which achieved a 27.77% success rate on standard simulation tasks and 0% on complex tasks. Additionally, our framework also supports rapid, cost-effective task execution, completing each simulation in approximately 30 seconds at an average cost of 0.014 USD for tokens. Overall, this adaptable framework lays a foundation for developing intelligent LLM-based assistants for human researchers, facilitating power system research and beyond.
Abstract（参考訳）: 実験技術と大きな言語モデル(LLM)の統合は科学研究を変革し、AIを単なる問題解決ツールではなく、汎用的な研究アシスタントとして位置づけている。しかし、電力システムの分野では、ドメイン固有の知識の制限、推論能力の制限、シミュレーションパラメータの即時処理などにより、LLMにとってシミュレーション管理は依然として課題である。これらの制約に対処するため,提案する3つのモジュールを組み込んだフィードバック駆動型マルチエージェント・フレームワークを提案する。拡張検索拡張生成(RAG)モジュール,改良された推論モジュール,エラーフィードバック機構を備えた動的環境作用モジュールである。 Daline と MATPOWER から69の多様なタスクで検証されたこのフレームワークは、それぞれ93.13%と96.85%の成功率を獲得し、最新の LLM (ChatGPT 4o と o1-preview) を著しく上回り、標準的なシミュレーションタスクでは27.77%、複雑なタスクでは0%の成功率を達成した。さらに、我々のフレームワークは、トークンの平均コスト0.014USDで、各シミュレーションを約30秒で完了する、高速でコスト効率のよいタスク実行もサポートしています。全体として、この適応可能なフレームワークは、人間の研究者のためのインテリジェントLLMベースのアシスタントを開発するための基盤を築き、パワーシステムの研究などを促進する。

関連論文リスト

IM-Chat: A Multi-agent LLM-based Framework for Knowledge Transfer in Injection Molding Industry [1.3369318110920576]
本研究では,大規模言語モデル(LLM)に基づくマルチエージェントフレームワークIM-Chatを紹介する。 IM-Chatは、限られた文書化された知識(例えば、トラブルシューティングテーブルやマニュアル)と、データ駆動プロセス条件生成器によってモデル化された広範囲なフィールドデータを統合する。 GPT-4o, GPT-4o-mini, GPT-3.5-turboizableにおける100個のシングルツールと60個のハイブリッドタスクのパフォーマンスを評価した。
論文参考訳（メタデータ） (2025-07-21T06:13:53Z)
Heterogeneous Group-Based Reinforcement Learning for LLM-based Multi-Agent Systems [25.882461853973897]
本稿では、相対報酬の利点を推定して政策更新を導くマルチエージェント不均一グループ政策最適化(MHGPO)を提案する。 MHGPOは、批判的ネットワークの必要性を排除し、安定性を向上し、計算オーバーヘッドを減らす。また,効率性と有効性を両立させる3つのグループロールアウトサンプリング戦略も導入する。
論文参考訳（メタデータ） (2025-06-03T10:17:19Z)
ReAgent-V: A Reward-Driven Multi-Agent Framework for Video Understanding [71.654781631463]
ReAgent-Vは、新しいエージェントビデオ理解フレームワークである。推論中に効率の良いフレーム選択とリアルタイムの報酬生成を統合する。 12のデータセットに対する大規模な実験は、一般化と推論において大きな成果を上げている。
論文参考訳（メタデータ） (2025-06-02T04:23:21Z)
MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。 MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文参考訳（メタデータ） (2025-05-12T17:35:43Z)
Nemotron-CrossThink: Scaling Self-Learning beyond Math Reasoning [66.43194385702297]
大規模言語モデル(LLM)は、特に強化学習(RL)を通じて強化された場合、強力な推論能力を示している。 NEMOTRON-CROSSTHINKは、多領域コーパスを体系的に組み込んだフレームワークであり、合成および実世界の問合せ対を含む。
論文参考訳（メタデータ） (2025-04-15T21:37:13Z)
The Future of MLLM Prompting is Adaptive: A Comprehensive Experimental Evaluation of Prompt Engineering Methods for Robust Multimodal Performance [0.393259574660092]
MLLM(Multimodal Large Language Models)は、機械がどのように処理し、人間のような応答を生成するかを変換するために設定される。本研究は,オープンソースMLLM13に対して,24タスクで適用した7つのプロンプトエンジニアリング手法の総合的実験評価である。
論文参考訳（メタデータ） (2025-04-14T12:31:39Z)
OmniNova:A General Multimodal Agent Framework [0.5439020425819]
特殊なツールを備えた大規模言語モデル(LLM)は、インテリジェントな自動化システムに新たな機会をもたらす。 OmniNovaはモジュール型のマルチエージェント自動化フレームワークで、言語モデルとWeb検索、クローリング、コード実行機能といった特殊なツールを組み合わせる。
論文参考訳（メタデータ） (2025-03-25T19:21:01Z)
Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-17T18:49:25Z)
LABIIUM: AI-Enhanced Zero-configuration Measurement Automation System [0.0]
本稿では,実験の合理化とユーザの生産性向上を目的としたAIによる計測自動化システムであるLABIiumを紹介する。 Lab-Automation-Measurement Bridges (LAMBs)はVSCodeやPythonといった標準ツールを使ったシームレスなインスツルメンタ接続を可能にし、セットアップのオーバーヘッドをなくす。この評価は、LABIiumが研究室の生産性を高め、研究と産業におけるデジタルトランスフォーメーションを支援する能力を強調している。
論文参考訳（メタデータ） (2024-12-07T00:15:24Z)
MALMM: Multi-Agent Large Language Models for Zero-Shot Robotics Manipulation [52.739500459903724]
大規模言語モデル(LLM)は、ロボティクスの操作やナビゲーションなど、さまざまな領域にまたがる優れた計画能力を示している。特殊なLLMエージェント間で高レベル計画および低レベル制御コード生成を分散する新しいマルチエージェントLLMフレームワークを提案する。長軸タスクを含む9つのRLBenchタスクに対するアプローチを評価し、ゼロショット環境でロボット操作を解く能力を実証した。
論文参考訳（メタデータ） (2024-11-26T17:53:44Z)
EVOLvE: Evaluating and Optimizing LLMs For Exploration [76.66831821738927]
大規模言語モデル(LLM)は、不確実性の下で最適な意思決定を必要とするシナリオにおいて、未調査のままである。多くのアプリケーションに関係のあるステートレス強化学習環境である,帯域幅を最適に決定できる LLM の (in) 能力の測定を行う。最適な探索アルゴリズムの存在を動機として,このアルゴリズム知識をLLMに統合する効率的な方法を提案する。
論文参考訳（メタデータ） (2024-10-08T17:54:03Z)
On the limits of agency in agent-based models [13.130587222524305]
エージェントベースモデリングは複雑なシステムに対する強力な洞察を提供するが、その実用性は計算の制約によって制限されている。大規模言語モデル(LLM)の最近の進歩は、適応エージェントによるABMを強化する可能性があるが、大規模なシミュレーションへの統合は依然として困難である。大規模シミュレーションにおいて,行動複雑性と計算効率のバランスをとる手法であるLSMアーチタイプを提案する。
論文参考訳（メタデータ） (2024-09-14T04:17:24Z)
Towards Fully Autonomous Research Powered by LLMs: Case Study on Simulations [5.03859766090879]
本研究では,大規模言語モデルを用いた自律型シミュレーションエージェントの実現可能性について検討する。高分子鎖配座のシミュレーション問題をケーススタディとして, 異なるLLMを用いたASAの性能評価を行った。その結果,ASA-GPT-4oは指定された研究ミッションでほぼ不当に実行された。
論文参考訳（メタデータ） (2024-08-28T03:48:05Z)
FactorLLM: Factorizing Knowledge via Mixture of Experts for Large Language Models [50.331708897857574]
本稿では,高度に訓練された高密度FFNを余分なサブネットワークに分解する新しいアプローチであるFacterLLMを紹介する。 FactorLLMは、最大85%のモデル性能を確保しながら、推論速度を30%以上増加させながら、ソースモデルに匹敵するパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-08-15T16:45:16Z)
Agent Q: Advanced Reasoning and Learning for Autonomous AI Agents [44.34340798542]
大きな言語モデル(LLM)は、複雑な推論を必要とする自然言語タスクにおいて顕著な能力を示している。静的データセットに対する従来の教師付き事前トレーニングは、自律的なエージェント機能を実現するには不十分である。本稿では,モンテカルロ木探索(MCTS)を自己批判機構と組み合わせ,エージェント間相互作用を反復的に微調整するフレームワークを提案する。
論文参考訳（メタデータ） (2024-08-13T20:52:13Z)
Enabling Large Language Models to Perform Power System Simulations with Previously Unseen Tools: A Case of Daline [1.4255659581428337]
この研究は、パワーシステムと大規模言語モデルの両方から専門知識を統合するモジュラーフレームワークを提案する。 GPT-4oのシミュレーション符号化精度は0%から96.07%に向上し、ChatGPT-4oのウェブインタフェースの33.8%の精度を上回っている。
論文参考訳（メタデータ） (2024-06-25T02:05:26Z)
Smurfs: Leveraging Multiple Proficiency Agents with Context-Efficiency for Tool Planning [14.635361844362794]
Smurfs'は、大規模言語モデルの応用に革命をもたらすために設計された最先端のマルチエージェントフレームワークである。 Smurfは、余分なコストなしで複雑なタスクを解くモデルの能力を高めることができる。
論文参考訳（メタデータ） (2024-05-09T17:49:04Z)
DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning [56.887047551101574]
大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文参考訳（メタデータ） (2024-02-27T12:26:07Z)
Large Multi-Modal Models (LMMs) as Universal Foundation Models for AI-Native Wireless Systems [57.41621687431203]
大規模言語モデル (LLM) と基礎モデルは6Gシステムのゲームチェンジャーとして最近注目されている。本稿では,人工知能(AI)ネイティブネットワークの展開に適したユニバーサルファンデーションモデルを設計するための包括的ビジョンを提案する。
論文参考訳（メタデータ） (2024-01-30T00:21:41Z)
LAMM: Language-Assisted Multi-Modal Instruction-Tuning Dataset, Framework, and Benchmark [81.42376626294812]
本稿では,Language-Assisted Multi-Modalインストラクションチューニングデータセット,フレームワーク,ベンチマークを提案する。我々の目標は、MLLMのトレーニングと評価のための成長するエコシステムとしてLAMMを確立することです。本稿では,2次元および3次元視覚のための広範囲な視覚タスクをカバーする包括的データセットとベンチマークを提案する。
論文参考訳（メタデータ） (2023-06-11T14:01:17Z)
Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。コア最適化問題の実用的なパラメトリゼーションを提供する。
論文参考訳（メタデータ） (2021-07-08T18:01:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。