論文の概要: Agentic Application in Power Grid Static Analysis: Automatic Code Generation and Error Correction
- arxiv url: http://arxiv.org/abs/2604.09995v1
- Date: Sat, 11 Apr 2026 02:56:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.784427
- Title: Agentic Application in Power Grid Static Analysis: Automatic Code Generation and Error Correction
- Title(参考訳): パワーグリッド静的解析におけるエージェント応用:自動コード生成と誤り訂正
- Authors: Qinjuan Wang, Shan Yang, Yongli Zhu,
- Abstract要約: 本稿では,自然言語を MATPOWER スクリプトに変換することで電力グリッド静的解析を自動化する LLM エージェントを提案する。
このフレームワークはDeepSeek-OCRを使用して、MATPOWERマニュアルから拡張ベクターデータベースを構築する。
- 参考スコア(独自算出の注目度): 8.968078260223113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces an LLM agent that automates power grid static analysis by converting natural language into MATPOWER scripts. The framework utilizes DeepSeek-OCR to build an enhanced vector database from MATPOWER manuals. To ensure reliability, it devises a three-tier error-correction system: a static pre-check, a dynamic feedback loop, and a semantic validator. Operating via the Model Context Protocol, the tool enables asynchronous execution and automatically debugging in MATLAB. Experimental results demonstrate that the system achieves a 82.38% accuracy regarding the code fidelity, effectively eliminating hallucinations even in complex analysis tasks.
- Abstract(参考訳): 本稿では,自然言語を MATPOWER スクリプトに変換することで電力グリッド静的解析を自動化する LLM エージェントを提案する。
このフレームワークはDeepSeek-OCRを使用して、MATPOWERマニュアルから拡張ベクターデータベースを構築する。
信頼性を確保するため、静的事前チェック、動的フィードバックループ、セマンティックバリデータという3段階のエラー訂正システムを考案した。
Model Context Protocolを介して操作することで、非同期実行とMATLABでの自動デバッグが可能になる。
実験結果から,複雑な解析タスクにおいても,コード忠実度に関する82.38%の精度で幻覚を効果的に除去できることがわかった。
関連論文リスト
- DebugHarness: Emulating Human Dynamic Debugging for Autonomous Program Repair [8.290621289192048]
DebugHarnessはLarge Language Model (LLM)を利用した自動デバッグエージェントである。
静的コードを調べる代わりに、DebugHarnessはライブランタイム環境に積極的に問い合わせる。
実世界のC/C++セキュリティ脆弱性の厳格なデータセットであるSEC-bench上でDebugHarnessを評価する。
論文 参考訳(メタデータ) (2026-04-04T06:49:30Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - AgentMath: Empowering Mathematical Reasoning for Large Language Models via Tool-Augmented Agent [80.83250816918861]
o3やDeepSeek-R1のようなLarge Reasoning Models (LRM)は、長いチェーン・オブ・シークレットを持つ自然言語推論において顕著な進歩を遂げている。
しかし、計算的に非効率であり、複雑な数学的操作を必要とする問題を解く際には精度に苦しむ。
本稿では,言語モデルの推論能力とコードインタプリタの計算精度をシームレスに統合するエージェントフレームワークであるAgentMathを紹介する。
論文 参考訳(メタデータ) (2025-12-23T19:57:49Z) - InspectCoder: Dynamic Analysis-Enabled Self Repair through interactive LLM-Debugger Collaboration [71.18377595277018]
大きな言語モデル(LLM)は、診断が難しい複雑なロジックエラーを伴うバグの多いコードを生成することが多い。
対話型デバッガ制御による動的解析を LLM に委ねる初のエージェントプログラム修復システムである InspectCoder を提案する。
論文 参考訳(メタデータ) (2025-10-21T06:26:29Z) - How Can Input Reformulation Improve Tool Usage Accuracy in a Complex Dynamic Environment? A Study on $τ$-bench [58.114899897566964]
マルチターンの会話環境では、大きな言語モデル(LLM)は、一貫性のある推論とドメイン固有のポリシーへの固執にしばしば苦労する。
本稿では,関連するドメインルールを付加したユーザクエリを自動的に再構成するIRMA(Input-Reformulation Multi-Agent)フレームワークを提案する。
IRMAはReAct、Function Calling、Self-Reflectionをそれぞれ16.1%、12.7%、19.1%で大きく上回っている。
論文 参考訳(メタデータ) (2025-08-28T15:57:33Z) - LLM-as-a-Judge for Reference-less Automatic Code Validation and Refinement for Natural Language to Bash in IT Automation [0.9176056742068815]
修復アクションの生成されたコードが構文的かつ意味論的に正しいかどうかを検証することは重要である。
本研究では,双方向機能マッチングと論理表現を用いたLLM-as-a-Judgeの改良に焦点を当てた。
結果は,実行ベース評価と高い精度と一致を示した。
論文 参考訳(メタデータ) (2025-06-12T19:15:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。