Fugu-MT 論文翻訳(概要): Two-Stage Active Distribution Network Voltage Control via LLM-RL Collaboration: A Hybrid Knowledge-Data-Driven Approach

論文の概要: Two-Stage Active Distribution Network Voltage Control via LLM-RL Collaboration: A Hybrid Knowledge-Data-Driven Approach

arxiv url: http://arxiv.org/abs/2602.21715v1
Date: Wed, 25 Feb 2026 09:22:27 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-26 18:19:16.772967
Title: Two-Stage Active Distribution Network Voltage Control via LLM-RL Collaboration: A Hybrid Knowledge-Data-Driven Approach
Title（参考訳）: LLM-RLコラボレーションによる二段階アクティブ配電ネットワーク電圧制御:ハイブリッド知識データ駆動アプローチ
Authors: Xu Yang, Chenhui Lin, Xiang Ma, Dong Liu, Ran Zheng, Haotian Liu, Wenchuan Wu,
Abstract要約: 分散型太陽光発電をアクティブ配電ネットワーク(ADN)に統合することで、運用上の課題が悪化した。既存のデータ駆動型アプローチは、電圧制御問題において有効であることを示した。本稿では,大規模言語モデル (LLM) エージェントと強化学習 (RL) エージェントとの動的協調を利用するハイブリッドな知識データ駆動型アプローチを提案する。
参考スコア（独自算出の注目度）: 30.16233658525027
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The growing integration of distributed photovoltaics (PVs) into active distribution networks (ADNs) has exacerbated operational challenges, making it imperative to coordinate diverse equipment to mitigate voltage violations and enhance power quality. Although existing data-driven approaches have demonstrated effectiveness in the voltage control problem, they often require extensive trial-and-error exploration and struggle to incorporate heterogeneous information, such as day-ahead forecasts and semantic-based grid codes. Considering the operational scenarios and requirements in real-world ADNs, in this paper, we propose a hybrid knowledge-data-driven approach that leverages dynamic collaboration between a large language model (LLM) agent and a reinforcement learning (RL) agent to achieve two-stage voltage control. In the day-ahead stage, the LLM agent receives coarse region-level forecasts and generates scheduling strategies for on-load tap changer (OLTC) and shunt capacitors (SCs) to regulate the overall voltage profile. Then in the intra-day stage, based on accurate node-level measurements, the RL agent refines terminal voltages by deriving reactive power generation strategies for PV inverters. On top of the LLM-RL collaboration framework, we further propose a self-evolution mechanism for the LLM agent and a pretrain-finetune pipeline for the RL agent, effectively enhancing and coordinating the policies for both agents. The proposed approach not only aligns more closely with practical operational characteristics but also effectively utilizes the inherent knowledge and reasoning capabilities of the LLM agent, significantly improving training efficiency and voltage control performance. Comprehensive comparisons and ablation studies demonstrate the effectiveness of the proposed method.
Abstract（参考訳）: 分散型太陽光発電(PV)のアクティブ配電ネットワーク(ADN)への統合は、様々な機器の協調や電圧違反の軽減、電力品質の向上など、運用上の課題を悪化させている。既存のデータ駆動型アプローチは電圧制御問題において有効性を示しているが、大規模な試行錯誤とデイアヘッド予測やセマンティックベースグリッドコードのような異種情報の統合に苦慮することが多い。本稿では,実世界のADNの運用シナリオと要件を考慮して,大規模言語モデル(LLM)エージェントと強化学習(RL)エージェントとの動的協調を利用して2段階電圧制御を実現するハイブリッドな知識データ駆動手法を提案する。日頭段階では、LLMエージェントは、粗い領域レベルの予測を受け取り、オンロードタップチェンジャ(OLTC)とシャントコンデンサ(SC)のスケジューリング戦略を生成し、全体的な電圧プロファイルを調節する。そして、正確なノードレベル測定に基づいて、日中段階において、RLエージェントは、PVインバータの反応性発電戦略を導出して端子電圧を洗練する。さらに,LLM-RL協調フレームワーク上に,LLMエージェントの自己進化機構とRLエージェントのプレトレイン・ファネチューンパイプラインを提案し,両エージェントのポリシーを効果的に強化・調整する。提案手法は, 実用的特性だけでなく, LLMエージェントの本質的な知識と推論能力を有効利用し, トレーニング効率と電圧制御性能を大幅に向上させる。総合的な比較とアブレーション研究により,提案手法の有効性が示された。

関連論文リスト

Heterogeneous Agent Collaborative Reinforcement Learning [52.99813668995983]
不均一エージェント協調強化学習(HACRL) 本稿では,このパラダイムに基づいて,サンプル利用とエージェント間の知識伝達を最大化するために,原則的なロールアウト共有を可能にする協調RLアルゴリズムであるHACPOを提案する。多様な異種モデルの組み合わせと推論ベンチマークによる実験により、HACPOはすべてのエージェントを一貫して改善し、GSPOを平均3.3%上回り、ロールアウトコストの半分しか使っていないことが示された。
論文参考訳（メタデータ） (2026-03-03T05:09:49Z)
Large Language Model-Empowered Decision Transformer for UAV-Enabled Data Collection [71.84636717632206]
空間分散デバイスからの信頼性とエネルギー効率のよいデータ収集のための無人航空機(UAV)は、IoT(Internet of Things)アプリケーションをサポートする上で大きな可能性を秘めている。有効なUAV制御ポリシーを学習するための共同言語モデル(LLM)を提案する。 LLM-CRDTは、現在の最先端DTアプローチよりも最大36.7%高いエネルギー効率を達成し、オンラインおよびオフラインメソッドのベンチマークより優れている。
論文参考訳（メタデータ） (2025-09-17T13:05:08Z)
Agentic Reinforced Policy Optimization [66.96989268893932]
検証可能な報酬付き大規模強化学習(RLVR)は,大規模言語モデル(LLM)を単一ターン推論タスクに活用する効果を実証している。現在のRLアルゴリズムは、モデル固有のロングホライゾン推論能力と、マルチターンツールインタラクションにおけるその習熟性のバランスが不十分である。エージェント強化ポリシー最適化(ARPO: Agentic Reinforced Policy Optimization)は,マルチターンLDMエージェントを学習するためのエージェントRLアルゴリズムである。
論文参考訳（メタデータ） (2025-07-26T07:53:11Z)
LLM Meets the Sky: Heuristic Multi-Agent Reinforcement Learning for Secure Heterogeneous UAV Networks [57.27815890269697]
この研究は、エネルギー制約下での不均一なUAVネットワーク(HetUAVN)における機密率の最大化に焦点を当てている。本稿では,Large Language Model (LLM) を用いたマルチエージェント学習手法を提案する。その結果,本手法は機密性やエネルギー効率において,既存のベースラインよりも優れていた。
論文参考訳（メタデータ） (2025-07-23T04:22:57Z)
RL2: Reinforce Large Language Model to Assist Safe Reinforcement Learning for Energy Management of Active Distribution Networks [12.205847538487433]
大規模言語モデル(LLM)は、ADNにおけるエネルギー管理のための安全なRLを支援するための有望な方法を提供する。本稿では,複数ラウンドの対話を通して生成した関数を反復的かつ適応的に洗練するRL2機構を提案する。
論文参考訳（メタデータ） (2024-12-02T09:15:36Z)
Safety Constrained Multi-Agent Reinforcement Learning for Active Voltage Control [34.95810473913879]
能動電圧制御問題を制約付きマルコフゲームとして定式化し,安全性に制約のあるMARLアルゴリズムを提案する。実世界規模シナリオを用いた配電ネットワークシミュレーション環境における本手法の評価を行った。
論文参考訳（メタデータ） (2024-05-14T09:03:00Z)
Hybrid Reinforcement Learning for Optimizing Pump Sustainability in Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文参考訳（メタデータ） (2023-10-13T21:26:16Z)
Mastering the Unsupervised Reinforcement Learning Benchmark from Pixels [112.63440666617494]
強化学習アルゴリズムは成功するが、エージェントと環境の間の大量の相互作用を必要とする。本稿では,教師なしモデルベースRLを用いてエージェントを事前学習する手法を提案する。我々はReal-Word RLベンチマークにおいて、適応中の環境摂動に対する抵抗性を示唆し、堅牢な性能を示す。
論文参考訳（メタデータ） (2022-09-24T14:22:29Z)
Stabilizing Voltage in Power Distribution Networks via Multi-Agent Reinforcement Learning with Transformer [128.19212716007794]
本稿では,変圧器を用いたマルチエージェント・アクタ・クリティカル・フレームワーク(T-MAAC)を提案する。さらに、電圧制御タスクに適した新しい補助タスクトレーニングプロセスを採用し、サンプル効率を向上する。
論文参考訳（メタデータ） (2022-06-08T07:48:42Z)
Scalable Voltage Control using Structure-Driven Hierarchical Deep Reinforcement Learning [0.0]
本稿では,新しい階層型深層強化学習(drl)による電力系統の電圧制御設計を提案する。本研究では,電力系統の領域分割構造を利用して,大規模グリッドモデルに適用可能な階層型drl設計を提案する。地域別分散型RLエージェントを訓練し、各エリアの低レベルポリシーを算出し、低レベルポリシーの更新を使用して低レベルエージェントが行う制御アクションを効率的に調整する高レベルDRLエージェントを同時トレーニングします。
論文参考訳（メタデータ） (2021-01-29T21:30:59Z)
Distributed Voltage Regulation of Active Distribution System Based on Enhanced Multi-agent Deep Reinforcement Learning [9.7314654861242]
本稿では,スペクトルクラスタリングと拡張マルチエージェント深部強化学習(MADRL)アルゴリズムに基づくデータ駆動分散電圧制御手法を提案する。提案手法は,システムパラメータの通信と知識の要求を大幅に低減することができる。また、不確実性を効果的に処理し、最新のローカル情報に基づいたオンライン協調制御を提供する。
論文参考訳（メタデータ） (2020-05-31T15:48:27Z)
Two-stage Deep Reinforcement Learning for Inverter-based Volt-VAR Control in Active Distribution Networks [3.260913246106564]
本稿では,インバータを用いたエネルギー資源の制御により,電圧分布を改善するための2段階深部強化学習法を提案する。オフライン段階では、モデルミスマッチに頑健なオフラインエージェントを訓練するために、高い効率の対向強化学習アルゴリズムが開発された。連続的なオンライン段階において、オフラインエージェントをオンラインエージェントとして安全に転送し、継続的な学習を行い、オンラインで制御し、安全性と効率を大幅に向上させる。
論文参考訳（メタデータ） (2020-05-20T08:02:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。