論文の概要: Evolving LLM-Derived Control Policies for Residential EV Charging and Vehicle-to-Grid Energy Optimization
- arxiv url: http://arxiv.org/abs/2602.07275v1
- Date: Fri, 06 Feb 2026 23:59:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.543766
- Title: Evolving LLM-Derived Control Policies for Residential EV Charging and Vehicle-to-Grid Energy Optimization
- Title(参考訳): 家庭用EV充電と車両間エネルギー最適化のためのLCM依存制御方式の進化
- Authors: Vishesh Purnananda, Benjamin John Wruck, Mingyu Guo,
- Abstract要約: 本研究では,電気自動車(EV)エネルギー管理分野への進化計算の新たな応用を提案する。
強化学習(RL)は、車両間グリッド(V2G)最適化において高いパフォーマンスを達成するが、消費者や規制機関にとって監査が難しい不透明な「ブラックボックス」ニューラルネットワークを生成するのが一般的である。
本稿では,大規模言語モデル(LLM)を反復的即効性修復ループ内の知的突然変異演算子として活用する検索フレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.073682493135313
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This research presents a novel application of Evolutionary Computation to the domain of residential electric vehicle (EV) energy management. While reinforcement learning (RL) achieves high performance in vehicle-to-grid (V2G) optimization, it typically produces opaque "black-box" neural networks that are difficult for consumers and regulators to audit. Addressing this interpretability gap, we propose a program search framework that leverages Large Language Models (LLMs) as intelligent mutation operators within an iterative prompt-evaluation-repair loop. Utilizing the high-fidelity EV2Gym simulation environment as a fitness function, the system undergoes successive refinement cycles to synthesize executable Python policies that balance profit maximization, user comfort, and physical safety constraints. We benchmark four prompting strategies: Imitation, Reasoning, Hybrid and Runtime, evaluating their ability to discover adaptive control logic. Results demonstrate that the Hybrid strategy produces concise, human-readable heuristics that achieve 118% of the baseline profit, effectively discovering complex behaviors like anticipatory arbitrage and hysteresis without explicit programming. This work establishes LLM-driven Evolutionary Computation as a practical approach for generating EV charging control policies that are transparent, inspectable, and suitable for real residential deployment.
- Abstract(参考訳): 本研究では,電気自動車(EV)エネルギー管理分野への進化計算の新たな応用を提案する。
強化学習(RL)は、車両間グリッド(V2G)最適化において高いパフォーマンスを達成するが、消費者や規制機関にとって監査が難しい不透明な「ブラックボックス」ニューラルネットワークを生成するのが一般的である。
この解釈可能性のギャップに対処するため,我々は大規模言語モデル (LLM) を反復的プロンプト・評価・修復ループ内の知的突然変異演算子として活用するプログラム探索フレームワークを提案する。
高忠実度EV2Gymシミュレーション環境をフィットネス機能として利用し、収益の最大化、ユーザの快適性、物理的安全性の制約を均衡させる実行可能なPythonポリシーを連続的に改善する。
我々は、Imitation、Reasoning、Hybrid、Runtimeの4つのプロンプト戦略をベンチマークし、適応制御ロジックの発見能力を評価する。
その結果、ハイブリッド戦略は、ベースライン利益の118%を達成し、明示的なプログラミングなしに予測仲裁やヒステリシスのような複雑な振る舞いを効果的に発見する、簡潔で可読なヒューリスティックを生み出すことを示した。
本研究は, 透過性, 検査性, 実際の住宅配置に適したEV充電制御ポリシを生成するための実用的アプローチとして, LLM駆動の進化計算を確立した。
関連論文リスト
- EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - Optimizing Electric Vehicle Charging Station Placement Using Reinforcement Learning and Agent-Based Simulations [5.6037668742884135]
強化学習は、最適な充電ステーション位置を特定する革新的なアプローチを提供する。
本稿では,EVの動作をモデル化し,充電需要をリアルタイムで推定するために,ディープRLとエージェントベースシミュレーションを統合した新しいフレームワークを提案する。
提案手法では,2つのQ-networksを持つハイブリッドRLエージェントを用いて最適な位置を選択し,充電ポートを設定する。
論文 参考訳(メタデータ) (2025-11-03T04:22:39Z) - Control of Renewable Energy Communities using AI and Real-World Data [0.0]
本稿では,これらの複雑さを明示的に扱えるよう設計したフレームワークを導入し,シミュレーションと現実のギャップを埋める。
それは、MADDベースのマルチエージェント制御戦略であるEnergAIzeを取り入れ、現実世界のデータ収集、システム統合、ユーザー行動モデリングに関連する課題に特に対処する。
論文 参考訳(メタデータ) (2025-05-22T22:20:09Z) - Multi-Objective Reinforcement Learning for Energy-Efficient Industrial Control [0.6990493129893112]
産業自動化は、環境やコストの制約と性能のバランスをとるためのエネルギー効率の高い制御戦略をますます要求している。
本研究では,クアンサーエアロ2の1自由度試験におけるエネルギー効率向上のための多目的強化学習(MORL)フレームワークを提案する。
予備実験では、ピッチトラッキングと省エネの間のトレードオフに対するエネルギーのペナルティ重量、アルファの影響について検討している。
論文 参考訳(メタデータ) (2025-05-12T14:28:42Z) - Evolutionary Policy Optimization [47.30139909878251]
オンライン強化学習(RL)アルゴリズムは、高いパフォーマンスとトレーニング安定性のために広く利用されているが、より大きなバッチサイズでスケールするのに苦労している。
本稿では、EAのスケーラビリティと多様性と、政策勾配の性能と安定性を組み合わせたハイブリッドである進化的政策最適化(EPO)を提案する。
論文 参考訳(メタデータ) (2025-03-24T18:08:54Z) - Safety-Aware Reinforcement Learning for Electric Vehicle Charging Station Management in Distribution Network [4.842172685255376]
電気自動車(EV)は、調整がない状態での配電系統の運用に重大なリスクをもたらす。
本稿では、EV充電ステーションの管理を目的とした安全対応強化学習(RL)アルゴリズムを提案する。
提案アルゴリズムは制約違反に対する明示的な罰則に依存しないため,ペナルティチューニング係数は不要である。
論文 参考訳(メタデータ) (2024-03-20T01:57:38Z) - Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [67.1393112206885]
大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。
本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。
我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文 参考訳(メタデータ) (2024-02-09T07:45:26Z) - Hybrid Reinforcement Learning for Optimizing Pump Sustainability in
Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。
我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。
進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文 参考訳(メタデータ) (2023-10-13T21:26:16Z) - Evolving Pareto-Optimal Actor-Critic Algorithms for Generalizability and
Stability [67.8426046908398]
汎用性と安定性は,実世界における強化学習(RL)エージェントの運用において重要な2つの目的である。
本稿では,アクター・クリティック・ロス関数の自動設計法であるMetaPGを提案する。
論文 参考訳(メタデータ) (2022-04-08T20:46:16Z) - Efficient Representation for Electric Vehicle Charging Station
Operations using Reinforcement Learning [5.815007821143811]
我々は、EV充電の緊急時、すなわち遅延値に基づくアグリゲーションスキームを開発する。
EVCSの総充電パワーのみを考慮するために、最低遅延第一規則(LLF)が採用されている。
また,同じ最適政策を達成するための等価な状態アグリゲーションを提案する。
論文 参考訳(メタデータ) (2021-08-07T00:34:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。