論文の概要: Multi-Agent Reinforcement Learning for Fast-Timescale Demand Response of
Residential Loads
- arxiv url: http://arxiv.org/abs/2301.02593v1
- Date: Fri, 6 Jan 2023 16:41:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-09 23:32:35.336692
- Title: Multi-Agent Reinforcement Learning for Fast-Timescale Demand Response of
Residential Loads
- Title(参考訳): 住宅負荷の迅速応答のためのマルチエージェント強化学習
- Authors: Vincent Mai, Philippe Maisonneuve, Tianyu Zhang, Hadi Nekoei, Liam
Paull, Antoine Lesage-Landry
- Abstract要約: 局所通信を用いたマルチエージェント・ポリシー最適化を訓練した分散エージェントを提案する。
結果として得られるポリシは、周波数規制に対して良好かつ堅牢に機能し、一定の処理時間の間、任意の数のハウスにシームレスにスケールする。
- 参考スコア(独自算出の注目度): 15.543653210859555
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To integrate high amounts of renewable energy resources, electrical power
grids must be able to cope with high amplitude, fast timescale variations in
power generation. Frequency regulation through demand response has the
potential to coordinate temporally flexible loads, such as air conditioners, to
counteract these variations. Existing approaches for discrete control with
dynamic constraints struggle to provide satisfactory performance for fast
timescale action selection with hundreds of agents. We propose a decentralized
agent trained with multi-agent proximal policy optimization with localized
communication. We explore two communication frameworks: hand-engineered, or
learned through targeted multi-agent communication. The resulting policies
perform well and robustly for frequency regulation, and scale seamlessly to
arbitrary numbers of houses for constant processing times.
- Abstract(参考訳): 高量の再生可能エネルギー資源を統合するためには、電力グリッドは高振幅で高速な時間スケールの発電に対処できなければならない。
需要応答による周波数規制は、空気調和機のような時間的に柔軟な負荷を調整し、これらの変動に対処する可能性がある。
動的制約を伴う離散制御のための既存のアプローチは、数百のエージェントによる高速な時間スケールアクション選択に満足な性能を提供するのに苦労している。
局所通信を用いたマルチエージェントポリシー最適化を訓練した分散エージェントを提案する。
ハンドエンジニアリングとマルチエージェント通信による学習という,2つのコミュニケーションフレームワークについて検討する。
結果として得られるポリシは、周波数規制に対して良好かつ堅牢に機能し、一定の処理時間の間、任意の数のハウスにシームレスにスケールする。
関連論文リスト
- Function Approximation for Reinforcement Learning Controller for Energy from Spread Waves [69.9104427437916]
マルチジェネレータ・ウェーブ・エナジー・コンバータ(WEC)は、スプレッド・ウェーブと呼ばれる異なる方向から来る複数の同時波を処理しなければならない。
これらの複雑な装置は、エネルギー捕獲効率、維持を制限する構造的ストレスの低減、高波に対する積極的な保護という複数の目的を持つコントローラを必要とする。
本稿では,システム力学のシーケンシャルな性質をモデル化する上で,ポリシーと批判ネットワークの異なる機能近似について検討する。
論文 参考訳(メタデータ) (2024-04-17T02:04:10Z) - Leveraging Low-Rank and Sparse Recurrent Connectivity for Robust
Closed-Loop Control [63.310780486820796]
繰り返し接続のパラメータ化が閉ループ設定のロバスト性にどのように影響するかを示す。
パラメータが少ないクローズドフォーム連続時間ニューラルネットワーク(CfCs)は、フルランクで完全に接続されたニューラルネットワークよりも優れています。
論文 参考訳(メタデータ) (2023-10-05T21:44:18Z) - Communication-Efficient Orchestrations for URLLC Service via
Hierarchical Reinforcement Learning [14.604814002402588]
制御ループの時間スケールが異なるマルチレベルポリシーの実装を可能にするマルチエージェント階層型RL(HRL)フレームワークを提案する。
従来技術のユースケースでは、HRLフレームワークを用いて、産業機器の最大送電量と送電電力を最適化した。
論文 参考訳(メタデータ) (2023-07-25T11:23:38Z) - Decentralized Adaptive Formation via Consensus-Oriented Multi-Agent
Communication [9.216867817261493]
本稿では,Consensus-based Decentralized Adaptive Formation (Cons-DecAF) フレームワークを提案する。
具体的には、コンセンサス指向のマルチエージェント通信(ConsMAC)という新しいマルチエージェント強化学習手法を開発する。
エージェントの特定の位置を事前に割り当てる代わりに、Hausdorff 距離による変位に基づく生成を用いて、生成効率を著しく向上する。
論文 参考訳(メタデータ) (2023-07-23T10:41:17Z) - Distributed-Training-and-Execution Multi-Agent Reinforcement Learning
for Power Control in HetNet [48.96004919910818]
We propose a multi-agent Deep reinforcement learning (MADRL) based power control scheme for the HetNet。
エージェント間の協調を促進するために,MADRLシステムのためのペナルティベースQラーニング(PQL)アルゴリズムを開発した。
このように、エージェントのポリシーは、他のエージェントによってより容易に学習でき、より効率的なコラボレーションプロセスをもたらす。
論文 参考訳(メタデータ) (2022-12-15T17:01:56Z) - Dynamic Decision Frequency with Continuous Options [11.83290684845269]
古典的な強化学習アルゴリズムでは、エージェントは離散時間と一定時間間隔で決定を行う。
本研究では,連続時間連続オプティオン(CTCO)と呼ばれるフレームワークを提案する。
本研究では,環境相互作用の周波数選択の影響を受けないことを示す。
論文 参考訳(メタデータ) (2022-12-06T19:51:12Z) - Stabilizing Voltage in Power Distribution Networks via Multi-Agent
Reinforcement Learning with Transformer [128.19212716007794]
本稿では,変圧器を用いたマルチエージェント・アクタ・クリティカル・フレームワーク(T-MAAC)を提案する。
さらに、電圧制御タスクに適した新しい補助タスクトレーニングプロセスを採用し、サンプル効率を向上する。
論文 参考訳(メタデータ) (2022-06-08T07:48:42Z) - Deep Reinforcement Learning in mmW-NOMA: Joint Power Allocation and
Hybrid Beamforming [0.0]
ミリ波(mmW)周波数帯域における非直交多重アクセス(NOMA)アプローチにより、データレートの高要求が保証される。
mmW-NOMAシステムの連系電力配分とハイブリッドビームフォーミングは、機械学習と制御理論のアプローチの最近の進歩によってもたらされる。
論文 参考訳(メタデータ) (2022-05-13T07:55:48Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - UPDeT: Universal Multi-agent Reinforcement Learning via Policy
Decoupling with Transformers [108.92194081987967]
タスクに適合する1つのアーキテクチャを設計し、汎用的なマルチエージェント強化学習パイプラインを最初に試行する。
従来のRNNモデルとは異なり、トランスフォーマーモデルを用いてフレキシブルなポリシーを生成する。
提案方式はUPDeT(Universal Policy Decoupling Transformer)と名付けられ,動作制限を緩和し,マルチエージェントタスクの決定プロセスをより説明しやすいものにする。
論文 参考訳(メタデータ) (2021-01-20T07:24:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。