論文の概要: Reimagining Demand-Side Management with Mean Field Learning
- arxiv url: http://arxiv.org/abs/2302.08190v2
- Date: Thu, 25 May 2023 06:37:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 20:57:16.804100
- Title: Reimagining Demand-Side Management with Mean Field Learning
- Title(参考訳): 平均場学習による需要サイドマネジメントの再考
- Authors: Bianca Marin Moreno (EDF R&D, Thoth), Margaux Br\'eg\`ere (SU, LPSM
(UMR\_8001), EDF R&D), Pierre Gaillard (Thoth), Nadia Oudjane (EDF R&D)
- Abstract要約: 本稿では,DSMの新しい手法,特に所望の消費信号に従うために大量の電気機器を制御する問題を提案する。
我々は,凸関数とリプシッツ関数の理論的保証を提供する新しいアルゴリズムMD-MFCを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Integrating renewable energy into the power grid while balancing supply and
demand is a complex issue, given its intermittent nature. Demand side
management (DSM) offers solutions to this challenge. We propose a new method
for DSM, in particular the problem of controlling a large population of
electrical devices to follow a desired consumption signal. We model it as a
finite horizon Markovian mean field control problem. We develop a new
algorithm, MD-MFC, which provides theoretical guarantees for convex and
Lipschitz objective functions. What distinguishes MD-MFC from the existing load
control literature is its effectiveness in directly solving the target tracking
problem without resorting to regularization techniques on the main problem. A
non-standard Bregman divergence on a mirror descent scheme allows dynamic
programming to be used to obtain simple closed-form solutions. In addition, we
show that general mean-field game algorithms can be applied to this problem,
which expands the possibilities for addressing load control problems. We
illustrate our claims with experiments on a realistic data set.
- Abstract(参考訳): 供給と需要のバランスを保ちながら電力網に再生可能エネルギーを統合することは、断続的な性質を考えると複雑な問題である。
需要側管理(DSM)はこの課題に対する解決策を提供する。
本稿では,DSMの新しい手法,特に所望の消費信号に従うために大量の電気機器を制御する問題を提案する。
有限地平線マルコフ平均場制御問題としてモデル化する。
我々は,凸関数とリプシッツ関数の理論的保証を提供する新しいアルゴリズムMD-MFCを開発した。
MD-MFCと既存の負荷制御文献との違いは、主問題における正規化技術に頼ることなく、目標追従問題を直接解決する効果である。
ミラー降下スキーム上の非標準ブレグマン発散は、単純な閉形式解を得るために動的プログラミングを使うことができる。
さらに,本問題に対して汎用平均場ゲームアルゴリズムを適用できることを示し,負荷制御問題に対処する可能性を広げる。
私たちは現実のデータセットで実験を行い、クレームを説明します。
関連論文リスト
- Communication-Control Codesign for Large-Scale Wireless Networked Control Systems [80.30532872347668]
無線ネットワーク制御システム(Wireless Networked Control Systems, WNCS)は、ドローン群や自律ロボットなどのアプリケーションにおいて柔軟な制御を可能にする産業用4.0に必須である。
本稿では,マルチ状態マルコフブロックフェーディングチャネル上で限られた無線リソースを共有するセンサやアクチュエータを用いて,複数の制御ループ間の相関ダイナミクスを捕捉する実用的WNCSモデルを提案する。
本研究では,ハイブリッドな動作空間を効率的に処理し,通信制御の相関関係を捉え,疎域変数や浮動小数点制御の入力に拘わらず堅牢なトレーニングを確実にするDeep Reinforcement Learning (DRL)アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-10-15T06:28:21Z) - Optimal Control of Agent-Based Dynamics under Deep Galerkin Feedback Laws [0.0]
本稿では,Deep Galerkin法が適用すべきサンプリング問題について検討する。
高分散政策近似の症状を軽減するためのドリフト緩和に基づくサンプリング手法を提案する。
結果として、手動で最適化された制御関数よりも大幅なコスト削減がもたらされ、線形量子レギュレータの問題が改善された。
論文 参考訳(メタデータ) (2024-06-13T14:10:57Z) - Towards Model-Free LQR Control over Rate-Limited Channels [2.908482270923597]
作業者エージェントが(LQRコストの)量子化ポリシー勾配を有限ビットレートのノイズレスチャネル上でサーバに送信する環境について検討する。
我々は、適応量子化グラディエントDescent (textttAQGD) という新しいアルゴリズムを提案し、ある有限しきい値ビットレートを超えると、textttAQGDは、グローバルな最適ポリシーへの指数的に高速な収束を保証することを証明した。
論文 参考訳(メタデータ) (2024-01-02T15:59:00Z) - Unsupervised Optimal Power Flow Using Graph Neural Networks [172.33624307594158]
グラフニューラルネットワークを用いて、要求された電力と対応するアロケーションとの間の非線形パラメトリゼーションを学習する。
シミュレーションを通して、この教師なし学習コンテキストにおけるGNNの使用は、標準解法に匹敵するソリューションにつながることを示す。
論文 参考訳(メタデータ) (2022-10-17T17:30:09Z) - State-Augmented Learnable Algorithms for Resource Management in Wireless
Networks [124.89036526192268]
本稿では,無線ネットワークにおける資源管理問題を解決するためのステート拡張アルゴリズムを提案する。
提案アルゴリズムは, RRM決定を可能, ほぼ最適に行うことができることを示す。
論文 参考訳(メタデータ) (2022-07-05T18:02:54Z) - Learning Resilient Radio Resource Management Policies with Graph Neural
Networks [124.89036526192268]
我々は、ユーザ当たりの最小容量制約でレジリエントな無線リソース管理問題を定式化する。
有限個のパラメータ集合を用いてユーザ選択と電力制御ポリシーをパラメータ化できることを示す。
このような適応により,提案手法は平均レートと5番目のパーセンタイルレートとの良好なトレードオフを実現する。
論文 参考訳(メタデータ) (2022-03-07T19:40:39Z) - Learning Solution Manifolds for Control Problems via Energy Minimization [32.59818752168615]
様々な制御タスクは一般にエネルギー最小化問題として定式化されている。
このような問題に対する数値解は十分に確立されているが、しばしばリアルタイムアプリケーションで直接使用されるには遅すぎる。
本稿では,効率的かつ数値的に堅牢な行動クローニング(BC)の代替手法を提案する。
論文 参考訳(メタデータ) (2022-03-07T14:28:57Z) - Short-Term Load Forecasting Using Time Pooling Deep Recurrent Neural
Network [0.0]
再生可能エネルギー源と電気自動車などの新興負荷をスマートグリッドに統合することは、配電系統管理に不確実性をもたらす。デマンドサイドマネジメント(DSM)は、不確実性を低減するためのアプローチの一つである。
Nonintrusive Load Monitoring (NILM) のようなアプリケーションは DSM をサポートすることができるが、高解像度データの正確な予測は必要である。
高いボラティリティのため、一戸建て住宅のような単一負荷の場合、これは難しい。
論文 参考訳(メタデータ) (2021-09-26T05:20:48Z) - Solving MKP Applied to IoT in Smart Grid Using Meta-heuristics
Algorithms: A Parallel Processing Perspective [0.22940141855172028]
南アフリカの電力価格の上昇は、スマートグリッドのようなデマンドサイドマネジメント(DSM)デバイスの必要性を招いている。
スマートグリッドがピークに達するためには、そのエネルギー管理コントローラ(EMC)システムを最適化する必要がある。
論文 参考訳(メタデータ) (2020-06-29T10:49:18Z) - Strictly Batch Imitation Learning by Energy-based Distribution Matching [104.33286163090179]
すなわち、強化信号へのアクセスがなく、遷移力学の知識がなく、環境とのさらなる相互作用もない。
1つの解決策は、既存のアルゴリズムをオフライン環境で動作させるために、見習いの学習に適合させることである。
しかし、このようなアプローチは、政治外の評価やオフラインモデルの推定に大きく依存しており、間接的で非効率である可能性がある。
優れたソリューションは、ポリシーを明示的にパラメータ化し、ロールアウトダイナミクスから暗黙的に学習し、完全にオフラインで運用できるべきだ、と私たちは主張する。
論文 参考訳(メタデータ) (2020-06-25T03:27:59Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。