論文の概要: Lifelong Control of Off-grid Microgrid with Model Based Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2005.08006v1
- Date: Sat, 16 May 2020 14:45:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 12:56:22.823626
- Title: Lifelong Control of Off-grid Microgrid with Model Based Reinforcement
Learning
- Title(参考訳): モデルに基づく強化学習によるオフグリッドマイクログリッドの寿命制御
- Authors: Simone Totaro, Ioannis Boukas, Anders Jonsson and Bertrand
Corn\'elusse
- Abstract要約: 本稿では、農村電化のためのオフグリッドマイクログリッドのモデル化のためのオープンソースの強化フレームワークを提案する。
進行および急激な変化で起こりうる一連の変化を分類する。
両タイプの変更に対処できる新しいモデルベース強化学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 33.55238830808043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The lifelong control problem of an off-grid microgrid is composed of two
tasks, namely estimation of the condition of the microgrid devices and
operational planning accounting for the uncertainties by forecasting the future
consumption and the renewable production. The main challenge for the effective
control arises from the various changes that take place over time. In this
paper, we present an open-source reinforcement framework for the modeling of an
off-grid microgrid for rural electrification. The lifelong control problem of
an isolated microgrid is formulated as a Markov Decision Process (MDP). We
categorize the set of changes that can occur in progressive and abrupt changes.
We propose a novel model based reinforcement learning algorithm that is able to
address both types of changes. In particular the proposed algorithm
demonstrates generalisation properties, transfer capabilities and better
robustness in case of fast-changing system dynamics. The proposed algorithm is
compared against a rule-based policy and a model predictive controller with
look-ahead. The results show that the trained agent is able to outperform both
benchmarks in the lifelong setting where the system dynamics are changing over
time.
- Abstract(参考訳): オフグリッドマイクログリッドの寿命制御問題は、将来の消費と再生可能生産を予測することにより、マイクログリッドデバイスの状態の推定と不確実性を考慮した運用計画という2つのタスクからなる。
効果的なコントロールの主な課題は、時間とともに起こるさまざまな変化から生じます。
本稿では,農村電化のためのオフグリッドマイクログリッドのモデル化のためのオープンソースの強化フレームワークを提案する。
分離マイクログリッドの寿命制御問題はマルコフ決定過程(MDP)として定式化される。
進行および急激な変化で起こりうる一連の変化を分類する。
両タイプの変更に対応可能な新しいモデルベース強化学習アルゴリズムを提案する。
特に,高速に変化するシステム力学の場合,一般化特性,伝達能力,堅牢性を示すアルゴリズムを提案する。
提案アルゴリズムは、ルールベースのポリシーと、ルックアヘッド付きモデル予測コントローラと比較する。
その結果、トレーニングされたエージェントは、システムのダイナミクスが時間とともに変化する寿命の長い環境で、両方のベンチマークを上回ります。
関連論文リスト
- Integrating Reinforcement Learning and Model Predictive Control with Applications to Microgrids [14.389086937116582]
本研究では,強化学習とモデル予測制御(MPC)を統合し,混合力学系における最適制御問題の解法を提案する。
提案手法は, MPC手法のオンライン計算時間を著しく短縮し, 最適性ギャップが小さく, 実現可能性が高いポリシーを生成する。
論文 参考訳(メタデータ) (2024-09-17T15:17:16Z) - A Policy Iteration Approach for Flock Motion Control [5.419608513284392]
全体的な制御プロセスは、群れの粘着性と局在性を監視しながらエージェントを誘導する。
ここでは、独立したコマンドジェネレータに従うためにエージェント群を誘導するために、オンラインモデルフリーのポリシーイテレーションメカニズムが開発されている。
政策反復機構のシミュレーション結果から,計算労力の少ない高速学習と収束挙動が明らかになった。
論文 参考訳(メタデータ) (2023-03-17T15:04:57Z) - Incorporating Recurrent Reinforcement Learning into Model Predictive
Control for Adaptive Control in Autonomous Driving [11.67417895998434]
モデル予測制御(MPC)は、強力な制御技術として自律運転タスクに大きな注目を集めている。
本稿では,この問題を部分的に観測されたマルコフ決定過程(POMDP)として再検討する。
次に、最適かつ適応的な制御のために、リカレント強化学習(RRL)を通して、動的モデルのパラメータを継続的に適応させるリカレントポリシーを学習する。
論文 参考訳(メタデータ) (2023-01-30T22:11:07Z) - On Controller Tuning with Time-Varying Bayesian Optimization [74.57758188038375]
制御対象とその変更に関する適切な事前知識を用いて、時間変化最適化(TVBO)を用いて、変更環境におけるコントローラのオンラインチューニングを行う。
本研究では,不確実性注入(UI)を用いたTVBO戦略を提案する。
我々のモデルはTVBOの最先端手法よりも優れており、後悔の軽減と不安定なパラメータ構成の低減を実現している。
論文 参考訳(メタデータ) (2022-07-22T14:54:13Z) - Adaptive Model Predictive Control by Learning Classifiers [26.052368583196426]
制御パラメータとモデルパラメータを自動的に推定する適応型MPC変種を提案する。
我々は,BOを密度比推定として定式化できることを示す最近の結果を活用する。
その後、これはモデル予測経路積分制御フレームワークに統合され、様々な困難なロボティクスタスクのための堅牢なコントローラを生成する。
論文 参考訳(メタデータ) (2022-03-13T23:22:12Z) - Machine Learning based Optimal Feedback Control for Microgrid
Stabilization [6.035279357076201]
エネルギー記憶に基づくフィードバックコントローラは、マイクログリッドの望ましくないダイナミクスを補償して安定性を向上させることができる。
本稿では,機械学習に基づく最適フィードバック制御方式を提案する。
修正クンドゥル2エリアシステムに基づくマイクログリッドモデルのケーススタディを行い,提案方式のリアルタイム性能を検証した。
論文 参考訳(メタデータ) (2022-03-09T15:44:56Z) - Evaluating model-based planning and planner amortization for continuous
control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。
モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。
モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文 参考訳(メタデータ) (2021-10-07T12:00:40Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。