論文の概要: Online Learning and Distributed Control for Residential Demand Response
- arxiv url: http://arxiv.org/abs/2010.05153v2
- Date: Sat, 12 Jun 2021 02:19:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 14:07:15.947444
- Title: Online Learning and Distributed Control for Residential Demand Response
- Title(参考訳): 住宅需要対応のためのオンライン学習と分散制御
- Authors: Xin Chen, Yingying Li, Jun Shimada, Na Li
- Abstract要約: 本稿では,インセンティブに基づく住宅需要応答(DR)における空調負荷の自動制御手法について検討する。
DRイベントにおけるAC制御問題を,室内熱力学と顧客のオプトアウト状態を統合した多周期遷移最適化として定式化する。
本稿では、顧客の振る舞いを学習し、リアルタイムのAC制御スキームを作成するためのオンラインDR制御アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 16.61679791774638
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper studies the automated control method for regulating air
conditioner (AC) loads in incentive-based residential demand response (DR). The
critical challenge is that the customer responses to load adjustment are
uncertain and unknown in practice. In this paper, we formulate the AC control
problem in a DR event as a multi-period stochastic optimization that integrates
the indoor thermal dynamics and customer opt-out status transition.
Specifically, machine learning techniques including Gaussian process and
logistic regression are employed to learn the unknown thermal dynamics model
and customer opt-out behavior model, respectively. We consider two typical DR
objectives for AC load control: 1) minimizing the total demand, 2) closely
tracking a regulated power trajectory. Based on the Thompson sampling
framework, we propose an online DR control algorithm to learn customer
behaviors and make real-time AC control schemes. This algorithm considers the
influence of various environmental factors on customer behaviors and is
implemented in a distributed fashion to preserve the privacy of customers.
Numerical simulations demonstrate the control optimality and learning
efficiency of the proposed algorithm.
- Abstract(参考訳): 本稿では,インセンティブに基づく住宅需要応答(DR)における空調負荷の自動制御手法について検討する。
重要な課題は、負荷調整に対する顧客の反応が不確かで、実際不明であることです。
本稿では,室内熱力学と顧客のオプトアウト状態遷移を統合する多周期確率最適化として,drイベントにおける交流制御問題を定式化する。
具体的には、ガウス過程とロジスティック回帰を含む機械学習技術を用いて、未知の熱力学モデルと顧客のオプトアウト行動モデルを学ぶ。
我々は、交流負荷制御のための2つの典型的なdr目標について検討する。
1)総需要を最小化すること。
2)規制された電力軌道を注意深く追跡する。
トンプソンサンプリングフレームワークに基づき,顧客行動を学び,リアルタイム交流制御スキームを作成するオンラインdr制御アルゴリズムを提案する。
本アルゴリズムは,顧客行動に及ぼす各種環境要因の影響を考慮し,顧客のプライバシーを守るために分散的に実施する。
数値シミュレーションにより,提案アルゴリズムの制御最適性と学習効率を示す。
関連論文リスト
- Scenario-based Thermal Management Parametrization Through Deep Reinforcement Learning [0.4218593777811082]
本稿では,熱管理機能に対する学習に基づくチューニング手法を提案する。
我々の深層強化学習エージェントは、チューニングタスクコンテキストを処理し、組込みパラメータセットのイメージベースの解釈を組み込む。
本稿では,バルブ制御器のパラメトリゼーションタスクへの適用性を実証し,実際の車両試験で検証する。
論文 参考訳(メタデータ) (2024-08-04T13:19:45Z) - Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - Deployable Reinforcement Learning with Variable Control Rate [14.838483990647697]
可変制御率を持つ強化学習(RL)の変種を提案する。
このアプローチでは、ポリシーは、エージェントが取るべきアクションと、そのアクションに関連する時間ステップの期間を決定する。
ニュートンキネマティクスを用いたエージェントを駆動する概念実証シミュレーションによりSEACの有効性を示す。
論文 参考訳(メタデータ) (2024-01-17T15:40:11Z) - Incorporating Recurrent Reinforcement Learning into Model Predictive
Control for Adaptive Control in Autonomous Driving [11.67417895998434]
モデル予測制御(MPC)は、強力な制御技術として自律運転タスクに大きな注目を集めている。
本稿では,この問題を部分的に観測されたマルコフ決定過程(POMDP)として再検討する。
次に、最適かつ適応的な制御のために、リカレント強化学習(RRL)を通して、動的モデルのパラメータを継続的に適応させるリカレントポリシーを学習する。
論文 参考訳(メタデータ) (2023-01-30T22:11:07Z) - Policy Search for Model Predictive Control with Application to Agile
Drone Flight [56.24908013905407]
MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:24Z) - Neural optimal feedback control with local learning rules [67.5926699124528]
運動制御の大きな問題は、脳がどのように遅延と雑音の刺激に直面して適切な動きを計画し実行するかを理解することである。
本稿では,適応カルマンフィルタとモデル自由制御手法を組み合わせた新しいオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-11-12T20:02:00Z) - Reinforcement Learning for Thermostatically Controlled Loads Control
using Modelica and Python [0.0]
このプロジェクトは、電力系統制御に強化学習(RL)を適用する機会を調査し、評価することを目的としている。
The proof of concept (PoC) was developed to voltage control of thermostatically controlled loads (TCLs) for power consumption using Modelica-based pipeline。
本稿では,状態空間の離散化を含むQ-ラーニングパラメータが制御性能に与える影響について述べる。
論文 参考訳(メタデータ) (2020-05-09T13:35:49Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Online Residential Demand Response via Contextual Multi-Armed Bandits [8.817815952311676]
住宅需要応答(DR)における大きな課題の1つは、未知かつ不確実な顧客行動を扱うことである。
従来の研究は学習技術を用いて顧客のDR行動を予測するが、時間的な環境要因の影響は概して無視される。
本稿では,LSE(Load Service entity)が顧客の最適サブセットを選択して,財務予算で期待される負荷削減を最大化することを目的とした住宅DR問題について考察する。
トンプソンサンプリングに基づくオンライン学習と選択(OLS)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-07T18:17:50Z) - NeurOpt: Neural network based optimization for building energy
management and climate control [58.06411999767069]
モデル同定のコストを削減するために,ニューラルネットワークに基づくデータ駆動制御アルゴリズムを提案する。
イタリアにある10の独立したゾーンを持つ2階建ての建物で、学習と制御のアルゴリズムを検証する。
論文 参考訳(メタデータ) (2020-01-22T00:51:03Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。