論文の概要: Dynamic and Distributed Online Convex Optimization for Demand Response
of Commercial Buildings
- arxiv url: http://arxiv.org/abs/2002.00099v3
- Date: Fri, 17 Apr 2020 20:35:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 06:55:23.437510
- Title: Dynamic and Distributed Online Convex Optimization for Demand Response
of Commercial Buildings
- Title(参考訳): 商業ビルの需要応答に対する動的および分散オンライン凸最適化
- Authors: Antoine Lesage-Landry and Duncan S. Callaway
- Abstract要約: 動的オンラインDWDA (D-ODWDA) を用いて, 熱, 換気, 空調システムに対する性能保証型分散オンライン需要応答手法を定式化する。
本稿では, 高速な時間スケール需要シミュレーションのための手法の性能を示すとともに, 集中型最適手法を忠実に再現する需要応答決定値を得る。
- 参考スコア(独自算出の注目度): 0.046877128185218706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We extend the regret analysis of the online distributed weighted dual
averaging (DWDA) algorithm [1] to the dynamic setting and provide the tightest
dynamic regret bound known to date with respect to the time horizon for a
distributed online convex optimization (OCO) algorithm. Our bound is linear in
the cumulative difference between consecutive optima and does not depend
explicitly on the time horizon. We use dynamic-online DWDA (D-ODWDA) and
formulate a performance-guaranteed distributed online demand response approach
for heating, ventilation, and air-conditioning (HVAC) systems of commercial
buildings. We show the performance of our approach for fast timescale demand
response in numerical simulations and obtain demand response decisions that
closely reproduce the centralized optimal ones.
- Abstract(参考訳): 我々は,オンライン分散重み付き双対平均化(dwda)アルゴリズム[1]の後悔解析を動的設定に拡張し,分散オンライン凸最適化(oco)アルゴリズムの時間軸に関してこれまで知られていた最も厳密な動的後悔を与える。
我々の境界は連続する視差の累積差において線形であり、時間軸に明示的に依存しない。
我々は,動的オンラインDWDA (D-ODWDA) を用いて,商業ビルの暖房,換気,空調(HVAC)システムに対して,性能保証型オンライン需要応答手法を定式化した。
数値シミュレーションにおいて,高速な時間スケール需要応答に対する提案手法の性能を示し,一元的最適応答を密接に再現した需要応答決定を得る。
関連論文リスト
- DIAR: Diffusion-model-guided Implicit Q-learning with Adaptive Revaluation [10.645244994430483]
本稿では,適応再評価フレームワークを用いた拡散モデル誘導型インプリシットQ-ラーニングを導入したオフライン強化学習(オフラインRL)手法を提案する。
拡散モデルを利用して状態-作用系列の分布を学習し、よりバランスよく適応的な意思決定のために値関数を組み込む。
Maze2D、AntMaze、Kitchenといったタスクで示されているように、DIARは長い水平、スパース・リワード環境において、常に最先端のアルゴリズムより優れています。
論文 参考訳(メタデータ) (2024-10-15T07:09:56Z) - FADAS: Towards Federated Adaptive Asynchronous Optimization [56.09666452175333]
フェデレートラーニング(FL)は、プライバシ保護機械学習のトレーニングパラダイムとして広く採用されている。
本稿では、非同期更新を適応的フェデレーション最適化と証明可能な保証に組み込む新しい手法であるFADASについて紹介する。
提案アルゴリズムの収束率を厳格に確立し,FADASが他の非同期FLベースラインよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2024-07-25T20:02:57Z) - Online Dynamic Submodular Optimization [0.0]
オンラインバイナリ最適化のための証明可能な性能を持つ新しいアルゴリズムを提案する。
高速な需要応答とリアルタイム分散ネットワーク再構成という2つのパワーシステムアプリケーションでアルゴリズムを数値的にテストする。
論文 参考訳(メタデータ) (2023-06-19T10:37:15Z) - Optimal Scheduling in IoT-Driven Smart Isolated Microgrids Based on Deep
Reinforcement Learning [10.924928763380624]
深部強化学習(DRL)によるモノ駆動マイクログリッド(MG)におけるディーゼル発電機(DG)のスケジューリング問題について検討する。
DRLエージェントは、過去の履歴再生およびロードデータから最適なポリシーを学習する。
目標は、需給バランスを確保するという前提で運用コストを削減することである。
論文 参考訳(メタデータ) (2023-04-28T23:52:50Z) - Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル
GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。
本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T15:32:59Z) - Dynamic Network-Assisted D2D-Aided Coded Distributed Learning [59.29409589861241]
本稿では,デバイス間のロードバランシングのための新しいデバイス・ツー・デバイス(D2D)支援型符号化学習手法(D2D-CFL)を提案する。
最小処理時間を達成するための最適圧縮率を導出し、収束時間との接続を確立する。
提案手法は,ユーザが継続的にトレーニングデータを生成するリアルタイム協調アプリケーションに有用である。
論文 参考訳(メタデータ) (2021-11-26T18:44:59Z) - Behavioral Priors and Dynamics Models: Improving Performance and Domain
Transfer in Offline RL [82.93243616342275]
適応行動優先型オフラインモデルに基づくRL(Adaptive Behavioral Priors:MABE)を導入する。
MABEは、ドメイン内の一般化をサポートする動的モデルと、ドメイン間の一般化をサポートする振る舞いの事前が相補的であることの発見に基づいている。
クロスドメインの一般化を必要とする実験では、MABEが先行手法より優れていることが判明した。
論文 参考訳(メタデータ) (2021-06-16T20:48:49Z) - Delay-Tolerant Constrained OCO with Application to Network Resource
Allocation [44.67787270821051]
マルチスロットフィードバック遅延によるオンライン凸最適化(OCO)を検討します。
エージェントは、時間変動凸損失関数の蓄積を最小限に抑えるために、一連のオンライン決定を行う。
情報フィードバックと意思決定の更新の非同期性に取り組むために,二重正規化による新たな制約ペナルティを用いた遅延耐性制約OCOを提案する。
論文 参考訳(メタデータ) (2021-05-09T19:32:33Z) - Online hyperparameter optimization by real-time recurrent learning [57.01871583756586]
ニューラルネットワーク(rnn)におけるハイパーパラメータ最適化とパラメータ学習の類似性を活用した。
RNNのための学習済みのオンライン学習アルゴリズムのファミリーを適応させ、ハイパーパラメータとネットワークパラメータを同時に調整します。
この手順は、通常の方法に比べて、ウォールクロック時間のほんの少しで、体系的に一般化性能が向上する。
論文 参考訳(メタデータ) (2021-02-15T19:36:18Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Online Convex Optimization with Binary Constraints [0.04170934882758551]
2値決定変数と凸損失関数を用いたオンライン最適化について検討する。
我々は、新しいアルゴリズム、バイナリオンライン勾配降下(bOGD)を設計し、その期待された動的後悔を束縛する。
需要応答に基づく複数のシミュレーションでbOGDの性能を検証した。
論文 参考訳(メタデータ) (2020-05-05T15:09:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。