論文の概要: MILP-based Imitation Learning for HVAC control
- arxiv url: http://arxiv.org/abs/2012.00286v1
- Date: Tue, 1 Dec 2020 06:00:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-01 06:32:00.713313
- Title: MILP-based Imitation Learning for HVAC control
- Title(参考訳): HVAC制御のためのMILPに基づく模倣学習
- Authors: Huy Truong Dinh and Daehee Kim
- Abstract要約: 予測情報を用いずにHVACシステムを制御するMILPを用いた模倣学習手法を提案する。
提案するコントローラは,MILPソルバによってラベル付けされたデータに履歴データを用いてトレーニングしたディープニューラルネットワーク(DNN)である。
MILPを用いた模擬学習の性能は, 時間当たりの消費電力, 日当たりのエネルギーコスト, 熱的快適性の観点から, 予測に基づくMILP法よりも優れている。
- 参考スコア(独自算出の注目度): 0.342658286826597
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To optimize the operation of a HVAC system with advanced techniques such as
artificial neural network, previous studies usually need forecast information
in their method. However, the forecast information inevitably contains errors
all the time, which degrade the performance of the HVAC operation. Hence, in
this study, we propose MILP-based imitation learning method to control a HVAC
system without using the forecast information in order to reduce energy cost
and maintain thermal comfort at a given level. Our proposed controller is a
deep neural network (DNN) trained by using data labeled by a MILP solver with
historical data. After training, our controller is used to control the HVAC
system with real-time data. For comparison, we also develop a second method
named forecast-based MILP which control the HVAC system using the forecast
information. The performance of the two methods is verified by using real
outdoor temperatures and real day-ahead prices in Detroit city, Michigan,
United States. Numerical results clearly show that the performance of the
MILP-based imitation learning is better than that of the forecast-based MILP
method in terms of hourly power consumption, daily energy cost, and thermal
comfort. Moreover, the difference between results of the MILP-based imitation
learning method and optimal results is almost negligible. These optimal results
are achieved only by using the MILP solver at the end of a day when we have
full information on the weather and prices for the day.
- Abstract(参考訳): 人工ニューラルネットワークのような高度な技術でHVACシステムの動作を最適化するには、従来の研究では予測情報が必要である。
しかし、予測情報は必然的に常にエラーを含むため、hvac動作の性能が低下する。
そこで本研究では, エネルギーコストを低減し, 熱快適性を維持するために, 予測情報を用いずに空調システムを制御するミルプ型模倣学習手法を提案する。
提案するコントローラは,MILPソルバによってラベル付けされたデータに履歴データを用いてトレーニングしたディープニューラルネットワーク(DNN)である。
トレーニング後、コントローラはリアルタイムデータでhvacシステムを制御するために使用されます。
また,予測情報を用いてHVACシステムを制御する第2の予測ベースMILPを開発した。
この2つの手法の性能は、ミシガン州デトロイト市における実際の屋外温度と実日頭価格を用いて検証される。
シミュレーションの結果,MILPを用いた模倣学習の性能は,時間当たりの消費電力,日当たりのエネルギーコスト,熱的快適性などの観点から予測に基づくMILP法よりも優れていることがわかった。
さらに,MILPを用いた模倣学習手法の結果と最適な結果との差はほとんど無視できる。
これらの最適な結果は、一日の天気や価格に関する完全な情報が得られる日の終わりにmilpソルバを使用することによってのみ達成されます。
関連論文リスト
- Improving Building Temperature Forecasting: A Data-driven Approach with
System Scenario Clustering [3.2114754609864695]
暖房、換気、空調のシステムは、建築セクターにおけるエネルギー使用量の約40%を消費する。
大規模HVACシステム管理では,各サブシステムに対して詳細なモデルを構築することは困難である。
k平均クラスタリング法に基づく新しいデータ駆動室温予測モデルを提案する。
論文 参考訳(メタデータ) (2024-02-21T09:04:45Z) - Transfer Learning in Transformer-Based Demand Forecasting For Home
Energy Management System [4.573008040057806]
複数の世帯からのデータを活用して、単一世帯の負荷予測を改善することで、トランスファーラーニングがいかに役立つかを分析する。
具体的には、複数の異なる世帯のデータを用いて高度な予測モデルをトレーニングし、限られたデータを持つ新しい家庭でこのグローバルモデルを微調整する。
得られたモデルは、次の24時間(日頭)の家庭の電力消費を15分間の時間分解能で予測するために使用される。
論文 参考訳(メタデータ) (2023-10-29T21:19:08Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - Solar Power Prediction Using Machine Learning [0.0]
本稿では,99%のAUC測定値を用いて,高精度な太陽光発電予測手法を提案する。
このアプローチには、データ収集、前処理、機能選択、モデル選択、トレーニング、評価、デプロイメントが含まれる。
訓練された機械学習モデルは生産環境にデプロイされ、ソーラー発電に関するリアルタイム予測に使用することができる。
論文 参考訳(メタデータ) (2023-03-11T06:31:46Z) - GraphCast: Learning skillful medium-range global weather forecasting [107.40054095223779]
我々は、再分析データから直接トレーニングできる「GraphCast」と呼ばれる機械学習ベースの手法を導入する。
全世界で10日以上、0.25度で、数百の気象変動を1分以内で予測する。
我々は,GraphCastが1380の検証対象の90%において,最も正確な運用決定システムよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-24T18:15:39Z) - Output Feedback Tube MPC-Guided Data Augmentation for Robust, Efficient
Sensorimotor Policy Learning [49.05174527668836]
シミュレーション学習(IL)は、計算コストのかかるモデルベースセンシングと制御アルゴリズムによって提供されるデモから、計算効率のよいセンセータポリシーを生成することができる。
本研究では,ILと出力フィードバック頑健な管モデル予測コントローラを組み合わせることで,実演とデータ拡張戦略を併用し,ニューラルネットワークに基づくセンサモジュレータポリシーを効率的に学習する。
提案手法は,従来のIL法と比較して,実演効率が2桁向上した1つの実演から,ロバストなビズモータポリシーを学習できることを数値的に示す。
論文 参考訳(メタデータ) (2022-10-18T19:59:17Z) - Efficient Offline Policy Optimization with a Learned Model [83.64779942889916]
MuZero Unpluggedはログデータからオフラインポリシー学習に有望なアプローチを提供する。
MCTS(Monte-Carlo Tree Search)を学習モデルで実行し、Reanalyzeアルゴリズムを利用してオフラインデータから純粋に学習する。
本稿では,オフライン設定下では MuZero Unplugged がうまく動作しないという仮説について検討する。
論文 参考訳(メタデータ) (2022-10-12T07:41:04Z) - Value-Consistent Representation Learning for Data-Efficient
Reinforcement Learning [105.70602423944148]
本稿では,意思決定に直接関連のある表現を学習するための,VCR(Value-Consistent Expression Learning)という新しい手法を提案する。
この想像された状態と環境によって返される実状態とを一致させる代わりに、VCRは両方の状態に$Q$-valueヘッドを適用し、2つのアクション値の分布を得る。
検索不要なRLアルゴリズムに対して,提案手法が新たな最先端性能を実現することが実証された。
論文 参考訳(メタデータ) (2022-06-25T03:02:25Z) - Lidar Light Scattering Augmentation (LISA): Physics-based Simulation of
Adverse Weather Conditions for 3D Object Detection [60.89616629421904]
ライダーベースの物体検出器は、自動運転車のような自律ナビゲーションシステムにおいて、3D知覚パイプラインの重要な部分である。
降雨、雪、霧などの悪天候に敏感で、信号-雑音比(SNR)と信号-背景比(SBR)が低下している。
論文 参考訳(メタデータ) (2021-07-14T21:10:47Z) - Preparing Weather Data for Real-Time Building Energy Simulation [0.0]
本研究では,異常検出や不足値の埋入を含む気象データの品質管理のための枠組みを提案する。
提案手法は, 高精度かつ高速な品質制御により, リアルタイムなビルディングシミュレーションを容易にする。
論文 参考訳(メタデータ) (2020-11-19T09:18:07Z) - Meta-modeling strategy for data-driven forecasting [0.0]
我々は、機械学習による2つの歴史的気候データセットとツールを使用して、温度場を正確に予測する。
トレーニングや評価に安価な低忠実度モデルを使用することで、高価な高忠実度関数評価を選択的に回避することができる。
論文 参考訳(メタデータ) (2020-11-14T19:25:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。