論文の概要: Decision-Focused Learning for Complex System Identification: HVAC Management System Application
- arxiv url: http://arxiv.org/abs/2501.14708v1
- Date: Fri, 24 Jan 2025 18:32:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-27 14:55:40.793351
- Title: Decision-Focused Learning for Complex System Identification: HVAC Management System Application
- Title(参考訳): 複雑システム同定のための決定焦点学習:HVAC管理システムへの応用
- Authors: Pietro Favaro, Jean-François Toubeau, François Vallée, Yury Dvorkin,
- Abstract要約: Decision-Focused Learning (DFL)は、下流の意思決定ツールで最適なパフォーマンスを得るために機械学習モデルをトレーニングする。
アメリカ合衆国デンバーにある現実的な15ゾーンビルにおいて, ビルの暖房, 換気, 空調管理システムにおける本手法の有用性を実証した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: As opposed to conventional training methods tailored to minimize a given statistical metric or task-agnostic loss (e.g., mean squared error), Decision-Focused Learning (DFL) trains machine learning models for optimal performance in downstream decision-making tools. We argue that DFL can be leveraged to learn the parameters of system dynamics, expressed as constraint of the convex optimization control policy, while the system control signal is being optimized, thus creating an end-to-end learning framework. This is particularly relevant for systems in which behavior changes once the control policy is applied, hence rendering historical data less applicable. The proposed approach can perform system identification - i.e., determine appropriate parameters for the system analytical model - and control simultaneously to ensure that the model's accuracy is focused on areas most relevant to control. Furthermore, because black-box systems are non-differentiable, we design a loss function that requires solely to measure the system response. We propose pre-training on historical data and constraint relaxation to stabilize the DFL and deal with potential infeasibilities in learning. We demonstrate the usefulness of the method on a building Heating, Ventilation, and Air Conditioning day-ahead management system for a realistic 15-zone building located in Denver, US. The results show that the conventional RC building model, with the parameters obtained from historical data using supervised learning, underestimates HVAC electrical power consumption. For our case study, the ex-post cost is on average six times higher than the expected one. Meanwhile, the same RC model with parameters obtained via DFL underestimates the ex-post cost only by 3%.
- Abstract(参考訳): 与えられた統計量やタスク非依存の損失(平均二乗誤差)を最小限に抑えるように調整された従来の訓練手法とは対照的に、DFL(Decision-Focused Learning)は、下流の意思決定ツールで最適なパフォーマンスを得るために機械学習モデルを訓練する。
システム制御信号が最適化されている間、DFLは凸最適化制御ポリシーの制約として表現されるシステム力学のパラメータを学習するために利用することができるので、エンドツーエンドの学習フレームワークを作成することができる。
これは、制御ポリシーが適用されると振る舞いが変化するシステムに特に関係しており、歴史的データは適用できない。
提案手法はシステム同定、すなわち、システム分析モデルの適切なパラメータを決定し、同時に制御することで、モデルの精度が制御に最も関係のある領域に焦点を合わせることができる。
さらに,ブラックボックスシステムは非微分可能であるため,システム応答の計測のみを必要とする損失関数を設計する。
そこで本稿では,DFLの安定化と学習における潜在的な不安定性に対応するために,過去のデータに基づく事前学習と制約緩和を提案する。
アメリカ合衆国デンバーにある現実的な15ゾーンビルにおいて, ビルの暖房, 換気, 空調管理システムにおける本手法の有用性を実証した。
その結果,従来のRCビルディングモデルでは,教師付き学習を用いた歴史的データから得られたパラメータがHVAC電力消費を過小評価していることがわかった。
今回のケーススタディでは、ポスト前のコストは予想よりも平均6倍高い。
一方、DFLで得られたパラメータを持つ同じRCモデルでは、ポストのコストは3%と過小評価されている。
関連論文リスト
- Rethinking Resource Management in Edge Learning: A Joint Pre-training and Fine-tuning Design Paradigm [87.47506806135746]
一部のアプリケーションでは、エッジラーニングは、スクラッチから新しい2段階ラーニングへと焦点を移している。
本稿では,2段階のエッジ学習システムにおける共同コミュニケーションと計算資源管理の問題について考察する。
事前学習および微調整段階に対する共同資源管理の提案は,システム性能のトレードオフをうまくバランスさせることが示されている。
論文 参考訳(メタデータ) (2024-04-01T00:21:11Z) - Improving Building Temperature Forecasting: A Data-driven Approach with
System Scenario Clustering [3.2114754609864695]
暖房、換気、空調のシステムは、建築セクターにおけるエネルギー使用量の約40%を消費する。
大規模HVACシステム管理では,各サブシステムに対して詳細なモデルを構築することは困難である。
k平均クラスタリング法に基づく新しいデータ駆動室温予測モデルを提案する。
論文 参考訳(メタデータ) (2024-02-21T09:04:45Z) - Optimal Exploration for Model-Based RL in Nonlinear Systems [14.540210895533937]
未知の非線形力学系を制御する学習は、強化学習と制御理論の基本的な問題である。
本研究では,タスク依存メトリックにおける不確実性を低減するために,効率よくシステムを探索できるアルゴリズムを開発した。
我々のアルゴリズムは、ポリシー最適化から任意のシステムにおける最適な実験設計への一般的な還元に依存しており、独立した関心を持つ可能性がある。
論文 参考訳(メタデータ) (2023-06-15T15:47:50Z) - A Framework for History-Aware Hyperparameter Optimisation in
Reinforcement Learning [8.659973888018781]
強化学習(RL)システムは、システムの性能に影響を与える一連の初期条件に依存する。
これらのトレードオフを軽減するため,複雑なイベント処理と時間モデルの統合に基づくフレームワークを提案する。
提案手法を,RLの変種であるDQNを用いた5Gモバイル通信ケーススタディで検証した。
論文 参考訳(メタデータ) (2023-03-09T11:30:40Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - Regret Analysis of Learning-Based MPC with Partially-Unknown Cost
Function [5.601217969637838]
探索/探索のトレードオフは、データ駆動および適応制御において固有の課題である。
本稿では、最適制御動作の基準として、全てのシステムパラメータの完全な知識を持つ有限水平オラクルコントローラを提案する。
我々は,このオラクル有限ホライゾンコントローラに関して,低後悔を達成できる学習ベースのポリシーを開発する。
論文 参考訳(メタデータ) (2021-08-04T22:43:51Z) - Deep Learning Explicit Differentiable Predictive Control Laws for
Buildings [1.4121977037543585]
未知の非線形システムに対する制約付き制御法を学習するための微分予測制御(DPC)手法を提案する。
DPCは、明示的非線形モデル予測制御(MPC)から生じるマルチパラメトリックプログラミング問題に対する近似解を提供する
論文 参考訳(メタデータ) (2021-07-25T16:47:57Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。