論文の概要: Data-driven control of COVID-19 in buildings: a reinforcement-learning
approach
- arxiv url: http://arxiv.org/abs/2212.13559v1
- Date: Tue, 27 Dec 2022 17:28:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 15:03:26.575987
- Title: Data-driven control of COVID-19 in buildings: a reinforcement-learning
approach
- Title(参考訳): 建物におけるデータ駆動型COVID-19コントロール--強化学習アプローチ
- Authors: Ashkan Haji Hosseinloo, Saleh Nabi, Anette Hosoi, and Munther A.
Dahleh
- Abstract要約: 新型コロナウイルス(COVID-19)のパンデミックにより、職場の閉鎖と閉鎖が始まり、総コストは16兆ドルを超えると推定されている。
本研究は, 建設環境における感染性病原体への被曝量を最小限に抑えるため, 最適室内気流設計のためのデータ駆動制御手法を提案する。
- 参考スコア(独自算出の注目度): 1.2187048691454236
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In addition to its public health crisis, COVID-19 pandemic has led to the
shutdown and closure of workplaces with an estimated total cost of more than
$16 trillion. Given the long hours an average person spends in buildings and
indoor environments, this research article proposes data-driven control
strategies to design optimal indoor airflow to minimize the exposure of
occupants to viral pathogens in built environments. A general control framework
is put forward for designing an optimal velocity field and proximal policy
optimization, a reinforcement learning algorithm is employed to solve the
control problem in a data-driven fashion. The same framework is used for
optimal placement of disinfectants to neutralize the viral pathogens as an
alternative to the airflow design when the latter is practically infeasible or
hard to implement. We show, via simulation experiments, that the control agent
learns the optimal policy in both scenarios within a reasonable time. The
proposed data-driven control framework in this study will have significant
societal and economic benefits by setting the foundation for an improved
methodology in designing case-specific infection control guidelines that can be
realized by affordable ventilation devices and disinfectants.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)のパンデミックは、公衆衛生の危機に加え、職場の閉鎖と閉鎖につながった。
本研究は、平均的な人が建物や屋内環境で過ごす時間を考えると、建築環境におけるウイルス病原体への被曝を最小限に抑えるために最適な室内空気流を設計するためのデータ駆動制御戦略を提案する。
最適速度場と近似ポリシー最適化を設計するための一般的な制御フレームワークが提案され、データ駆動方式で制御問題を解くために強化学習アルゴリズムが用いられる。
同じ枠組みは、消毒剤を最適に配置してウイルス病原体を中和し、後者の実装が事実上不可能または困難である場合、気流設計の代替として使用する。
シミュレーション実験により,制御エージェントは両シナリオの最適ポリシーを適切な時間内に学習することを示した。
本研究で提案されるデータ駆動型コントロール・フレームワークは,手頃な換気装置や消毒剤で実現可能なケース固有の感染対策ガイドラインを設計する上での方法論の整備の基礎を定め,社会的・経済的に有益である。
関連論文リスト
- Policy Optimization for Personalized Interventions in Behavioral Health [8.10897203067601]
デジタルプラットフォームを通じて提供される行動的健康介入は、健康結果を大幅に改善する可能性がある。
患者に対するパーソナライズされた介入を最適化して長期的効果を最大化する問題について検討した。
患者システムの状態空間を個別のレベルに分解するDecompPIをダブする新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-21T21:42:03Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Policy Search for Model Predictive Control with Application to Agile
Drone Flight [56.24908013905407]
MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:24Z) - Surrogate Parameters Optimization for Data and Model Fusion of COVID-19
Time-series Data [0.0]
南アフリカを事例として,ADRIANAというシステムを開発した。
ADRIANAの出力は、感染した個人を治療するのに必要なリソースのピーク需要時間を予測するために、医療行政によって利用することができる。
論文 参考訳(メタデータ) (2021-09-09T12:27:26Z) - Robust Model-based Reinforcement Learning for Autonomous Greenhouse
Control [9.022924636907412]
強化学習(RL)アルゴリズムは人間の意思決定を超え、クローズドループ制御フレームワークにシームレスに統合することができる。
本稿では,自律型温室制御のためのモデルベースロバストなRLフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-26T08:27:10Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Resource Planning for Hospitals Under Special Consideration of the
COVID-19 Pandemic: Optimization and Sensitivity Analysis [87.31348761201716]
新型コロナウイルス(covid-19)パンデミックのような危機は、医療機関にとって深刻な課題となる。
BaBSim.Hospitalは離散イベントシミュレーションに基づく容量計画ツールである。
BaBSim.Hospitalを改善するためにこれらのパラメータを調査し最適化することを目指しています。
論文 参考訳(メタデータ) (2021-05-16T12:38:35Z) - Disease control as an optimization problem [0.0]
我々は凸最適化理論と機械学習の手法を用いて、数百のパラメータによって記述された疾患ポリシーを最適化する。
我々は,Kissler emphet al.(2020年3月,2020年3月)が提唱した,感受性-感染-回復型(SEIR)モデルにおいて,COVID-19を根絶するのに要する時間を最小化することで,我々のアプローチを説明する。
論文 参考訳(メタデータ) (2020-09-14T17:07:41Z) - Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control [19.022696762983017]
新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
本稿では,データ駆動型意思決定の促進と長期的コストの最小化を目的とした多目的モデルに基づく強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-09T23:55:27Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。