論文の概要: Modeling and Optimization of Epidemiological Control Policies Through
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2402.06640v1
- Date: Thu, 25 Jan 2024 22:39:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-18 13:51:43.408087
- Title: Modeling and Optimization of Epidemiological Control Policies Through
Reinforcement Learning
- Title(参考訳): 強化学習による疫学制御政策のモデル化と最適化
- Authors: Ishir Rao
- Abstract要約: パンデミックの影響は、特定の制限をコミュニティに課すことによって最小化することができる。
感染と死亡率を最小限に抑える一方で、これらの制限は経済的危機につながる可能性がある。
我々は、報酬関数に基づくパンデミックシミュレーションに最適な制限を強制するために、強化学習エージェントを訓練する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pandemics involve the high transmission of a disease that impacts global and
local health and economic patterns. The impact of a pandemic can be minimized
by enforcing certain restrictions on a community. However, while minimizing
infection and death rates, these restrictions can also lead to economic crises.
Epidemiological models help propose pandemic control strategies based on
non-pharmaceutical interventions such as social distancing, curfews, and
lockdowns, reducing the economic impact of these restrictions. However,
designing manual control strategies while considering disease spread and
economic status is non-trivial. Optimal strategies can be designed through
multi-objective reinforcement learning (MORL) models, which demonstrate how
restrictions can be used to optimize the outcome of a pandemic. In this
research, we utilized an epidemiological Susceptible, Exposed, Infected,
Recovered, Deceased (SEIRD) model: a compartmental model for virtually
simulating a pandemic day by day. We combined the SEIRD model with a deep
double recurrent Q-network to train a reinforcement learning agent to enforce
the optimal restriction on the SEIRD simulation based on a reward function. We
tested two agents with unique reward functions and pandemic goals to obtain two
strategies. The first agent placed long lockdowns to reduce the initial spread
of the disease, followed by cyclical and shorter lockdowns to mitigate the
resurgence of the disease. The second agent provided similar infection rates
but an improved economy by implementing a 10-day lockdown and 20-day
no-restriction cycle. This use of reinforcement learning and epidemiological
modeling allowed for both economic and infection mitigation in multiple
pandemic scenarios.
- Abstract(参考訳): パンデミック(英: Pandemics)は、世界の健康と経済のパターンに影響を与える病気の感染率が高いこと。
パンデミックの影響は、コミュニティに一定の制限を課すことで最小化することができる。
しかし、感染と死亡率を最小限に抑える一方で、これらの制限は経済危機につながる可能性がある。
疫学モデルは、ソーシャルディスタンシング、カーフェー、ロックダウンといった非製薬的介入に基づくパンデミックコントロール戦略の提案を支援し、これらの制限の経済的影響を減らす。
しかし、病気の広がりや経済状況を考慮して手動制御戦略を設計することは自明ではない。
最適な戦略は、多目的強化学習(morl)モデルを通じて設計することができ、パンデミックの結果を最適化するためにどのように制限を使用できるかを示す。
本研究では, 疫学的感受性, 感染性, 回復性, 回復性 (SEIRD) モデルを用いて, 毎日のパンデミックを仮想的にシミュレートするためのコンパートメントモデルを構築した。
我々は,SEIRDモデルと深度2重リカレントQ-ネットワークを組み合わせることで,報酬関数に基づくSEIRDシミュレーションに最適な制約を課す強化学習エージェントを訓練した。
独自の報酬機能とパンデミック目標を持つ2つのエージェントを試験して2つの戦略を得た。
最初のエージェントは、病気の初期拡散を減らすために長いロックダウンを配置し、続いて、病気の回復を緩和するために周期的および短いロックダウンを施した。
第2のエージェントは10日間のロックダウンと20日間の非制限サイクルによって、同様の感染率を提供するが、経済は改善する。
この強化学習と疫学モデルの使用により、複数のパンデミックシナリオにおける経済と感染の緩和が可能となった。
関連論文リスト
- Agent-Based Model: Simulating a Virus Expansion Based on the Acceptance
of Containment Measures [65.62256987706128]
比較疫学モデルは、疾患の状態に基づいて個人を分類する。
我々は、適応されたSEIRDモデルと市民のための意思決定モデルを組み合わせたABMアーキテクチャを提案する。
スペイン・ア・コルナにおけるSARS-CoV-2感染症の進行状況について検討した。
論文 参考訳(メタデータ) (2023-07-28T08:01:05Z) - Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using
Deep Deterministic Policy Gradient [0.7244731714427565]
ロックダウン、急激な予防接種プログラム、学校閉鎖、経済刺激は、肯定的または意図しない否定的な結果をもたらす可能性がある。
ラウンドトリップを通じて自動的に最適な介入をモデル化し決定するための現在の研究は、シミュレーション目標、スケール(数千人)、介入研究に適さないモデルタイプ、探索可能な介入戦略の数(離散対連続)によって制限されている。
我々は,大規模(100,000人)の疫学的エージェントに基づくシミュレーションに基づいて,DDPGに基づく政策最適化フレームワークを用いて,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-10T09:26:07Z) - Exploring the Pareto front of multi-objective COVID-19 mitigation
policies using reinforcement learning [1.7056617973440933]
感染症の発生は公衆衛生や社会プロセスに破壊的な影響を及ぼす可能性がある。
現在の研究は、病原体の攻撃率のような単一の目的でポリシーを最適化することに焦点を当てている。
深層多目的強化学習を適用し,最先端のアルゴリズムを用いて解の集合を学習する。
論文 参考訳(メタデータ) (2022-04-11T11:55:06Z) - A Microscopic Pandemic Simulator for Pandemic Prediction Using Scalable
Million-Agent Reinforcement Learning [7.653466578233261]
本稿では, 深部強化学習型顕微鏡モデルであるMicroscopic Pandemic Simulator (MPS)を提案する。
ルールベースのエージェントを、報酬を最大化するために行動が促される合理的エージェントに置き換えることによって、MPSは現実世界のダイナミクスをよりよく近似する。
本稿ではまず,米国アレゲニーにおける実世界のデータに対してMPSを校正し,情報開示と隔離という2つの政府の戦略を実証的に評価する。
論文 参考訳(メタデータ) (2021-08-14T17:07:25Z) - STELAR: Spatio-temporal Tensor Factorization with Latent Epidemiological
Regularization [76.57716281104938]
我々は,多くの地域の流行傾向を同時に予測するテンソル法を開発した。
stelarは離散時間差分方程式のシステムを通じて潜在時間正規化を組み込むことで長期予測を可能にする。
我々は、カウンティレベルと州レベルのCOVID-19データの両方を用いて実験を行い、このモデルが流行の興味深い潜伏パターンを識別できることを示します。
論文 参考訳(メタデータ) (2020-12-08T21:21:47Z) - An Optimal Control Approach to Learning in SIDARTHE Epidemic model [67.22168759751541]
本研究では,疫病データから動的コンパートメンタルモデルの時間変化パラメータを学習するための一般的な手法を提案する。
我々はイタリアとフランスの疫病の進化を予報する。
論文 参考訳(メタデータ) (2020-10-28T10:58:59Z) - Steering a Historical Disease Forecasting Model Under a Pandemic: Case
of Flu and COVID-19 [75.99038202534628]
我々は、インフルエンザとCOVID-19が共存する新しいシナリオに、歴史的疾患予測モデルを「操る」ことができる神経伝達学習アーキテクチャであるCALI-Netを提案する。
我々の実験は、現在のパンデミックに歴史的予測モデルを適用することに成功していることを示している。
論文 参考訳(メタデータ) (2020-09-23T22:35:43Z) - Data-driven Simulation and Optimization for Covid-19 Exit Strategies [16.31545249131776]
コロナウイルスSARS-2の急速な普及は、世界中のほぼ全ての政府が悲劇に対応するために徹底的な対策を講じる大きな課題である。
我々は,疫学パラメータの深層学習推定を組み合わせたパンデミックシミュレーションと予測ツールキットを構築した。
論文 参考訳(メタデータ) (2020-06-12T11:18:25Z) - A General Framework for Survival Analysis and Multi-State Modelling [70.31153478610229]
ニューラル常微分方程式を多状態生存モデル推定のためのフレキシブルで一般的な方法として用いる。
また,本モデルでは,サバイバルデータセット上での最先端性能を示すとともに,マルチステート環境での有効性を示す。
論文 参考訳(メタデータ) (2020-06-08T19:24:54Z) - A Deep Q-learning/genetic Algorithms Based Novel Methodology For
Optimizing Covid-19 Pandemic Government Actions [63.669642197519934]
我々はSEIR疫学モデルを用いて、人口の時間とともにウイルスウイルスの進化を表現している。
報酬システムにより、アクションのシーケンス(統合、自己同化、二メートル距離、制限を取らない)を評価する。
どちらの意味でも、パンデミックの悪影響を抑えるために政府が取るべき行動を発見する上で、我々の方法論が有効な手段であることを実証する。
論文 参考訳(メタデータ) (2020-05-15T17:17:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。