論文の概要: Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using
Deep Deterministic Policy Gradient
- arxiv url: http://arxiv.org/abs/2304.04475v1
- Date: Mon, 10 Apr 2023 09:26:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 15:27:52.727990
- Title: Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using
Deep Deterministic Policy Gradient
- Title(参考訳): Deep Deterministic Policy Gradientを用いた大規模エージェントベース疫学モデルのエピデミック制御
- Authors: Gaurav Deshkar, Jayanta Kshirsagar, Harshal Hayatnagarkar, and Janani
Venugopalan
- Abstract要約: ロックダウン、急激な予防接種プログラム、学校閉鎖、経済刺激は、肯定的または意図しない否定的な結果をもたらす可能性がある。
ラウンドトリップを通じて自動的に最適な介入をモデル化し決定するための現在の研究は、シミュレーション目標、スケール(数千人)、介入研究に適さないモデルタイプ、探索可能な介入戦略の数(離散対連続)によって制限されている。
我々は,大規模(100,000人)の疫学的エージェントに基づくシミュレーションに基づいて,DDPGに基づく政策最適化フレームワークを用いて,これらの課題に対処する。
- 参考スコア(独自算出の注目度): 0.7244731714427565
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To mitigate the impact of the pandemic, several measures include lockdowns,
rapid vaccination programs, school closures, and economic stimulus. These
interventions can have positive or unintended negative consequences. Current
research to model and determine an optimal intervention automatically through
round-tripping is limited by the simulation objectives, scale (a few thousand
individuals), model types that are not suited for intervention studies, and the
number of intervention strategies they can explore (discrete vs continuous). We
address these challenges using a Deep Deterministic Policy Gradient (DDPG)
based policy optimization framework on a large-scale (100,000 individual)
epidemiological agent-based simulation where we perform multi-objective
optimization. We determine the optimal policy for lockdown and vaccination in a
minimalist age-stratified multi-vaccine scenario with a basic simulation for
economic activity. With no lockdown and vaccination (mid-age and elderly),
results show optimal economy (individuals below the poverty line) with balanced
health objectives (infection, and hospitalization). An in-depth simulation is
needed to further validate our results and open-source our framework.
- Abstract(参考訳): パンデミックの影響を軽減するため、ロックダウン、急速ワクチン接種プログラム、学校閉鎖、経済刺激などいくつかの措置が講じられている。
これらの介入は肯定的あるいは意図しない否定的な結果をもたらす可能性がある。
ラウンドトリップによる最適な介入を自動的にモデル化し決定するための現在の研究は、シミュレーション目標、スケール(数千人)、介入研究に適さないモデルタイプ、探索可能な介入戦略の数(離散対連続)によって制限されている。
我々は,多目的最適化を行う大規模(100,000人)疫学エージェントに基づくシミュレーションにおいて,DDPGに基づく政策最適化フレームワークを用いてこれらの課題に対処する。
経済活動の基本的なシミュレーションを用いて, 最少年齢階層のマルチワクチンシナリオにおいて, ロックダウンとワクチン接種の最適方針を決定する。
ロックダウンやワクチン接種(中年と高齢者)がなければ、健康目標(感染、入院)がバランスの取れた最適経済(貧困線以下の個人)が示される。
結果のさらなる検証とフレームワークのオープンソース化には,詳細なシミュレーションが必要である。
関連論文リスト
- Reduced-Rank Multi-objective Policy Learning and Optimization [57.978477569678844]
実際には、因果研究者は先験を念頭において1つの結果を持っていない。
政府支援の社会福祉プログラムでは、政策立案者は貧困の多次元的性質を理解するために多くの成果を集めている。
本稿では、最適政策学習の文脈において、複数の結果に対するデータ駆動型次元性推論手法を提案する。
論文 参考訳(メタデータ) (2024-04-29T08:16:30Z) - Modeling and Optimization of Epidemiological Control Policies Through
Reinforcement Learning [0.0]
パンデミックの影響は、特定の制限をコミュニティに課すことによって最小化することができる。
感染と死亡率を最小限に抑える一方で、これらの制限は経済的危機につながる可能性がある。
我々は、報酬関数に基づくパンデミックシミュレーションに最適な制限を強制するために、強化学習エージェントを訓練する。
論文 参考訳(メタデータ) (2024-01-25T22:39:39Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Nearly Optimal Latent State Decoding in Block MDPs [74.51224067640717]
エピソードブロック MDP では、意思決定者は少数の潜在状態から生成される豊富な観測やコンテキストにアクセスすることができる。
まず、固定動作ポリシーに基づいて生成されたデータに基づいて、潜時状態復号関数を推定することに興味がある。
次に、報酬のないフレームワークにおいて、最適に近いポリシーを学習する問題について研究する。
論文 参考訳(メタデータ) (2022-08-17T18:49:53Z) - Discrete Stochastic Optimization for Public Health Interventions with
Constraints [1.8275108630751844]
本稿では,2009年のH1N1と新型コロナウイルスのパンデミックについて,オープンソースのモンテカルロシミュレーションによってモデル化された疾患の拡散について述べる。
最適化の目的は、社会に最小限の経済損失をもたらすため、介入戦略の最良の組み合わせを決定することである。
論文 参考訳(メタデータ) (2022-06-27T21:21:25Z) - Pyfectious: An individual-level simulator to discover optimal
containment polices for epidemic diseases [16.28189705178286]
本研究では、集団構造をモデル化し、疾患の伝播を個人レベルで制御できるシミュレータを提案する。
潜在的な応用を示すため、シミュレーターパラメータは新型コロナウイルスのパンデミックの正式な統計に基づいて設定される。
このシミュレーターは、パンデミックを制御するための最適なポリシーを見つけるために強化学習問題の環境として使用される。
論文 参考訳(メタデータ) (2021-03-24T10:54:46Z) - An Optimal Control Approach to Learning in SIDARTHE Epidemic model [67.22168759751541]
本研究では,疫病データから動的コンパートメンタルモデルの時間変化パラメータを学習するための一般的な手法を提案する。
我々はイタリアとフランスの疫病の進化を予報する。
論文 参考訳(メタデータ) (2020-10-28T10:58:59Z) - Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control [19.022696762983017]
新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
本稿では,データ駆動型意思決定の促進と長期的コストの最小化を目的とした多目的モデルに基づく強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-09T23:55:27Z) - Data-driven Simulation and Optimization for Covid-19 Exit Strategies [16.31545249131776]
コロナウイルスSARS-2の急速な普及は、世界中のほぼ全ての政府が悲劇に対応するために徹底的な対策を講じる大きな課題である。
我々は,疫学パラメータの深層学習推定を組み合わせたパンデミックシミュレーションと予測ツールキットを構築した。
論文 参考訳(メタデータ) (2020-06-12T11:18:25Z) - A Deep Q-learning/genetic Algorithms Based Novel Methodology For
Optimizing Covid-19 Pandemic Government Actions [63.669642197519934]
我々はSEIR疫学モデルを用いて、人口の時間とともにウイルスウイルスの進化を表現している。
報酬システムにより、アクションのシーケンス(統合、自己同化、二メートル距離、制限を取らない)を評価する。
どちらの意味でも、パンデミックの悪影響を抑えるために政府が取るべき行動を発見する上で、我々の方法論が有効な手段であることを実証する。
論文 参考訳(メタデータ) (2020-05-15T17:17:45Z) - When and How to Lift the Lockdown? Global COVID-19 Scenario Analysis and
Policy Assessment using Compartmental Gaussian Processes [111.69190108272133]
新型コロナウイルス(COVID-19)の世界的な感染拡大を受け、多くの国が前例のないロックダウン措置を講じている。
さまざまなロックダウンポリシーシナリオの下で、新型コロナウイルスの死亡率を予測するデータ駆動モデルが不可欠だ。
本稿では,グローバルな状況下での新型コロナウイルスロックダウンポリシーの効果を予測するためのベイズモデルを開発する。
論文 参考訳(メタデータ) (2020-05-13T18:21:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。