論文の概要: Optimal Policies for a Pandemic: A Stochastic Game Approach and a Deep
Learning Algorithm
- arxiv url: http://arxiv.org/abs/2012.06745v2
- Date: Mon, 8 Mar 2021 20:15:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 10:05:45.969785
- Title: Optimal Policies for a Pandemic: A Stochastic Game Approach and a Deep
Learning Algorithm
- Title(参考訳): パンデミックのための最適ポリシー:確率ゲームアプローチとディープラーニングアルゴリズム
- Authors: Yao Xuan, Robert Balkin, Jiequn Han, Ruimeng Hu, Hector D. Ceniceros
- Abstract要約: ゲーム理論は、病気の広がりを制御し、個人レベルと地域レベルで最適な政策を提案するための効果的なツールです。
拡散ゲーム理論に基づくマルチリージョンSEIRモデルを提案し,感染症の最適地域政策の策定を目指す。
提案するモデルとアルゴリズムを,ニューヨーク州,ニュージャージー州,ペンシルベニア州の3州で実施するcovid-19パンデミックの調査に適用した。
- 参考スコア(独自算出の注目度): 1.124958340749622
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Game theory has been an effective tool in the control of disease spread and
in suggesting optimal policies at both individual and area levels. In this
paper, we propose a multi-region SEIR model based on stochastic differential
game theory, aiming to formulate optimal regional policies for infectious
diseases. Specifically, we enhance the standard epidemic SEIR model by taking
into account the social and health policies issued by multiple region planners.
This enhancement makes the model more realistic and powerful. However, it also
introduces a formidable computational challenge due to the high dimensionality
of the solution space brought by the presence of multiple regions. This
significant numerical difficulty of the model structure motivates us to
generalize the deep fictitious algorithm introduced in [Han and Hu, MSML2020,
pp.221--245, PMLR, 2020] and develop an improved algorithm to overcome the
curse of dimensionality. We apply the proposed model and algorithm to study the
COVID-19 pandemic in three states: New York, New Jersey, and Pennsylvania. The
model parameters are estimated from real data posted by the Centers for Disease
Control and Prevention (CDC). We are able to show the effects of the
lockdown/travel ban policy on the spread of COVID-19 for each state and how
their policies affect each other.
- Abstract(参考訳): ゲーム理論は、病気の拡散を制御し、個人レベルと地域レベルの両方で最適なポリシーを提案するのに有効なツールである。
本稿では,感染症に対する最適地域政策を定式化することを目的とした,確率的微分ゲーム理論に基づく多地域サーモデルを提案する。
具体的には、複数の地域プランナーが発行する社会・健康政策を考慮し、標準流行SEIRモデルを強化する。
この拡張により、モデルはよりリアルで強力になる。
しかし、複数の領域の存在によって引き起こされる解空間の高次元性のため、強固な計算課題も導入されている。
このモデル構造の重大な数値的難しさは,[Han and Hu, MSML 2020, pp.221--245, PMLR, 2020] で導入された深い架空のアルゴリズムを一般化し,次元の呪いを克服する改良アルゴリズムを開発する動機となる。
提案するモデルとアルゴリズムを,ニューヨーク州,ニュージャージー州,ペンシルベニア州の3州で実施するcovid-19パンデミックの調査に適用した。
モデルパラメータは、CDC(Centers for Disease Control and Prevention)が投稿した実際のデータから推定される。
我々は、各州における新型コロナウイルスの拡散に対するロックダウン/トラベル禁止政策の効果と、それらの政策が相互にどのように影響するかを示すことができる。
関連論文リスト
- Deep Dynamic Epidemiological Modelling for COVID-19 Forecasting in
Multi-level Districts [23.725821734863487]
SEIRモデルに基づく疫学方程式は疾患の発生をシミュレートする。
SEIR方程式を解く従来のパラメータ推定法は実世界のデータに正確には適合しなかった。
ディープ・ダイナミック・疫学(DDE)法は、疫学方程式とディープラーニングの利点を組み合わせたものである。
論文 参考訳(メタデータ) (2023-06-21T06:30:02Z) - Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using
Deep Deterministic Policy Gradient [0.7244731714427565]
ロックダウン、急激な予防接種プログラム、学校閉鎖、経済刺激は、肯定的または意図しない否定的な結果をもたらす可能性がある。
ラウンドトリップを通じて自動的に最適な介入をモデル化し決定するための現在の研究は、シミュレーション目標、スケール(数千人)、介入研究に適さないモデルタイプ、探索可能な介入戦略の数(離散対連続)によって制限されている。
我々は,大規模(100,000人)の疫学的エージェントに基づくシミュレーションに基づいて,DDPGに基づく政策最適化フレームワークを用いて,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-10T09:26:07Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。
シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文 参考訳(メタデータ) (2022-09-15T07:22:58Z) - Compartmental Models for COVID-19 and Control via Policy Interventions [0.0]
確率型プログラミング言語(PPL)のツールキットを用いてSARS-CoV-2パンデミックの拡散を再現し予測する手法を実証する。
我々のゴールは、様々なモデリング仮定の影響を調査し、感染症の拡散を制限するために制定された政策介入を動機づけることである。
我々は疫学者ではない。この研究の唯一の目的は、新型コロナウイルスの政策決定が現実世界に与える影響を直接推測するのではなく、方法の展示として機能することである。
論文 参考訳(メタデータ) (2022-03-06T02:50:54Z) - Modeling the geospatial evolution of COVID-19 using spatio-temporal
convolutional sequence-to-sequence neural networks [48.7576911714538]
ポルトガルは世界最大の発生率を持つ国であり、人口10万人当たりの14日間の発生率が1000を超える。
その重要性にもかかわらず、covid-19の地理空間的進化の正確な予測は依然として課題である。
論文 参考訳(メタデータ) (2021-05-06T15:24:00Z) - An Optimal Control Approach to Learning in SIDARTHE Epidemic model [67.22168759751541]
本研究では,疫病データから動的コンパートメンタルモデルの時間変化パラメータを学習するための一般的な手法を提案する。
我々はイタリアとフランスの疫病の進化を予報する。
論文 参考訳(メタデータ) (2020-10-28T10:58:59Z) - Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control [19.022696762983017]
新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
本稿では,データ駆動型意思決定の促進と長期的コストの最小化を目的とした多目的モデルに基づく強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-09T23:55:27Z) - When and How to Lift the Lockdown? Global COVID-19 Scenario Analysis and
Policy Assessment using Compartmental Gaussian Processes [111.69190108272133]
新型コロナウイルス(COVID-19)の世界的な感染拡大を受け、多くの国が前例のないロックダウン措置を講じている。
さまざまなロックダウンポリシーシナリオの下で、新型コロナウイルスの死亡率を予測するデータ駆動モデルが不可欠だ。
本稿では,グローバルな状況下での新型コロナウイルスロックダウンポリシーの効果を予測するためのベイズモデルを開発する。
論文 参考訳(メタデータ) (2020-05-13T18:21:50Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。