論文の概要: Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control
- arxiv url: http://arxiv.org/abs/2009.04607v3
- Date: Sat, 26 Feb 2022 21:00:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 08:55:26.848254
- Title: Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control
- Title(参考訳): 多目的モデルに基づく感染症予防のための強化学習
- Authors: Runzhe Wan, Xinyu Zhang, Rui Song
- Abstract要約: 新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
本稿では,データ駆動型意思決定の促進と長期的コストの最小化を目的とした多目的モデルに基づく強化学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 19.022696762983017
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Severe infectious diseases such as the novel coronavirus (COVID-19) pose a
huge threat to public health. Stringent control measures, such as school
closures and stay-at-home orders, while having significant effects, also bring
huge economic losses. In the face of an emerging infectious disease, a crucial
question for policymakers is how to make the trade-off and implement the
appropriate interventions timely given the huge uncertainty. In this work, we
propose a Multi-Objective Model-based Reinforcement Learning framework to
facilitate data-driven decision-making and minimize the overall long-term cost.
Specifically, at each decision point, a Bayesian epidemiological model is first
learned as the environment model, and then the proposed model-based
multi-objective planning algorithm is applied to find a set of Pareto-optimal
policies. This framework, combined with the prediction bands for each policy,
provides a real-time decision support tool for policymakers. The application is
demonstrated with the spread of COVID-19 in China.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
新興感染症に直面する中で、政策立案者にとって重要な疑問は、この大きな不確実性を踏まえて、適切な介入を適切に実施し、適切に実施する方法である。
本研究では,データ駆動意思決定を容易にし,長期的なコストを最小化する,多目的モデルに基づく強化学習フレームワークを提案する。
具体的には, 各決定点において, ベイズ疫学モデルがまず環境モデルとして学習され, 提案するモデルに基づく多目的計画アルゴリズムを用いてパレート最適政策の組を求める。
このフレームワークは、各ポリシーの予測バンドと組み合わせて、政策立案者にリアルタイムの意思決定支援ツールを提供する。
この応用は、中国でのcovid-19の拡散で実証されている。
関連論文リスト
- Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using
Deep Deterministic Policy Gradient [0.7244731714427565]
ロックダウン、急激な予防接種プログラム、学校閉鎖、経済刺激は、肯定的または意図しない否定的な結果をもたらす可能性がある。
ラウンドトリップを通じて自動的に最適な介入をモデル化し決定するための現在の研究は、シミュレーション目標、スケール(数千人)、介入研究に適さないモデルタイプ、探索可能な介入戦略の数(離散対連続)によって制限されている。
我々は,大規模(100,000人)の疫学的エージェントに基づくシミュレーションに基づいて,DDPGに基づく政策最適化フレームワークを用いて,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-10T09:26:07Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Exploring the Pareto front of multi-objective COVID-19 mitigation
policies using reinforcement learning [1.7056617973440933]
感染症の発生は公衆衛生や社会プロセスに破壊的な影響を及ぼす可能性がある。
現在の研究は、病原体の攻撃率のような単一の目的でポリシーを最適化することに焦点を当てている。
深層多目的強化学習を適用し,最先端のアルゴリズムを用いて解の集合を学習する。
論文 参考訳(メタデータ) (2022-04-11T11:55:06Z) - Compartmental Models for COVID-19 and Control via Policy Interventions [0.0]
確率型プログラミング言語(PPL)のツールキットを用いてSARS-CoV-2パンデミックの拡散を再現し予測する手法を実証する。
我々のゴールは、様々なモデリング仮定の影響を調査し、感染症の拡散を制限するために制定された政策介入を動機づけることである。
我々は疫学者ではない。この研究の唯一の目的は、新型コロナウイルスの政策決定が現実世界に与える影響を直接推測するのではなく、方法の展示として機能することである。
論文 参考訳(メタデータ) (2022-03-06T02:50:54Z) - Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。
本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。
理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文 参考訳(メタデータ) (2022-01-31T20:58:47Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Optimal Policies for a Pandemic: A Stochastic Game Approach and a Deep
Learning Algorithm [1.124958340749622]
ゲーム理論は、病気の広がりを制御し、個人レベルと地域レベルで最適な政策を提案するための効果的なツールです。
拡散ゲーム理論に基づくマルチリージョンSEIRモデルを提案し,感染症の最適地域政策の策定を目指す。
提案するモデルとアルゴリズムを,ニューヨーク州,ニュージャージー州,ペンシルベニア州の3州で実施するcovid-19パンデミックの調査に適用した。
論文 参考訳(メタデータ) (2020-12-12T07:10:46Z) - An Optimal Control Approach to Learning in SIDARTHE Epidemic model [67.22168759751541]
本研究では,疫病データから動的コンパートメンタルモデルの時間変化パラメータを学習するための一般的な手法を提案する。
我々はイタリアとフランスの疫病の進化を予報する。
論文 参考訳(メタデータ) (2020-10-28T10:58:59Z) - Machine Learning-Powered Mitigation Policy Optimization in
Epidemiological Models [33.88734751290751]
疫学モデルに基づく最適な政策勧告を得るための新しいアプローチを提案する。
このようなルックアヘッド戦略は、指定された制約に順応する非自明なポリシーを推測する。
論文 参考訳(メタデータ) (2020-10-16T16:27:17Z) - A Deep Q-learning/genetic Algorithms Based Novel Methodology For
Optimizing Covid-19 Pandemic Government Actions [63.669642197519934]
我々はSEIR疫学モデルを用いて、人口の時間とともにウイルスウイルスの進化を表現している。
報酬システムにより、アクションのシーケンス(統合、自己同化、二メートル距離、制限を取らない)を評価する。
どちらの意味でも、パンデミックの悪影響を抑えるために政府が取るべき行動を発見する上で、我々の方法論が有効な手段であることを実証する。
論文 参考訳(メタデータ) (2020-05-15T17:17:45Z) - When and How to Lift the Lockdown? Global COVID-19 Scenario Analysis and
Policy Assessment using Compartmental Gaussian Processes [111.69190108272133]
新型コロナウイルス(COVID-19)の世界的な感染拡大を受け、多くの国が前例のないロックダウン措置を講じている。
さまざまなロックダウンポリシーシナリオの下で、新型コロナウイルスの死亡率を予測するデータ駆動モデルが不可欠だ。
本稿では,グローバルな状況下での新型コロナウイルスロックダウンポリシーの効果を予測するためのベイズモデルを開発する。
論文 参考訳(メタデータ) (2020-05-13T18:21:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。