論文の概要: Reinforcement Learning for Optimization of COVID-19 Mitigation policies
- arxiv url: http://arxiv.org/abs/2010.10560v1
- Date: Tue, 20 Oct 2020 18:40:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 06:37:20.223398
- Title: Reinforcement Learning for Optimization of COVID-19 Mitigation policies
- Title(参考訳): 新型コロナウイルス対策の最適化のための強化学習
- Authors: Varun Kompella, Roberto Capobianco, Stacy Jong, Jonathan Browne,
Spencer Fox, Lauren Meyers, Peter Wurman, Peter Stone
- Abstract要約: 2020年は新型コロナウイルスの感染拡大が世界最悪の世界的なパンデミックの1つとなった。
世界中の政府は公衆衛生を保護し、経済を最大限に維持するという課題に直面している。
疫学モデルは、これらの病気の拡散に関する洞察を与え、介入政策の効果を予測する。
- 参考スコア(独自算出の注目度): 29.4529156655747
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The year 2020 has seen the COVID-19 virus lead to one of the worst global
pandemics in history. As a result, governments around the world are faced with
the challenge of protecting public health, while keeping the economy running to
the greatest extent possible. Epidemiological models provide insight into the
spread of these types of diseases and predict the effects of possible
intervention policies. However, to date,the even the most data-driven
intervention policies rely on heuristics. In this paper, we study how
reinforcement learning (RL) can be used to optimize mitigation policies that
minimize the economic impact without overwhelming the hospital capacity. Our
main contributions are (1) a novel agent-based pandemic simulator which, unlike
traditional models, is able to model fine-grained interactions among people at
specific locations in a community; and (2) an RL-based methodology for
optimizing fine-grained mitigation policies within this simulator. Our results
validate both the overall simulator behavior and the learned policies under
realistic conditions.
- Abstract(参考訳): 2020年は、新型コロナウイルス(covid-19)が世界最悪のパンデミックにつながった年だ。
その結果、世界中の政府は、経済を最大限に維持しつつ、公衆衛生を守るという課題に直面している。
疫学モデルは、これらの病気の拡散に関する洞察を与え、介入政策の効果を予測する。
しかし、これまでで最もデータ駆動型の介入政策でさえヒューリスティックスに依存している。
本稿では,病院の容量を超過することなく経済への影響を最小限に抑えるための緩和策として,強化学習(RL)をいかに活用できるかを検討する。
本研究の主な貢献は,(1)地域内の特定の場所にいる人々間のきめ細かな相互作用をモデル化できるエージェントベースのパンデミックシミュレータ,(2)このシミュレータ内でのきめ細かな緩和ポリシーを最適化するためのRLベースの方法論である。
本結果は,現実的な条件下でのシミュレーション行動と学習方針の両方を検証した。
関連論文リスト
- Reduced-Rank Multi-objective Policy Learning and Optimization [57.978477569678844]
実際には、因果研究者は先験を念頭において1つの結果を持っていない。
政府支援の社会福祉プログラムでは、政策立案者は貧困の多次元的性質を理解するために多くの成果を集めている。
本稿では、最適政策学習の文脈において、複数の結果に対するデータ駆動型次元性推論手法を提案する。
論文 参考訳(メタデータ) (2024-04-29T08:16:30Z) - Game and Reference: Policy Combination Synthesis for Epidemic Prevention and Control [4.635793210136456]
疫病対策のための新しい政策組合せ合成(PCS)モデルを提案する。
極端な意思決定を防止するため、モデル作成ポリシーと実際のポリシーの対立学習を導入する。
また、同様のシナリオ下での最高の歴史的政策から、モデルに経験を引き出すために、対照的な学習も採用しています。
論文 参考訳(メタデータ) (2024-03-16T00:26:59Z) - Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using
Deep Deterministic Policy Gradient [0.7244731714427565]
ロックダウン、急激な予防接種プログラム、学校閉鎖、経済刺激は、肯定的または意図しない否定的な結果をもたらす可能性がある。
ラウンドトリップを通じて自動的に最適な介入をモデル化し決定するための現在の研究は、シミュレーション目標、スケール(数千人)、介入研究に適さないモデルタイプ、探索可能な介入戦略の数(離散対連続)によって制限されている。
我々は,大規模(100,000人)の疫学的エージェントに基づくシミュレーションに基づいて,DDPGに基づく政策最適化フレームワークを用いて,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-10T09:26:07Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Discrete Stochastic Optimization for Public Health Interventions with
Constraints [1.8275108630751844]
本稿では,2009年のH1N1と新型コロナウイルスのパンデミックについて,オープンソースのモンテカルロシミュレーションによってモデル化された疾患の拡散について述べる。
最適化の目的は、社会に最小限の経済損失をもたらすため、介入戦略の最良の組み合わせを決定することである。
論文 参考訳(メタデータ) (2022-06-27T21:21:25Z) - Building a Foundation for Data-Driven, Interpretable, and Robust Policy
Design using the AI Economist [67.08543240320756]
AIエコノミストフレームワークは,2段階強化学習とデータ駆動型シミュレーションを用いて,効果的な,柔軟な,解釈可能なポリシー設計を可能にする。
RLを用いて訓練されたログリニア政策は、過去の結果と比較して、公衆衛生と経済の両面から社会福祉を著しく改善することがわかった。
論文 参考訳(メタデータ) (2021-08-06T01:30:41Z) - Impact of Interventional Policies Including Vaccine on Covid-19
Propagation and Socio-Economic Factors [0.7874708385247353]
本研究の目的は、新型コロナウイルスの伝播と社会経済的影響をモデル化、予測、シミュレーションするための予測分析フレームワークを提供することである。
私たちは最近ローンチしたオープンソースのCOVID-19ビッグデータプラットフォームを活用し、公開研究を使用して潜在的に関連する変数を見つけました。
先進的な機械学習パイプラインは、現代的な機械学習アーキテクチャにデプロイされた自己進化モデルを用いて開発された。
論文 参考訳(メタデータ) (2021-01-11T15:08:07Z) - Data-driven Simulation and Optimization for Covid-19 Exit Strategies [16.31545249131776]
コロナウイルスSARS-2の急速な普及は、世界中のほぼ全ての政府が悲劇に対応するために徹底的な対策を講じる大きな課題である。
我々は,疫学パラメータの深層学習推定を組み合わせたパンデミックシミュレーションと予測ツールキットを構築した。
論文 参考訳(メタデータ) (2020-06-12T11:18:25Z) - COVI White Paper [67.04578448931741]
接触追跡は、新型コロナウイルスのパンデミックの進行を変える上で不可欠なツールだ。
カナダで開発されたCovid-19の公衆ピアツーピア接触追跡とリスク認識モバイルアプリケーションであるCOVIの理論的、設計、倫理的考察、プライバシ戦略について概説する。
論文 参考訳(メタデータ) (2020-05-18T07:40:49Z) - A Deep Q-learning/genetic Algorithms Based Novel Methodology For
Optimizing Covid-19 Pandemic Government Actions [63.669642197519934]
我々はSEIR疫学モデルを用いて、人口の時間とともにウイルスウイルスの進化を表現している。
報酬システムにより、アクションのシーケンス(統合、自己同化、二メートル距離、制限を取らない)を評価する。
どちらの意味でも、パンデミックの悪影響を抑えるために政府が取るべき行動を発見する上で、我々の方法論が有効な手段であることを実証する。
論文 参考訳(メタデータ) (2020-05-15T17:17:45Z) - When and How to Lift the Lockdown? Global COVID-19 Scenario Analysis and
Policy Assessment using Compartmental Gaussian Processes [111.69190108272133]
新型コロナウイルス(COVID-19)の世界的な感染拡大を受け、多くの国が前例のないロックダウン措置を講じている。
さまざまなロックダウンポリシーシナリオの下で、新型コロナウイルスの死亡率を予測するデータ駆動モデルが不可欠だ。
本稿では,グローバルな状況下での新型コロナウイルスロックダウンポリシーの効果を予測するためのベイズモデルを開発する。
論文 参考訳(メタデータ) (2020-05-13T18:21:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。