論文の概要: Optimising Lockdown Policies for Epidemic Control using Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2003.14093v2
- Date: Fri, 1 May 2020 11:28:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 00:03:37.119298
- Title: Optimising Lockdown Policies for Epidemic Control using Reinforcement
Learning
- Title(参考訳): 強化学習を用いたエピデミック制御のためのロックダウンポリシーの最適化
- Authors: Harshad Khadilkar, Tanuja Ganu, Deva P Seetharam
- Abstract要約: 我々は、健康と経済のバランスを保ちながら、各都市や地域ごとのロックダウン決定を定量的に計算する方法を提案する。
これらのポリシーは、疾患パラメータの関数として提案アルゴリズムによって自動的に学習される。
我々は不完全ロックダウンなどの現実的な考察を考察し、強化学習を用いて得られた政策がロックダウンへの有効な定量的アプローチであることを示す。
- 参考スコア(独自算出の注目度): 5.174900115018252
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the context of the ongoing Covid-19 pandemic, several reports and studies
have attempted to model and predict the spread of the disease. There is also
intense debate about policies for limiting the damage, both to health and to
the economy. On the one hand, the health and safety of the population is the
principal consideration for most countries. On the other hand, we cannot ignore
the potential for long-term economic damage caused by strict nation-wide
lockdowns. In this working paper, we present a quantitative way to compute
lockdown decisions for individual cities or regions, while balancing health and
economic considerations. Furthermore, these policies are learnt automatically
by the proposed algorithm, as a function of disease parameters (infectiousness,
gestation period, duration of symptoms, probability of death) and population
characteristics (density, movement propensity). We account for realistic
considerations such as imperfect lockdowns, and show that the policy obtained
using reinforcement learning is a viable quantitative approach towards
lockdowns.
- Abstract(参考訳): 新型コロナウイルスのパンデミックが進行中である状況において、いくつかの報告や研究が病気の拡散をモデル化し予測しようと試みている。
また、健康と経済の両方に損害を限定する政策についても激しい議論がある。
一方で、人口の健康と安全が、ほとんどの国の主要な考慮事項である。
一方で、全国的ロックダウンの厳格化による長期的な経済被害の可能性は無視できない。
本稿では,健康と経済のバランスを保ちながら,各都市や地域ごとのロックダウン決定を定量的に計算する方法を提案する。
さらに、これらのポリシーは、疾患パラメータ(感染性、妊娠期間、症状の期間、死亡確率)と人口特性(密度、運動確率)の関数として、提案アルゴリズムによって自動的に学習される。
我々は不完全ロックダウンなどの現実的な考察を考察し、強化学習を用いて得られた政策がロックダウンへの有効な定量的アプローチであることを示す。
関連論文リスト
- SIR-RL: Reinforcement Learning for Optimized Policy Control during Epidemiological Outbreaks in Emerging Market and Developing Economies [0.0]
本研究では,パンデミック時の健康・経済的成果の最適化を目的とした,新たな強化学習フレームワークを提案する。
強化学習を実施することで、政府の対応を最適化し、公衆衛生と経済の安定に関わる競争コストのバランスをとることを目指す。
論文 参考訳(メタデータ) (2024-04-12T12:11:51Z) - Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using
Deep Deterministic Policy Gradient [0.7244731714427565]
ロックダウン、急激な予防接種プログラム、学校閉鎖、経済刺激は、肯定的または意図しない否定的な結果をもたらす可能性がある。
ラウンドトリップを通じて自動的に最適な介入をモデル化し決定するための現在の研究は、シミュレーション目標、スケール(数千人)、介入研究に適さないモデルタイプ、探索可能な介入戦略の数(離散対連続)によって制限されている。
我々は,大規模(100,000人)の疫学的エージェントに基づくシミュレーションに基づいて,DDPGに基づく政策最適化フレームワークを用いて,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-10T09:26:07Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Estimating Geographic Spillover Effects of COVID-19 Policies From
Large-Scale Mobility Networks [54.90772000796717]
郡レベルの政策は地域間の柔軟性を提供するが、地理的な流出がある場合には効果が低下する可能性がある。
我々は、数十億のタイムスタンプを持つ移動ネットワークを用いて、流出量を推定する。
郡レベルの制限は、モビリティを減らすための州全体の制限と同等に有効である。
論文 参考訳(メタデータ) (2022-12-12T20:16:54Z) - Optimal non-pharmaceutical intervention policy for Covid-19 epidemic via
neuroevolution algorithm [0.0]
ウイルス感染サイクルを乱し、医療制度が完全に経済的な負担に圧倒されるのを防ぐための政策。
我々は,非薬剤感染症介入の相対的人・経済・医療費を構成する介入政策モデルを開発した。
提案モデルでは,医療システムの負担を最大容量以下に抑えるため,接触率を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-10-23T16:26:50Z) - Building a Foundation for Data-Driven, Interpretable, and Robust Policy
Design using the AI Economist [67.08543240320756]
AIエコノミストフレームワークは,2段階強化学習とデータ駆動型シミュレーションを用いて,効果的な,柔軟な,解釈可能なポリシー設計を可能にする。
RLを用いて訓練されたログリニア政策は、過去の結果と比較して、公衆衛生と経済の両面から社会福祉を著しく改善することがわかった。
論文 参考訳(メタデータ) (2021-08-06T01:30:41Z) - Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control [19.022696762983017]
新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
本稿では,データ駆動型意思決定の促進と長期的コストの最小化を目的とした多目的モデルに基づく強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-09T23:55:27Z) - Data-driven Simulation and Optimization for Covid-19 Exit Strategies [16.31545249131776]
コロナウイルスSARS-2の急速な普及は、世界中のほぼ全ての政府が悲劇に対応するために徹底的な対策を講じる大きな課題である。
我々は,疫学パラメータの深層学習推定を組み合わせたパンデミックシミュレーションと予測ツールキットを構築した。
論文 参考訳(メタデータ) (2020-06-12T11:18:25Z) - COVI White Paper [67.04578448931741]
接触追跡は、新型コロナウイルスのパンデミックの進行を変える上で不可欠なツールだ。
カナダで開発されたCovid-19の公衆ピアツーピア接触追跡とリスク認識モバイルアプリケーションであるCOVIの理論的、設計、倫理的考察、プライバシ戦略について概説する。
論文 参考訳(メタデータ) (2020-05-18T07:40:49Z) - A Deep Q-learning/genetic Algorithms Based Novel Methodology For
Optimizing Covid-19 Pandemic Government Actions [63.669642197519934]
我々はSEIR疫学モデルを用いて、人口の時間とともにウイルスウイルスの進化を表現している。
報酬システムにより、アクションのシーケンス(統合、自己同化、二メートル距離、制限を取らない)を評価する。
どちらの意味でも、パンデミックの悪影響を抑えるために政府が取るべき行動を発見する上で、我々の方法論が有効な手段であることを実証する。
論文 参考訳(メタデータ) (2020-05-15T17:17:45Z) - When and How to Lift the Lockdown? Global COVID-19 Scenario Analysis and
Policy Assessment using Compartmental Gaussian Processes [111.69190108272133]
新型コロナウイルス(COVID-19)の世界的な感染拡大を受け、多くの国が前例のないロックダウン措置を講じている。
さまざまなロックダウンポリシーシナリオの下で、新型コロナウイルスの死亡率を予測するデータ駆動モデルが不可欠だ。
本稿では,グローバルな状況下での新型コロナウイルスロックダウンポリシーの効果を予測するためのベイズモデルを開発する。
論文 参考訳(メタデータ) (2020-05-13T18:21:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。