論文の概要: Deep reinforcement learning for large-scale epidemic control
- arxiv url: http://arxiv.org/abs/2003.13676v1
- Date: Mon, 30 Mar 2020 17:57:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 07:07:55.994078
- Title: Deep reinforcement learning for large-scale epidemic control
- Title(参考訳): 大規模疫病対策のための深層強化学習
- Authors: Pieter Libin, Arno Moonens, Timothy Verstraeten, Fabian
Perez-Sanjines, Niel Hens, Philippe Lemey, Ann Now\'e
- Abstract要約: 本研究では,パンデミックインフルエンザの予防戦略を自動学習するための深層強化学習手法について検討する。
我々のモデルは、強化学習技術が実現できるように、複雑さと計算効率のバランスをとる。
この実験により, 大規模状態空間を持つ複雑な疫学モデルにおいて, 深層強化学習を用いて緩和策を学習できることが示唆された。
- 参考スコア(独自算出の注目度): 0.3694429692322631
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Epidemics of infectious diseases are an important threat to public health and
global economies. Yet, the development of prevention strategies remains a
challenging process, as epidemics are non-linear and complex processes. For
this reason, we investigate a deep reinforcement learning approach to
automatically learn prevention strategies in the context of pandemic influenza.
Firstly, we construct a new epidemiological meta-population model, with 379
patches (one for each administrative district in Great Britain), that
adequately captures the infection process of pandemic influenza. Our model
balances complexity and computational efficiency such that the use of
reinforcement learning techniques becomes attainable. Secondly, we set up a
ground truth such that we can evaluate the performance of the 'Proximal Policy
Optimization' algorithm to learn in a single district of this epidemiological
model. Finally, we consider a large-scale problem, by conducting an experiment
where we aim to learn a joint policy to control the districts in a community of
11 tightly coupled districts, for which no ground truth can be established.
This experiment shows that deep reinforcement learning can be used to learn
mitigation policies in complex epidemiological models with a large state space.
Moreover, through this experiment, we demonstrate that there can be an
advantage to consider collaboration between districts when designing prevention
strategies.
- Abstract(参考訳): 伝染病の流行は公衆衛生や世界経済にとって重要な脅威である。
しかし、流行が非線形で複雑なプロセスであるため、予防戦略の開発は依然として困難なプロセスである。
そこで本研究では,パンデミックインフルエンザの文脈で予防戦略を自動学習するための深層強化学習手法について検討する。
まず,パンデミックインフルエンザの感染過程を適切に把握する379のパッチ(イギリス各行政区に1つずつ)を備えた,新しい疫学的メタ人口モデルを構築した。
我々のモデルは、強化学習技術が実現できるように、複雑さと計算効率のバランスをとる。
第2に,この疫学モデルの1つの領域で学習するために,'Proximal Policy Optimization'アルゴリズムの性能を評価するための基礎的真実を設定した。
最後に,11地区の密集した地域社会において,根底的真理が確立できない地域を統制するための共同政策を学ぼうとする実験を行い,大規模問題を考える。
この実験により, 大規模状態空間を持つ複雑な疫学モデルにおいて, 深層強化学習を用いて緩和策を学習できることが示唆された。
また,本実験により,予防戦略を設計する際,地域間の協調を考えることができることを実証した。
関連論文リスト
- Epidemiology-Aware Neural ODE with Continuous Disease Transmission Graph [14.28921518883576]
持続疾患透過グラフ(EARTH)を用いた疫学対応ニューラル・オードという,革新的なエンドツーエンドフレームワークを提案する。
本稿ではまず,感染メカニズムとニューラルODEアプローチをシームレスに統合するEANOを提案する。
また,グローバルな感染動向をモデル化するためにGLTGを導入し,これらの信号を利用して局所的な感染を動的に誘導する。
論文 参考訳(メタデータ) (2024-09-28T04:07:16Z) - Reinforcement Learning for Safe Occupancy Strategies in Educational
Spaces during an Epidemic [9.68145635795782]
本研究は、感染の最小化と教育環境における対人交流の最大化を両立させる戦略を開発するための強化学習(RL)に焦点を当てる。
感染拡大をシミュレートし,様々なRLアルゴリズムの探索を容易にする新しいツールであるSafeCampusを紹介する。
論文 参考訳(メタデータ) (2023-12-23T04:51:23Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - On Pathologies in KL-Regularized Reinforcement Learning from Expert
Demonstrations [79.49929463310588]
我々は,KL-正規化強化学習と行動基準ポリシを併用することで,病理訓練のダイナミクスに悩まされることを示した。
非パラメトリックな行動参照ポリシーで治療できることを示す。
論文 参考訳(メタデータ) (2022-12-28T16:29:09Z) - Exploring the Pareto front of multi-objective COVID-19 mitigation
policies using reinforcement learning [1.7056617973440933]
感染症の発生は公衆衛生や社会プロセスに破壊的な影響を及ぼす可能性がある。
現在の研究は、病原体の攻撃率のような単一の目的でポリシーを最適化することに焦点を当てている。
深層多目的強化学習を適用し,最先端のアルゴリズムを用いて解の集合を学習する。
論文 参考訳(メタデータ) (2022-04-11T11:55:06Z) - Digital Epidemiology: A review [0.0]
疫学は近年、計算モデルに基づく大きな進歩を目撃している。
ビッグデータとアプリによって、大規模な実データによるモデルの検証と精錬が可能になる。
エボラは、システム解を必要とするため、複雑性のレンズからアプローチする必要がある。
論文 参考訳(メタデータ) (2021-04-08T08:45:20Z) - An Optimal Control Approach to Learning in SIDARTHE Epidemic model [67.22168759751541]
本研究では,疫病データから動的コンパートメンタルモデルの時間変化パラメータを学習するための一般的な手法を提案する。
我々はイタリアとフランスの疫病の進化を予報する。
論文 参考訳(メタデータ) (2020-10-28T10:58:59Z) - Steering a Historical Disease Forecasting Model Under a Pandemic: Case
of Flu and COVID-19 [75.99038202534628]
我々は、インフルエンザとCOVID-19が共存する新しいシナリオに、歴史的疾患予測モデルを「操る」ことができる神経伝達学習アーキテクチャであるCALI-Netを提案する。
我々の実験は、現在のパンデミックに歴史的予測モデルを適用することに成功していることを示している。
論文 参考訳(メタデータ) (2020-09-23T22:35:43Z) - Data-driven Simulation and Optimization for Covid-19 Exit Strategies [16.31545249131776]
コロナウイルスSARS-2の急速な普及は、世界中のほぼ全ての政府が悲劇に対応するために徹底的な対策を講じる大きな課題である。
我々は,疫学パラメータの深層学習推定を組み合わせたパンデミックシミュレーションと予測ツールキットを構築した。
論文 参考訳(メタデータ) (2020-06-12T11:18:25Z) - A Deep Q-learning/genetic Algorithms Based Novel Methodology For
Optimizing Covid-19 Pandemic Government Actions [63.669642197519934]
我々はSEIR疫学モデルを用いて、人口の時間とともにウイルスウイルスの進化を表現している。
報酬システムにより、アクションのシーケンス(統合、自己同化、二メートル距離、制限を取らない)を評価する。
どちらの意味でも、パンデミックの悪影響を抑えるために政府が取るべき行動を発見する上で、我々の方法論が有効な手段であることを実証する。
論文 参考訳(メタデータ) (2020-05-15T17:17:45Z) - Hierarchical Reinforcement Learning for Automatic Disease Diagnosis [52.111516253474285]
政策学習のための対話システムに2段階の階層的な政策構造を統合することを提案する。
提案した政策構造は,多くの疾患や症状を含む診断問題に対処することができる。
論文 参考訳(メタデータ) (2020-04-29T15:02:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。