論文の概要: EpidemiOptim: A Toolbox for the Optimization of Control Policies in
Epidemiological Models
- arxiv url: http://arxiv.org/abs/2010.04452v1
- Date: Fri, 9 Oct 2020 09:25:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 06:34:24.070060
- Title: EpidemiOptim: A Toolbox for the Optimization of Control Policies in
Epidemiological Models
- Title(参考訳): epidemioptim:疫学モデルにおける制御ポリシーの最適化のためのツールボックス
- Authors: C\'edric Colas, Boris Hejblum, S\'ebastien Rouillon, Rodolphe
Thi\'ebaut, Pierre-Yves Oudeyer, Cl\'ement Moulin-Frier and M\'elanie Prague
- Abstract要約: EpidemiOptimは、疫学と最適化の研究者間のコラボレーションを容易にするPythonツールボックスである。
これは疫学モデルとコスト関数を、最適化実践者が一般的に使用する標準インターフェースを介して最適化問題に変換する。
本稿では,エピデミオプティムを用いて,死傷率と経済不況の最適化の下で,ロックダウン制御を動的に行うための最適ポリシーを提案する。
- 参考スコア(独自算出の注目度): 12.748861129923348
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Epidemiologists model the dynamics of epidemics in order to propose control
strategies based on pharmaceutical and non-pharmaceutical interventions
(contact limitation, lock down, vaccination, etc). Hand-designing such
strategies is not trivial because of the number of possible interventions and
the difficulty to predict long-term effects. This task can be cast as an
optimization problem where state-of-the-art machine learning algorithms such as
deep reinforcement learning, might bring significant value. However, the
specificity of each domain -- epidemic modelling or solving optimization
problem -- requires strong collaborations between researchers from different
fields of expertise.
This is why we introduce EpidemiOptim, a Python toolbox that facilitates
collaborations between researchers in epidemiology and optimization.
EpidemiOptim turns epidemiological models and cost functions into optimization
problems via a standard interface commonly used by optimization practitioners
(OpenAI Gym). Reinforcement learning algorithms based on Q-Learning with deep
neural networks (DQN) and evolutionary algorithms (NSGA-II) are already
implemented. We illustrate the use of EpidemiOptim to find optimal policies for
dynamical on-off lock-down control under the optimization of death toll and
economic recess using a Susceptible-Exposed-Infectious-Removed (SEIR) model for
COVID-19. Using EpidemiOptim and its interactive visualization platform in
Jupyter notebooks, epidemiologists, optimization practitioners and others (e.g.
economists) can easily compare epidemiological models, costs functions and
optimization algorithms to address important choices to be made by health
decision-makers.
- Abstract(参考訳): 疫学者は、薬品や非薬品の介入(接触制限、ロックダウン、ワクチン接種など)に基づくコントロール戦略を提案するために、流行のダイナミクスをモデル化する。
このような戦略を手作業で設計するのは、可能な介入の数と長期的な効果を予測するのが難しいため、ささいなことではない。
このタスクは、高度な強化学習のような最先端の機械学習アルゴリズムが大きな価値をもたらすような最適化問題として考えられる。
しかしながら、各ドメインの特異性 -- 流行モデルや最適化問題を解決する - には、異なる専門分野の研究者間の強力なコラボレーションが必要である。
これは、疫学と最適化の研究者間のコラボレーションを促進するPythonツールボックスです。
EpidemiOptimは、疫学モデルとコスト関数を、最適化実践者(OpenAI Gym)が一般的に使用する標準インターフェースを介して最適化問題に変換する。
深層ニューラルネットワーク(DQN)と進化的アルゴリズム(NSGA-II)を用いたQ-Learningに基づく強化学習アルゴリズムはすでに実装されている。
本研究では,COVID-19に対するセフェミオプティベーション・エフェデミオプティベーション(SEIR)モデルを用いて,死傷率と経済不況の最適化の下での動的オンオフロックダウン制御のための最適ポリシーを求める。
EpidemiOptimとそのインタラクティブな視覚化プラットフォームをJupyterのノートブック、疫学者、最適化実践者など(経済学者など)は、疫学モデルやコスト関数、最適化アルゴリズムを簡単に比較して、健康意思決定者が行う重要な選択に対処することができる。
関連論文リスト
- On the calibration of compartmental epidemiological models [4.2456818663079865]
本稿では,いくつかの最適化手法や強化学習など,適用可能な校正戦略の概要について述べる。
提案手法の利点と欠点を考察し,本実験の実践的結論を明らかにする。
異なる疫学的文脈におけるこれらのアプローチの有効性と拡張性を検証するためには、さらなる研究が必要である。
論文 参考訳(メタデータ) (2023-12-09T03:57:06Z) - Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using
Deep Deterministic Policy Gradient [0.7244731714427565]
ロックダウン、急激な予防接種プログラム、学校閉鎖、経済刺激は、肯定的または意図しない否定的な結果をもたらす可能性がある。
ラウンドトリップを通じて自動的に最適な介入をモデル化し決定するための現在の研究は、シミュレーション目標、スケール(数千人)、介入研究に適さないモデルタイプ、探索可能な介入戦略の数(離散対連続)によって制限されている。
我々は,大規模(100,000人)の疫学的エージェントに基づくシミュレーションに基づいて,DDPGに基づく政策最適化フレームワークを用いて,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-10T09:26:07Z) - An Empirical Evaluation of Zeroth-Order Optimization Methods on
AI-driven Molecule Optimization [78.36413169647408]
分子目的を最適化するための様々なZO最適化手法の有効性について検討する。
ZO符号に基づく勾配降下(ZO-signGD)の利点を示す。
本稿では,Guurcamol スイートから広く使用されているベンチマークタスクに対して,ZO 最適化手法の有効性を示す。
論文 参考訳(メタデータ) (2022-10-27T01:58:10Z) - Socio-cognitive Optimization of Time-delay Control Problems using
Evolutionary Metaheuristics [89.24951036534168]
メタヒューリスティックス(Metaheuristics)は、古典的なアプローチでは解決できない難解な問題を解くために使用される普遍的な最適化アルゴリズムである。
本稿では,キャストに基づく新しい社会認知メタヒューリスティックの構築を目標とし,このアルゴリズムのいくつかのバージョンを時間遅延システムモデルの最適化に適用する。
論文 参考訳(メタデータ) (2022-10-23T22:21:10Z) - High-dimensional Bayesian Optimization Algorithm with Recurrent Neural
Network for Disease Control Models in Time Series [1.9371782627708491]
本稿では,リカレントニューラルネットワークを組み合わせた高次元ベイズ最適化アルゴリズムを提案する。
提案したRNN-BOアルゴリズムは,低次元空間における最適制御問題を解くことができる。
また、RNN層の異なる数の影響や、ソリューションの品質と関連する計算努力のトレードオフに対する訓練のエポックスについても論じる。
論文 参考訳(メタデータ) (2022-01-01T08:40:17Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Resource Planning for Hospitals Under Special Consideration of the
COVID-19 Pandemic: Optimization and Sensitivity Analysis [87.31348761201716]
新型コロナウイルス(covid-19)パンデミックのような危機は、医療機関にとって深刻な課題となる。
BaBSim.Hospitalは離散イベントシミュレーションに基づく容量計画ツールである。
BaBSim.Hospitalを改善するためにこれらのパラメータを調査し最適化することを目指しています。
論文 参考訳(メタデータ) (2021-05-16T12:38:35Z) - An Optimal Control Approach to Learning in SIDARTHE Epidemic model [67.22168759751541]
本研究では,疫病データから動的コンパートメンタルモデルの時間変化パラメータを学習するための一般的な手法を提案する。
我々はイタリアとフランスの疫病の進化を予報する。
論文 参考訳(メタデータ) (2020-10-28T10:58:59Z) - Machine Learning-Powered Mitigation Policy Optimization in
Epidemiological Models [33.88734751290751]
疫学モデルに基づく最適な政策勧告を得るための新しいアプローチを提案する。
このようなルックアヘッド戦略は、指定された制約に順応する非自明なポリシーを推測する。
論文 参考訳(メタデータ) (2020-10-16T16:27:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。