論文の概要: On a Reinforcement Learning Methodology for Epidemic Control, with application to COVID-19
- arxiv url: http://arxiv.org/abs/2511.18035v1
- Date: Sat, 22 Nov 2025 12:23:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.59353
- Title: On a Reinforcement Learning Methodology for Epidemic Control, with application to COVID-19
- Title(参考訳): 疫病予防のための強化学習手法とCOVID-19への応用について
- Authors: Giacomo Iannucci, Petros Barmpounakis, Alexandros Beskos, Nikolaos Demiris,
- Abstract要約: コンパートメンタル流行モデルと逐次ベイズ推論と強化学習コントローラを組み合わせる。
モンテカルログリッドサーチにより計算されたICUしきい値ルールと、後進平均Q学習エージェントに基づくポリシーの2つのRLポリシーについて検討する。
本枠組みは、イングランドのCOVID-19パンデミックのICU占有データに、この流行モデルを適用して検証する。
- 参考スコア(独自算出の注目度): 39.146761527401424
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a real time, data driven decision support framework for epidemic control. We combine a compartmental epidemic model with sequential Bayesian inference and reinforcement learning (RL) controllers that adaptively choose intervention levels to balance disease burden, such as intensive care unit (ICU) load, against socio economic costs. We construct a context specific cost function using empirical experiments and expert feedback. We study two RL policies: an ICU threshold rule computed via Monte Carlo grid search, and a policy based on a posterior averaged Q learning agent. We validate the framework by fitting the epidemic model to publicly available ICU occupancy data from the COVID 19 pandemic in England and then generating counterfactual roll out scenarios under each RL controller, which allows us to compare the RL policies to the historical government strategy. Over a 300 day period and for a range of cost parameters, both controllers substantially reduce ICU burden relative to the observed interventions, illustrating how Bayesian sequential learning combined with RL can support the design of epidemic control policies.
- Abstract(参考訳): 本稿では,疫病対策のためのリアルタイムデータ駆動意思決定支援フレームワークを提案する。
我々は,集中治療単位(ICU)負荷などの疾病負担のバランスをとるために介入レベルを適応的に選択する,連続ベイズ推論と強化学習(RL)コントローラを併用する。
経験的実験と専門家のフィードバックを用いて,コンテキスト特異的コスト関数を構築した。
モンテカルログリッドサーチにより計算されたICUしきい値ルールと、後進平均Q学習エージェントに基づくポリシーの2つのRLポリシーについて検討する。
本枠組みは、イングランドのCOVID-19パンデミックで利用可能なICU占有データにその流行モデルを適用し、各RLコントローラの反実的なロールアウトシナリオを生成し、RLポリシーと歴史的政府の戦略を比較して検証する。
300日間にわたって、そして様々なコストパラメータに対して、両コントローラは観測された介入に対するICUの負担を大幅に軽減し、ベイズ的逐次学習とRLが組み合わさって、疫病対策の設計を支援することができるかを示した。
関連論文リスト
- Learning Pareto-Optimal Pandemic Intervention Policies with MORL [1.160208922584163]
本研究では,疾患拡散防止戦略をモデル化し,評価するための枠組みを開発する。
シミュレーションでは,全国規模のパンデミックのダイナミクスを再現し,他のモデルよりも桁違いに忠実に再現する。
この研究は、公衆衛生危機を緩和するための透明で証拠に基づく政策決定を支援する。
論文 参考訳(メタデータ) (2025-10-02T12:06:29Z) - Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文 参考訳(メタデータ) (2025-02-11T19:24:09Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top exploration [39.47724912690087]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
我々は,個別モデルSTRIDEを用いてベルギーのCOVID-19流行を考察し,感染数や入院回数を最小限に抑える予防接種方針のセットを学習した。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Data-driven control of COVID-19 in buildings: a reinforcement-learning
approach [1.2187048691454236]
新型コロナウイルス(COVID-19)のパンデミックにより、職場の閉鎖と閉鎖が始まり、総コストは16兆ドルを超えると推定されている。
本研究は, 建設環境における感染性病原体への被曝量を最小限に抑えるため, 最適室内気流設計のためのデータ駆動制御手法を提案する。
論文 参考訳(メタデータ) (2022-12-27T17:28:28Z) - Exploring the Pareto front of multi-objective COVID-19 mitigation
policies using reinforcement learning [1.7056617973440933]
感染症の発生は公衆衛生や社会プロセスに破壊的な影響を及ぼす可能性がある。
現在の研究は、病原体の攻撃率のような単一の目的でポリシーを最適化することに焦点を当てている。
深層多目的強化学習を適用し,最先端のアルゴリズムを用いて解の集合を学習する。
論文 参考訳(メタデータ) (2022-04-11T11:55:06Z) - Compartmental Models for COVID-19 and Control via Policy Interventions [0.0]
確率型プログラミング言語(PPL)のツールキットを用いてSARS-CoV-2パンデミックの拡散を再現し予測する手法を実証する。
我々のゴールは、様々なモデリング仮定の影響を調査し、感染症の拡散を制限するために制定された政策介入を動機づけることである。
我々は疫学者ではない。この研究の唯一の目的は、新型コロナウイルスの政策決定が現実世界に与える影響を直接推測するのではなく、方法の展示として機能することである。
論文 参考訳(メタデータ) (2022-03-06T02:50:54Z) - Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。
本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。
理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文 参考訳(メタデータ) (2022-01-31T20:58:47Z) - Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control [19.022696762983017]
新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
本稿では,データ駆動型意思決定の促進と長期的コストの最小化を目的とした多目的モデルに基づく強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-09T23:55:27Z) - When and How to Lift the Lockdown? Global COVID-19 Scenario Analysis and
Policy Assessment using Compartmental Gaussian Processes [111.69190108272133]
新型コロナウイルス(COVID-19)の世界的な感染拡大を受け、多くの国が前例のないロックダウン措置を講じている。
さまざまなロックダウンポリシーシナリオの下で、新型コロナウイルスの死亡率を予測するデータ駆動モデルが不可欠だ。
本稿では,グローバルな状況下での新型コロナウイルスロックダウンポリシーの効果を予測するためのベイズモデルを開発する。
論文 参考訳(メタデータ) (2020-05-13T18:21:50Z) - Robust Deep Reinforcement Learning against Adversarial Perturbations on
State Observations [88.94162416324505]
深部強化学習(DRL)エージェントは、自然な測定誤差や対向雑音を含む観測を通して、その状態を観察する。
観測は真の状態から逸脱するので、エージェントを誤解させ、準最適行動を起こすことができる。
本研究は, 従来の手法を, 対人訓練などの分類タスクの堅牢性向上に応用することは, 多くのRLタスクには有効でないことを示す。
論文 参考訳(メタデータ) (2020-03-19T17:59:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。