論文の概要: Learning Pareto-Optimal Pandemic Intervention Policies with MORL
- arxiv url: http://arxiv.org/abs/2510.03340v1
- Date: Thu, 02 Oct 2025 12:06:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:58.846269
- Title: Learning Pareto-Optimal Pandemic Intervention Policies with MORL
- Title(参考訳): MORLを用いたパレット最適パンデミック介入政策の学習
- Authors: Marian Chen, Miri Zilka,
- Abstract要約: 本研究では,疾患拡散防止戦略をモデル化し,評価するための枠組みを開発する。
シミュレーションでは,全国規模のパンデミックのダイナミクスを再現し,他のモデルよりも桁違いに忠実に再現する。
この研究は、公衆衛生危機を緩和するための透明で証拠に基づく政策決定を支援する。
- 参考スコア(独自算出の注目度): 1.160208922584163
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The COVID-19 pandemic underscored a critical need for intervention strategies that balance disease containment with socioeconomic stability. We approach this challenge by designing a framework for modeling and evaluating disease-spread prevention strategies. Our framework leverages multi-objective reinforcement learning (MORL) - a formulation necessitated by competing objectives - combined with a new stochastic differential equation (SDE) pandemic simulator, calibrated and validated against global COVID-19 data. Our simulator reproduces national-scale pandemic dynamics with orders of magnitude higher fidelity than other models commonly used in reinforcement learning (RL) approaches to pandemic intervention. Training a Pareto-Conditioned Network (PCN) agent on this simulator, we illustrate the direct policy trade-offs between epidemiological control and economic stability for COVID-19. Furthermore, we demonstrate the framework's generality by extending it to pathogens with different epidemiological profiles, such as polio and influenza, and show how these profiles lead the agent to discover fundamentally different intervention policies. To ground our work in contemporary policymaking challenges, we apply the model to measles outbreaks, quantifying how a modest 5% drop in vaccination coverage necessitates significantly more stringent and costly interventions to curb disease spread. This work provides a robust and adaptable framework to support transparent, evidence-based policymaking for mitigating public health crises.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)のパンデミックは、疾病の封じ込めと社会経済の安定をバランスづける介入戦略の重大な必要性を浮き彫りにした。
本稿では,疾患予防戦略をモデル化し,評価する枠組みを設計することによって,この問題に対処する。
我々のフレームワークは、競合する目的によって必要となる多目的強化学習(MORL)と、新しい確率微分方程式(SDE)パンデミックシミュレータを組み合わせることで、グローバルなCOVID-19データに対して校正および検証を行う。
我々のシミュレーターは、パンデミック介入に対する強化学習(RL)アプローチで一般的に用いられる他のモデルよりも、桁違いに高い忠実度で全国規模のパンデミックダイナミクスを再現する。
本シミュレータを用いたPCN(Pareto-Conditioned Network)エージェントの訓練を行い、疫学的コントロールと新型コロナウイルスの経済安定の直接的なトレードオフについて説明する。
さらに、ポリオやインフルエンザなどの疫学的プロファイルが異なる病原体に拡張することで、フレームワークの汎用性を実証し、これらのプロファイルがどのようにしてエージェントが根本的に異なる介入ポリシーを発見するかを示す。
現代の政策立案の課題を基礎として、麻疹の発生をモデルに適用し、予防接種率の5%低下が、感染拡大を抑制するためにより厳格でコストのかかる介入を必要とするかを定量化する。
この研究は、公衆衛生危機を緩和するための透明でエビデンスに基づく政策決定を支援する、堅牢で適応可能なフレームワークを提供する。
関連論文リスト
- Optimization of Infectious Disease Intervention Measures Based on Reinforcement Learning - Empirical analysis based on UK COVID-19 epidemic data [1.2637032027754087]
エージェント・ベース・トランスミッション・モデルに基づく意思決定フレームワークを構築した。
コヴァシムは、詳細で広く使われているエージェントベースの疾患伝達モデルであり、強化学習研究を支援するために修正された。
論文 参考訳(メタデータ) (2025-05-07T06:23:26Z) - Agent-Based Model: Simulating a Virus Expansion Based on the Acceptance
of Containment Measures [65.62256987706128]
比較疫学モデルは、疾患の状態に基づいて個人を分類する。
我々は、適応されたSEIRDモデルと市民のための意思決定モデルを組み合わせたABMアーキテクチャを提案する。
スペイン・ア・コルナにおけるSARS-CoV-2感染症の進行状況について検討した。
論文 参考訳(メタデータ) (2023-07-28T08:01:05Z) - Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using
Deep Deterministic Policy Gradient [0.7244731714427565]
ロックダウン、急激な予防接種プログラム、学校閉鎖、経済刺激は、肯定的または意図しない否定的な結果をもたらす可能性がある。
ラウンドトリップを通じて自動的に最適な介入をモデル化し決定するための現在の研究は、シミュレーション目標、スケール(数千人)、介入研究に適さないモデルタイプ、探索可能な介入戦略の数(離散対連続)によって制限されている。
我々は,大規模(100,000人)の疫学的エージェントに基づくシミュレーションに基づいて,DDPGに基づく政策最適化フレームワークを用いて,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-10T09:26:07Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top exploration [39.47724912690087]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
我々は,個別モデルSTRIDEを用いてベルギーのCOVID-19流行を考察し,感染数や入院回数を最小限に抑える予防接種方針のセットを学習した。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Exploring the Pareto front of multi-objective COVID-19 mitigation
policies using reinforcement learning [1.7056617973440933]
感染症の発生は公衆衛生や社会プロセスに破壊的な影響を及ぼす可能性がある。
現在の研究は、病原体の攻撃率のような単一の目的でポリシーを最適化することに焦点を当てている。
深層多目的強化学習を適用し,最先端のアルゴリズムを用いて解の集合を学習する。
論文 参考訳(メタデータ) (2022-04-11T11:55:06Z) - Compartmental Models for COVID-19 and Control via Policy Interventions [0.0]
確率型プログラミング言語(PPL)のツールキットを用いてSARS-CoV-2パンデミックの拡散を再現し予測する手法を実証する。
我々のゴールは、様々なモデリング仮定の影響を調査し、感染症の拡散を制限するために制定された政策介入を動機づけることである。
我々は疫学者ではない。この研究の唯一の目的は、新型コロナウイルスの政策決定が現実世界に与える影響を直接推測するのではなく、方法の展示として機能することである。
論文 参考訳(メタデータ) (2022-03-06T02:50:54Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - An Optimal Control Approach to Learning in SIDARTHE Epidemic model [67.22168759751541]
本研究では,疫病データから動的コンパートメンタルモデルの時間変化パラメータを学習するための一般的な手法を提案する。
我々はイタリアとフランスの疫病の進化を予報する。
論文 参考訳(メタデータ) (2020-10-28T10:58:59Z) - Steering a Historical Disease Forecasting Model Under a Pandemic: Case
of Flu and COVID-19 [75.99038202534628]
我々は、インフルエンザとCOVID-19が共存する新しいシナリオに、歴史的疾患予測モデルを「操る」ことができる神経伝達学習アーキテクチャであるCALI-Netを提案する。
我々の実験は、現在のパンデミックに歴史的予測モデルを適用することに成功していることを示している。
論文 参考訳(メタデータ) (2020-09-23T22:35:43Z) - Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control [19.022696762983017]
新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
本稿では,データ駆動型意思決定の促進と長期的コストの最小化を目的とした多目的モデルに基づく強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-09T23:55:27Z) - When and How to Lift the Lockdown? Global COVID-19 Scenario Analysis and
Policy Assessment using Compartmental Gaussian Processes [111.69190108272133]
新型コロナウイルス(COVID-19)の世界的な感染拡大を受け、多くの国が前例のないロックダウン措置を講じている。
さまざまなロックダウンポリシーシナリオの下で、新型コロナウイルスの死亡率を予測するデータ駆動モデルが不可欠だ。
本稿では,グローバルな状況下での新型コロナウイルスロックダウンポリシーの効果を予測するためのベイズモデルを開発する。
論文 参考訳(メタデータ) (2020-05-13T18:21:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。