論文の概要: Optimization of Infectious Disease Intervention Measures Based on Reinforcement Learning - Empirical analysis based on UK COVID-19 epidemic data
- arxiv url: http://arxiv.org/abs/2505.04161v1
- Date: Wed, 07 May 2025 06:23:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 19:07:35.988107
- Title: Optimization of Infectious Disease Intervention Measures Based on Reinforcement Learning - Empirical analysis based on UK COVID-19 epidemic data
- Title(参考訳): 強化学習に基づく感染症予防対策の最適化 -英国におけるCOVID-19流行データに基づく実証分析-
- Authors: Baida Zhang, Yakai Chen, Huichun Li, Zhenghu Zu,
- Abstract要約: エージェント・ベース・トランスミッション・モデルに基づく意思決定フレームワークを構築した。
コヴァシムは、詳細で広く使われているエージェントベースの疾患伝達モデルであり、強化学習研究を支援するために修正された。
- 参考スコア(独自算出の注目度): 1.2637032027754087
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Globally, the outbreaks of infectious diseases have exerted an extremely profound and severe influence on health security and the economy. During the critical phases of epidemics, devising effective intervention measures poses a significant challenge to both the academic and practical arenas. There is numerous research based on reinforcement learning to optimize intervention measures of infectious diseases. Nevertheless, most of these efforts have been confined within the differential equation based on infectious disease models. Although a limited number of studies have incorporated reinforcement learning methodologies into individual-based infectious disease models, the models employed therein have entailed simplifications and limitations, rendering it incapable of modeling the complexity and dynamics inherent in infectious disease transmission. We establish a decision-making framework based on an individual agent-based transmission model, utilizing reinforcement learning to continuously explore and develop a strategy function. The framework's validity is verified through both experimental and theoretical approaches. Covasim, a detailed and widely used agent-based disease transmission model, was modified to support reinforcement learning research. We conduct an exhaustive exploration of the application efficacy of multiple algorithms across diverse action spaces. Furthermore, we conduct an innovative preliminary theoretical analysis concerning the issue of "time coverage". The results of the experiment robustly validate the effectiveness and feasibility of the methodological framework of this study. The coping strategies gleaned therefrom prove highly efficacious in suppressing the expansion of the epidemic scale and safeguarding the stability of the economic system, thereby providing crucial reference perspectives for the formulation of global public health security strategies.
- Abstract(参考訳): 世界的な感染症の流行は、医療の安全と経済に大きな影響を与えている。
疫病の危機期において、効果的な介入策を考案することは、学術的・実践的な分野で大きな課題となる。
感染症の介入対策を最適化するための強化学習に基づく研究が数多く行われている。
しかしながら、これらの取り組みのほとんどは、伝染病モデルに基づく微分方程式に限られている。
個人ベースの感染症モデルに強化学習手法を組み込んだ研究は限られているが、それを用いたモデルは単純化と制限を伴い、伝染病の伝染に固有の複雑さとダイナミクスをモデル化することができない。
我々は、強化学習を利用して、個別のエージェントベースの伝達モデルに基づく意思決定フレームワークを構築し、戦略関数を継続的に探索し、開発する。
フレームワークの妥当性は、実験的および理論的アプローチの両方を通じて検証される。
コヴァシムは、詳細で広く使われているエージェントベースの疾患伝達モデルであり、強化学習研究を支援するために修正された。
多様な行動空間にまたがる複数のアルゴリズムの適用効率を徹底的に調査する。
さらに、我々は「時間カバレッジ」の問題に関して、革新的な予備的理論的分析を行う。
本研究の方法論的枠組みの有効性と妥当性を検証した。
対応戦略は、感染拡大の抑制や経済システムの安定の確保に極めて効果的であることから、グローバルな公衆衛生戦略の定式化に向けた重要な基準的視点を提供する。
関連論文リスト
- Epidemic-guided deep learning for spatiotemporal forecasting of Tuberculosis outbreak [0.0]
結核 (TB) は、複雑な伝達ダイナミクスによって引き起こされ、人口移動や行動の変化などの要因の影響を受けながら、世界的健康上の課題である。
先進的な深層学習技術と機械的疫学の原則を融合させるエピデミックガイド型深層学習手法を提案する。
論文 参考訳(メタデータ) (2025-02-15T12:39:42Z) - Reinforcement Learning for Safe Occupancy Strategies in Educational
Spaces during an Epidemic [9.68145635795782]
本研究は、感染の最小化と教育環境における対人交流の最大化を両立させる戦略を開発するための強化学習(RL)に焦点を当てる。
感染拡大をシミュレートし,様々なRLアルゴリズムの探索を容易にする新しいツールであるSafeCampusを紹介する。
論文 参考訳(メタデータ) (2023-12-23T04:51:23Z) - On Pathologies in KL-Regularized Reinforcement Learning from Expert
Demonstrations [79.49929463310588]
我々は,KL-正規化強化学習と行動基準ポリシを併用することで,病理訓練のダイナミクスに悩まされることを示した。
非パラメトリックな行動参照ポリシーで治療できることを示す。
論文 参考訳(メタデータ) (2022-12-28T16:29:09Z) - Data-Centric Epidemic Forecasting: A Survey [56.99209141838794]
この調査は、様々なデータ駆動の方法論および実践的進歩を掘り下げるものである。
疫学的なデータセットと,流行予測に関連する新しいデータストリームを列挙する。
また,これらの予測システムの現実的な展開において生じる経験や課題についても論じる。
論文 参考訳(メタデータ) (2022-07-19T16:15:11Z) - Exploring the Pareto front of multi-objective COVID-19 mitigation
policies using reinforcement learning [1.7056617973440933]
感染症の発生は公衆衛生や社会プロセスに破壊的な影響を及ぼす可能性がある。
現在の研究は、病原体の攻撃率のような単一の目的でポリシーを最適化することに焦点を当てている。
深層多目的強化学習を適用し,最先端のアルゴリズムを用いて解の集合を学習する。
論文 参考訳(メタデータ) (2022-04-11T11:55:06Z) - SurvITE: Learning Heterogeneous Treatment Effects from Time-to-Event
Data [83.50281440043241]
時系列データから不均一な処理効果を推定する問題について検討する。
本稿では,バランス表現に基づく治療特異的ハザード推定のための新しいディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2021-10-26T20:13:17Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - An Optimal Control Approach to Learning in SIDARTHE Epidemic model [67.22168759751541]
本研究では,疫病データから動的コンパートメンタルモデルの時間変化パラメータを学習するための一般的な手法を提案する。
我々はイタリアとフランスの疫病の進化を予報する。
論文 参考訳(メタデータ) (2020-10-28T10:58:59Z) - Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control [19.022696762983017]
新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
本稿では,データ駆動型意思決定の促進と長期的コストの最小化を目的とした多目的モデルに基づく強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-09T23:55:27Z) - Deep reinforcement learning for large-scale epidemic control [0.3694429692322631]
本研究では,パンデミックインフルエンザの予防戦略を自動学習するための深層強化学習手法について検討する。
我々のモデルは、強化学習技術が実現できるように、複雑さと計算効率のバランスをとる。
この実験により, 大規模状態空間を持つ複雑な疫学モデルにおいて, 深層強化学習を用いて緩和策を学習できることが示唆された。
論文 参考訳(メタデータ) (2020-03-30T17:57:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。