論文の概要: Stochastic Optimization for Vaccine and Testing Kit Allocation for the
COVID-19 Pandemic
- arxiv url: http://arxiv.org/abs/2101.01204v1
- Date: Mon, 4 Jan 2021 19:08:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 23:02:06.896291
- Title: Stochastic Optimization for Vaccine and Testing Kit Allocation for the
COVID-19 Pandemic
- Title(参考訳): 新型コロナウイルスパンデミックに対するワクチンおよびテストキット配置の確率的最適化
- Authors: Lawrence Thul, Warren Powell
- Abstract要約: SARS-CoV-2ウイルスは、世界的な健康危機に対処するために資源を分配する際の意思決定戦略に多くの欠陥を露呈している。
本稿では,各種資源の配分戦略を改善するために,強化学習と最適化を活用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The pandemic caused by the SARS-CoV-2 virus has exposed many flaws in the
decision-making strategies used to distribute resources to combat global health
crises. In this paper, we leverage reinforcement learning and optimization to
improve upon the allocation strategies for various resources. In particular, we
consider a problem where a central controller must decide where to send testing
kits to learn about the uncertain states of the world (active learning); then,
use the new information to construct beliefs about the states and decide where
to allocate resources. We propose a general model coupled with a tunable
lookahead policy for making vaccine allocation decisions without perfect
knowledge about the state of the world. The lookahead policy is compared to a
population-based myopic policy which is more likely to be similar to the
present strategies in practice. Each vaccine allocation policy works in
conjunction with a testing kit allocation policy to perform active learning.
Our simulation results demonstrate that an optimization-based lookahead
decision making strategy will outperform the presented myopic policy.
- Abstract(参考訳): SARS-CoV-2ウイルスによるパンデミックは、世界的な健康危機に対処するために資源を分配する際の意思決定戦略に多くの欠陥を露呈している。
本稿では,各種資源の配分戦略を改善するために,強化学習と最適化を活用する。
特に、世界の不確実な状態(アクティブラーニング)について学習するために、テストキットの送信先を決定する必要がある問題について考察し、その上で、新しい情報を用いて、状態に関する信念を構築し、リソースを割り当てる場所を決定する。
我々は,世界の状況について完全な知識を持たずにワクチン割当決定を行うための,調整可能なルックアヘッドポリシーと組み合わされた一般モデルを提案する。
ルックアヘッド政策は、実際には現在の戦略と類似している可能性が高い人口ベースの筋電図政策と比較される。
各ワクチン割り当てポリシーは、アクティブな学習を行うためのテストキット割り当てポリシーと連携して機能する。
シミュレーションの結果、最適化に基づくルックアヘッド決定戦略は、提示されたミオピックポリシーよりも優れていることが示された。
関連論文リスト
- Learning Optimal Deterministic Policies with Stochastic Policy Gradients [62.81324245896716]
政策勾配法(PG法)は連続強化学習(RL法)問題に対処する手法として成功している。
一般的には、収束(ハイパー)政治は、決定論的バージョンをデプロイするためにのみ学習される。
本稿では,サンプルの複雑性とデプロイされた決定論的ポリシのパフォーマンスのトレードオフを最適化するために,学習に使用する探索レベルの調整方法を示す。
論文 参考訳(メタデータ) (2024-05-03T16:45:15Z) - Local Optimization Achieves Global Optimality in Multi-Agent
Reinforcement Learning [139.53668999720605]
本稿では,各エージェントのローカルポリシーをバニラPPOと同様に更新するマルチエージェントPPOアルゴリズムを提案する。
マルコフゲームにおける標準正則条件と問題依存量により、我々のアルゴリズムはサブリニアレートで大域的最適ポリシーに収束することを示す。
論文 参考訳(メタデータ) (2023-05-08T16:20:03Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Adversarial Learning-based Stance Classifier for COVID-19-related Health
Policies [14.558584240713154]
本研究では、新型コロナウイルス関連健康政策に対する公衆の態度を自動的に識別する対人学習に基づくスタンス分類器を提案する。
モデルをより深く理解するために、モデルに外部知識としてポリシー記述を組み込む。
新型コロナウイルス関連健康政策のスタンス検出タスクにおいて,幅広い基準線の性能を評価する。
論文 参考訳(メタデータ) (2022-09-10T10:27:21Z) - CAMEO: Curiosity Augmented Metropolis for Exploratory Optimal Policies [62.39667564455059]
最適政策の分布を考察し研究する。
実験シミュレーションでは、CAMEOは古典的な制御問題を全て解決するポリシーを実際に得ることを示した。
さらに,本論文では,異なるリスクプロファイルを示す異なるポリシーを,解釈可能性に関する興味深い実践的応用に対応して提示する。
論文 参考訳(メタデータ) (2022-05-19T09:48:56Z) - Exploring the Pareto front of multi-objective COVID-19 mitigation
policies using reinforcement learning [1.7056617973440933]
感染症の発生は公衆衛生や社会プロセスに破壊的な影響を及ぼす可能性がある。
現在の研究は、病原体の攻撃率のような単一の目的でポリシーを最適化することに焦点を当てている。
深層多目的強化学習を適用し,最先端のアルゴリズムを用いて解の集合を学習する。
論文 参考訳(メタデータ) (2022-04-11T11:55:06Z) - Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。
本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。
理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文 参考訳(メタデータ) (2022-01-31T20:58:47Z) - Machine Learning-Powered Mitigation Policy Optimization in
Epidemiological Models [33.88734751290751]
疫学モデルに基づく最適な政策勧告を得るための新しいアプローチを提案する。
このようなルックアヘッド戦略は、指定された制約に順応する非自明なポリシーを推測する。
論文 参考訳(メタデータ) (2020-10-16T16:27:17Z) - Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control [19.022696762983017]
新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
本稿では,データ駆動型意思決定の促進と長期的コストの最小化を目的とした多目的モデルに基づく強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-09T23:55:27Z) - When and How to Lift the Lockdown? Global COVID-19 Scenario Analysis and
Policy Assessment using Compartmental Gaussian Processes [111.69190108272133]
新型コロナウイルス(COVID-19)の世界的な感染拡大を受け、多くの国が前例のないロックダウン措置を講じている。
さまざまなロックダウンポリシーシナリオの下で、新型コロナウイルスの死亡率を予測するデータ駆動モデルが不可欠だ。
本稿では,グローバルな状況下での新型コロナウイルスロックダウンポリシーの効果を予測するためのベイズモデルを開発する。
論文 参考訳(メタデータ) (2020-05-13T18:21:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。