論文の概要: Optimal Epidemic Control as a Contextual Combinatorial Bandit with
Budget
- arxiv url: http://arxiv.org/abs/2106.15808v1
- Date: Wed, 30 Jun 2021 04:46:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-01 12:34:11.638459
- Title: Optimal Epidemic Control as a Contextual Combinatorial Bandit with
Budget
- Title(参考訳): 予算を伴う組合わせ帯域としての最適エピデミック制御
- Authors: Baihan Lin, Djallel Bouneffouf
- Abstract要約: 新型コロナウイルス(COVID-19)のパンデミックを踏まえ、最良の政策を規定する最適な方法を見つけることは、オープンな挑戦であり、重要な実践的問題である。
この多次元的なエクスプロイトと探索のトレードオフを解決するために、我々はこの技術的課題を文脈的盗聴問題として定式化する。
エージェントは、毎日の新型コロナウイルス感染者数と推奨介入の厳格さを最小化するために、政策立案者がリアルタイムで実施できる有用な介入計画を作成する必要がある。
- 参考スコア(独自算出の注目度): 26.49683079770031
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In light of the COVID-19 pandemic, it is an open challenge and critical
practical problem to find a optimal way to dynamically prescribe the best
policies that balance both the governmental resources and epidemic control in
different countries and regions. To solve this multi-dimensional tradeoff of
exploitation and exploration, we formulate this technical challenge as a
contextual combinatorial bandit problem that jointly optimizes a multi-criteria
reward function. Given the historical daily cases in a region and the past
intervention plans in place, the agent should generate useful intervention
plans that policy makers can implement in real time to minimizing both the
number of daily COVID-19 cases and the stringency of the recommended
interventions. We prove this concept with simulations of multiple realistic
policy making scenarios.
- Abstract(参考訳): 新型コロナウイルス(covid-19)のパンデミックに照らし合わせると、各国や地域の政府資源と疫病対策をバランスさせる最善の政策を動的に規定する最適な方法を見出すことは、オープン・チャレンジであり、現実的な課題である。
搾取と探索の多次元的トレードオフを解決するために,我々は,マルチクリトリア報酬関数を共同で最適化する文脈組合せバンディット問題として,この技術的課題を定式化する。
地域における歴史的事例と過去の介入計画を考えると、エージェントは、政策立案者がリアルタイムで実施できる有用な介入計画を作成し、毎日の新型コロナウイルス感染者数と推奨介入のストリング性の両方を最小化する必要がある。
この概念を、複数の現実的な政策作成シナリオのシミュレーションで証明する。
関連論文リスト
- Thompson Exploration with Best Challenger Rule in Best Arm
Identification [66.33448474838342]
本稿では,バンドイットフレームワークにおける固定信頼度最良腕識別問題について検討する。
我々は、トンプソンサンプリングと、ベストチャレンジャールールとして知られる計算効率の良いアプローチを組み合わせた新しいポリシーを提案する。
論文 参考訳(メタデータ) (2023-10-01T01:37:02Z) - Reparameterized Policy Learning for Multimodal Trajectory Optimization [61.13228961771765]
本研究では,高次元連続行動空間における強化学習のためのパラメータ化政策の課題について検討する。
本稿では,連続RLポリシーを最適軌道の生成モデルとしてモデル化する原理的フレームワークを提案する。
本稿では,マルチモーダルポリシーパラメータ化と学習世界モデルを活用した実用的モデルベースRL手法を提案する。
論文 参考訳(メタデータ) (2023-07-20T09:05:46Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - CAMEO: Curiosity Augmented Metropolis for Exploratory Optimal Policies [62.39667564455059]
最適政策の分布を考察し研究する。
実験シミュレーションでは、CAMEOは古典的な制御問題を全て解決するポリシーを実際に得ることを示した。
さらに,本論文では,異なるリスクプロファイルを示す異なるポリシーを,解釈可能性に関する興味深い実践的応用に対応して提示する。
論文 参考訳(メタデータ) (2022-05-19T09:48:56Z) - Evaluation of non-pharmaceutical interventions and optimal strategies
for containing the COVID-19 pandemic [14.807368322926227]
政策,移動パターン,ウイルス感染の関連について検討する。
その結果,緊急宣言の権限とマスク着用が強調された。
我々の枠組みは、パンデミック対応のベストプラクティスについて、あらゆる国の政策立案者に通知することができる。
論文 参考訳(メタデータ) (2022-02-28T17:33:25Z) - Data-driven Optimization Model for Global Covid-19 Intervention Plans [5.565573622844362]
新型コロナウイルス(COVID-19)の感染拡大に伴い、各国政府は経済への影響を最小限に抑えつつ、感染者の数を減少させる最善の介入を見つけるために集結している。
本稿では,最小限の新規症例数と経済的影響の両方を最適化する介入計画を規定する整数プログラミング手法について述べる。
論文 参考訳(メタデータ) (2021-04-16T02:56:36Z) - Optimal Policies for a Pandemic: A Stochastic Game Approach and a Deep
Learning Algorithm [1.124958340749622]
ゲーム理論は、病気の広がりを制御し、個人レベルと地域レベルで最適な政策を提案するための効果的なツールです。
拡散ゲーム理論に基づくマルチリージョンSEIRモデルを提案し,感染症の最適地域政策の策定を目指す。
提案するモデルとアルゴリズムを,ニューヨーク州,ニュージャージー州,ペンシルベニア州の3州で実施するcovid-19パンデミックの調査に適用した。
論文 参考訳(メタデータ) (2020-12-12T07:10:46Z) - Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control [19.022696762983017]
新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
本稿では,データ駆動型意思決定の促進と長期的コストの最小化を目的とした多目的モデルに基づく強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-09T23:55:27Z) - When and How to Lift the Lockdown? Global COVID-19 Scenario Analysis and
Policy Assessment using Compartmental Gaussian Processes [111.69190108272133]
新型コロナウイルス(COVID-19)の世界的な感染拡大を受け、多くの国が前例のないロックダウン措置を講じている。
さまざまなロックダウンポリシーシナリオの下で、新型コロナウイルスの死亡率を予測するデータ駆動モデルが不可欠だ。
本稿では,グローバルな状況下での新型コロナウイルスロックダウンポリシーの効果を予測するためのベイズモデルを開発する。
論文 参考訳(メタデータ) (2020-05-13T18:21:50Z) - Variational Policy Propagation for Multi-agent Reinforcement Learning [68.26579560607597]
本稿では,エージェント間の相互作用を通じて,共役ポリシーを学習するために,変動ポリシー伝搬 (VPP) という,共役型多エージェント強化学習アルゴリズムを提案する。
共同政策がマルコフランダム場(Markov Random Field)であることは、いくつかの穏やかな条件下で証明し、それによって政策空間を効果的に減少させる。
我々は、マルコフ確率場から効率的に行動をサンプリングでき、全体的な政策が微分可能であるようなポリシーにおいて、変動推論を特別な微分可能な層として統合する。
論文 参考訳(メタデータ) (2020-04-19T15:42:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。