論文の概要: Epidemiologically and Socio-economically Optimal Policies via Bayesian
Optimization
- arxiv url: http://arxiv.org/abs/2005.11257v2
- Date: Mon, 15 Jun 2020 03:44:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 08:49:04.418539
- Title: Epidemiologically and Socio-economically Optimal Policies via Bayesian
Optimization
- Title(参考訳): ベイズ最適化による疫学的・社会経済的最適政策
- Authors: Amit Chandak and Debojyoti Dey and Bhaskar Mukhoty and Purushottam Kar
- Abstract要約: 大量検疫(英: Mass public quarantining)、通称ロックダウン(英: lock-down)は、病気の拡散を検査するための薬品以外の介入である。
本稿では,ベイズ最適化を用いたアクティブな機械学習手法の新たな応用であるESOPについて述べる。この手法は,ロックダウン期間における公衆衛生上の利益と経済活動の減少という社会的・経済的な欠点を最適にバランスするロックダウンスケジュールに到達するための,疫学モデルと相互作用する。
- 参考スコア(独自算出の注目度): 4.910276496877174
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mass public quarantining, colloquially known as a lock-down, is a
non-pharmaceutical intervention to check spread of disease. This paper presents
ESOP (Epidemiologically and Socio-economically Optimal Policies), a novel
application of active machine learning techniques using Bayesian optimization,
that interacts with an epidemiological model to arrive at lock-down schedules
that optimally balance public health benefits and socio-economic downsides of
reduced economic activity during lock-down periods. The utility of ESOP is
demonstrated using case studies with VIPER
(Virus-Individual-Policy-EnviRonment), a stochastic agent-based simulator that
this paper also proposes. However, ESOP is flexible enough to interact with
arbitrary epidemiological simulators in a black-box manner, and produce
schedules that involve multiple phases of lock-downs.
- Abstract(参考訳): 大量検疫(英: mass public quarantining、口頭で「ロックダウン」と呼ばれる)は、病気の広がりをチェックするための非薬剤的介入である。
本稿では,ベイズ最適化を用いたアクティブ機械学習手法の新たな応用であるesop(epidemiologically and socio- economicly optimal policy)について述べる。
ESOP(Virus-Individual-Policy-EnviRonment)を用いたケーススタディを用いてESOPの有用性を実証した。
しかし、ESOPはブラックボックス方式で任意の疫学シミュレータと対話し、ロックダウンの複数のフェーズを含むスケジュールを生成するのに十分柔軟である。
関連論文リスト
- SRAP-Agent: Simulating and Optimizing Scarce Resource Allocation Policy with LLM-based Agent [45.41401816514924]
本稿では,大規模言語モデル(LLM)を経済シミュレーションに統合する,革新的なフレームワークSRAP-Agentを提案する。
我々は、SRAP-Agentの有効性と有効性を検証するために、広範な政策シミュレーション実験を行う。
論文 参考訳(メタデータ) (2024-10-18T03:43:42Z) - Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [61.580419063416734]
最近の構造化学習手法のストリームは、様々な最適化問題に対する技術の実践的状態を改善している。
鍵となる考え方は、インスタンスを別々に扱うのではなく、インスタンス上の統計分布を利用することだ。
本稿では,最適化を容易にし,一般化誤差を改善するポリシを摂動することでリスクを円滑にする手法について検討する。
論文 参考訳(メタデータ) (2024-07-24T12:00:30Z) - Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文 参考訳(メタデータ) (2024-05-26T05:38:50Z) - Model-based Causal Bayesian Optimization [74.78486244786083]
乗算重み付き因果ベイズ最適化のための最初のアルゴリズム(CBO-MW)を提案する。
グラフ関連の量に自然に依存するCBO-MWに対する後悔の限界を導出する。
我々の実験は、共有モビリティシステムにおいて、ユーザの需要パターンを学習するためにCBO-MWをどのように使用できるかの現実的なデモを含む。
論文 参考訳(メタデータ) (2023-07-31T13:02:36Z) - Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using
Deep Deterministic Policy Gradient [0.7244731714427565]
ロックダウン、急激な予防接種プログラム、学校閉鎖、経済刺激は、肯定的または意図しない否定的な結果をもたらす可能性がある。
ラウンドトリップを通じて自動的に最適な介入をモデル化し決定するための現在の研究は、シミュレーション目標、スケール(数千人)、介入研究に適さないモデルタイプ、探索可能な介入戦略の数(離散対連続)によって制限されている。
我々は,大規模(100,000人)の疫学的エージェントに基づくシミュレーションに基づいて,DDPGに基づく政策最適化フレームワークを用いて,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-10T09:26:07Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Discrete Stochastic Optimization for Public Health Interventions with
Constraints [1.8275108630751844]
本稿では,2009年のH1N1と新型コロナウイルスのパンデミックについて,オープンソースのモンテカルロシミュレーションによってモデル化された疾患の拡散について述べる。
最適化の目的は、社会に最小限の経済損失をもたらすため、介入戦略の最良の組み合わせを決定することである。
論文 参考訳(メタデータ) (2022-06-27T21:21:25Z) - Building a Foundation for Data-Driven, Interpretable, and Robust Policy
Design using the AI Economist [67.08543240320756]
AIエコノミストフレームワークは,2段階強化学習とデータ駆動型シミュレーションを用いて,効果的な,柔軟な,解釈可能なポリシー設計を可能にする。
RLを用いて訓練されたログリニア政策は、過去の結果と比較して、公衆衛生と経済の両面から社会福祉を著しく改善することがわかった。
論文 参考訳(メタデータ) (2021-08-06T01:30:41Z) - Optimal Control Policies to Address the Pandemic Health-Economy Dilemma [2.5649050169091376]
非薬剤的介入(NPI)は、パンデミックを封じ込めるための効果的な手段である。
しかし、このような規制措置は一般的に経済に悪影響を及ぼす。
我々は、この健康経済ジレンマ(HED)の解決を支援するマクロレベルのアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-24T13:39:07Z) - Machine Learning-Powered Mitigation Policy Optimization in
Epidemiological Models [33.88734751290751]
疫学モデルに基づく最適な政策勧告を得るための新しいアプローチを提案する。
このようなルックアヘッド戦略は、指定された制約に順応する非自明なポリシーを推測する。
論文 参考訳(メタデータ) (2020-10-16T16:27:17Z) - EpidemiOptim: A Toolbox for the Optimization of Control Policies in
Epidemiological Models [12.748861129923348]
EpidemiOptimは、疫学と最適化の研究者間のコラボレーションを容易にするPythonツールボックスである。
これは疫学モデルとコスト関数を、最適化実践者が一般的に使用する標準インターフェースを介して最適化問題に変換する。
本稿では,エピデミオプティムを用いて,死傷率と経済不況の最適化の下で,ロックダウン制御を動的に行うための最適ポリシーを提案する。
論文 参考訳(メタデータ) (2020-10-09T09:25:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。