論文の概要: A Microscopic Pandemic Simulator for Pandemic Prediction Using Scalable
Million-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2108.06589v1
- Date: Sat, 14 Aug 2021 17:07:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-18 07:44:22.342937
- Title: A Microscopic Pandemic Simulator for Pandemic Prediction Using Scalable
Million-Agent Reinforcement Learning
- Title(参考訳): スケーラブルな百万エージェント強化学習によるパンデミック予測のための微視的パンデミックシミュレータ
- Authors: Zhenggang Tang, Kai Yan, Liting Sun, Wei Zhan, Changliu Liu
- Abstract要約: 本稿では, 深部強化学習型顕微鏡モデルであるMicroscopic Pandemic Simulator (MPS)を提案する。
ルールベースのエージェントを、報酬を最大化するために行動が促される合理的エージェントに置き換えることによって、MPSは現実世界のダイナミクスをよりよく近似する。
本稿ではまず,米国アレゲニーにおける実世界のデータに対してMPSを校正し,情報開示と隔離という2つの政府の戦略を実証的に評価する。
- 参考スコア(独自算出の注目度): 7.653466578233261
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Microscopic epidemic models are powerful tools for government policy makers
to predict and simulate epidemic outbreaks, which can capture the impact of
individual behaviors on the macroscopic phenomenon. However, existing models
only consider simple rule-based individual behaviors, limiting their
applicability. This paper proposes a deep-reinforcement-learning-powered
microscopic model named Microscopic Pandemic Simulator (MPS). By replacing
rule-based agents with rational agents whose behaviors are driven to maximize
rewards, the MPS provides a better approximation of real world dynamics. To
efficiently simulate with massive amounts of agents in MPS, we propose Scalable
Million-Agent DQN (SMADQN). The MPS allows us to efficiently evaluate the
impact of different government strategies. This paper first calibrates the MPS
against real-world data in Allegheny, US, then demonstratively evaluates two
government strategies: information disclosure and quarantine. The results
validate the effectiveness of the proposed method. As a broad impact, this
paper provides novel insights for the application of DRL in large scale
agent-based networks such as economic and social networks.
- Abstract(参考訳): 微視的流行モデルは、政府の政策立案者が疫病の発生を予測しシミュレーションするための強力なツールであり、個々の行動がマクロ現象に与える影響を捉えることができる。
しかし、既存のモデルは単純なルールベースの個々の振る舞いのみを考慮し、適用性を制限する。
本稿では, 深部強化学習型顕微鏡モデルであるMicroscopic Pandemic Simulator (MPS)を提案する。
ルールベースのエージェントを報酬を最大化するために行動が駆動される合理的エージェントに置き換えることで、mpsは現実世界のダイナミクスをよりよく近似する。
本稿では,MPSにおける大量のエージェントを効率的にシミュレートするため,SMADQN(Scalable Million-Agent DQN)を提案する。
MPSは、異なる政府の戦略の影響を効率的に評価することを可能にする。
本稿ではまず,米国アレゲニーにおける実世界のデータに対してMPSを校正し,情報開示と隔離という2つの政府の戦略を実証的に評価する。
その結果,提案手法の有効性が検証された。
本稿では,経済・ソーシャルネットワークなどの大規模エージェントベースネットワークにおけるDRLの適用について,新たな知見を提供する。
関連論文リスト
- Self-Healing Machine Learning: A Framework for Autonomous Adaptation in Real-World Environments [50.310636905746975]
実世界の機械学習システムは、基礎となるデータ生成プロセスの分散シフトによって、モデルの性能劣化に遭遇することが多い。
概念のドリフト適応のような既存のシフトへのアプローチは、その理性に依存しない性質によって制限される。
我々はこれらの制限を克服するために自己修復機械学習(SHML)を提案する。
論文 参考訳(メタデータ) (2024-10-31T20:05:51Z) - Modeling and Optimization of Epidemiological Control Policies Through
Reinforcement Learning [0.0]
パンデミックの影響は、特定の制限をコミュニティに課すことによって最小化することができる。
感染と死亡率を最小限に抑える一方で、これらの制限は経済的危機につながる可能性がある。
我々は、報酬関数に基づくパンデミックシミュレーションに最適な制限を強制するために、強化学習エージェントを訓練する。
論文 参考訳(メタデータ) (2024-01-25T22:39:39Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Agent-Based Model: Simulating a Virus Expansion Based on the Acceptance
of Containment Measures [65.62256987706128]
比較疫学モデルは、疾患の状態に基づいて個人を分類する。
我々は、適応されたSEIRDモデルと市民のための意思決定モデルを組み合わせたABMアーキテクチャを提案する。
スペイン・ア・コルナにおけるSARS-CoV-2感染症の進行状況について検討した。
論文 参考訳(メタデータ) (2023-07-28T08:01:05Z) - Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using
Deep Deterministic Policy Gradient [0.7244731714427565]
ロックダウン、急激な予防接種プログラム、学校閉鎖、経済刺激は、肯定的または意図しない否定的な結果をもたらす可能性がある。
ラウンドトリップを通じて自動的に最適な介入をモデル化し決定するための現在の研究は、シミュレーション目標、スケール(数千人)、介入研究に適さないモデルタイプ、探索可能な介入戦略の数(離散対連続)によって制限されている。
我々は,大規模(100,000人)の疫学的エージェントに基づくシミュレーションに基づいて,DDPGに基づく政策最適化フレームワークを用いて,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-10T09:26:07Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - ERMAS: Becoming Robust to Reward Function Sim-to-Real Gaps in
Multi-Agent Simulations [110.72725220033983]
Epsilon-Robust Multi-Agent Simulation (ERMAS)は、このようなマルチエージェントのsim-to-realギャップに対して堅牢なAIポリシーを学ぶためのフレームワークである。
ERMASは、エージェントリスク回避の変化に対して堅牢な税政策を学び、複雑な時間シミュレーションで最大15%社会福祉を改善する。
特に、ERMASは、エージェントリスク回避の変化に対して堅牢な税制政策を学び、複雑な時間シミュレーションにおいて、社会福祉を最大15%改善する。
論文 参考訳(メタデータ) (2021-06-10T04:32:20Z) - Pyfectious: An individual-level simulator to discover optimal
containment polices for epidemic diseases [16.28189705178286]
本研究では、集団構造をモデル化し、疾患の伝播を個人レベルで制御できるシミュレータを提案する。
潜在的な応用を示すため、シミュレーターパラメータは新型コロナウイルスのパンデミックの正式な統計に基づいて設定される。
このシミュレーターは、パンデミックを制御するための最適なポリシーを見つけるために強化学習問題の環境として使用される。
論文 参考訳(メタデータ) (2021-03-24T10:54:46Z) - Reinforcement Learning for Optimization of COVID-19 Mitigation policies [29.4529156655747]
2020年は新型コロナウイルスの感染拡大が世界最悪の世界的なパンデミックの1つとなった。
世界中の政府は公衆衛生を保護し、経済を最大限に維持するという課題に直面している。
疫学モデルは、これらの病気の拡散に関する洞察を与え、介入政策の効果を予測する。
論文 参考訳(メタデータ) (2020-10-20T18:40:15Z) - Data-driven Simulation and Optimization for Covid-19 Exit Strategies [16.31545249131776]
コロナウイルスSARS-2の急速な普及は、世界中のほぼ全ての政府が悲劇に対応するために徹底的な対策を講じる大きな課題である。
我々は,疫学パラメータの深層学習推定を組み合わせたパンデミックシミュレーションと予測ツールキットを構築した。
論文 参考訳(メタデータ) (2020-06-12T11:18:25Z) - A Deep Q-learning/genetic Algorithms Based Novel Methodology For
Optimizing Covid-19 Pandemic Government Actions [63.669642197519934]
我々はSEIR疫学モデルを用いて、人口の時間とともにウイルスウイルスの進化を表現している。
報酬システムにより、アクションのシーケンス(統合、自己同化、二メートル距離、制限を取らない)を評価する。
どちらの意味でも、パンデミックの悪影響を抑えるために政府が取るべき行動を発見する上で、我々の方法論が有効な手段であることを実証する。
論文 参考訳(メタデータ) (2020-05-15T17:17:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。