論文の概要: Neetyabhas: A Framework for Uncertainty-Aware Public Policy Optimization in Rational Agent-Based Models
- arxiv url: http://arxiv.org/abs/2606.04562v1
- Date: Wed, 03 Jun 2026 07:51:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.615489
- Title: Neetyabhas: A Framework for Uncertainty-Aware Public Policy Optimization in Rational Agent-Based Models
- Title(参考訳): Neetyabhas: 合理的エージェントベースモデルにおける不確実性を意識した公共政策最適化フレームワーク
- Authors: Janani Venugopalan, Gaurav Deshkar, Rishabh Gaur, Harshal Hayatnagarkar, Jayanta Kshirsagar,
- Abstract要約: 既存の研究はしばしば個人の行動を無視し、完全な感染追跡と欠陥のない政策実行を誤って想定している。
本稿では,疫病対策(感染・病院化)と政策実施の両面での不確実性を考慮した統合的アプローチを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Purpose The WHO's COVID-19 non-pharmaceutical interventions (e.g., lockdowns, vaccinations) effectively curb transmission but impose heavy economic strains. Existing research often neglects individual behaviors and falsely assumes perfect infection tracking and flawless policy execution, failing to account for real-world uncertainties and errors. Methods We propose an integrative approach incorporating uncertainties in both epidemic measurement (infections/hospitalizations) and policy implementation. We built a simulation model of 1,000 individuals making real-time choices regarding mask-wearing, vaccination, and shopping. Concurrently, policymakers deploy interventions (lockdowns, mandates) based on health and economic observations. This framework is driven by hierarchical reinforcement learning agents, utilizing deep Q-networks alongside uncertainty-aware policy gradient variants (DDPG and TD3). Results The simulations effectively managed the epidemic's progression. Masking and vaccinations proved highly effective, significantly reducing both the outbreak's peak height and duration. By integrating individual behaviors, policy uncertainties, and multifaceted interventions, our dynamic control approach successfully mitigated the epidemic's impact. Conclusions Our model overcomes previous research limitations by embedding uncertainty and human behavior into public health policy frameworks. The simulation demonstrates that accounting for individual choices and imperfect data is crucial for designing effective interventions during complex pandemics, with masks and vaccines serving as pivotal tools.
- Abstract(参考訳): WHOの非薬剤的介入(例えば、ロックダウン、ワクチン接種)は、感染を効果的に抑制するが、経済的な緊張を強いる。
既存の研究は、個々の行動を無視し、完全な感染追跡と欠陥のない政策実行を誤って仮定し、実際の不確実性やエラーを説明できない。
方法 疫病測定(感染・病院化)と政策実施の両面での不確実性を考慮した統合的アプローチを提案する。
マスク着用,予防接種,ショッピングに関して,1,000人の個人がリアルタイムに選択できるシミュレーションモデルを構築した。
同時に、政策立案者は、健康と経済の観察に基づいて介入(ロックダウン、委任)を展開する。
このフレームワークは階層的な強化学習エージェントによって駆動され、不確実性を認識したポリシー勾配変種(DDPG、TD3)と共に深いQ-ネットワークを利用する。
結果 シミュレーションは疫病の進行を効果的に制御した。
マスキングとワクチン接種は効果が高く、流行のピークの高さと期間を著しく減らした。
個別の行動、政策の不確実性、多面的介入を統合することで、我々の動的制御アプローチは疫病の影響を緩和した。
結論 我々のモデルは、不確実性と人間の振る舞いを公衆衛生政策の枠組みに組み込むことによって、これまでの研究の限界を克服する。
このシミュレーションは、複雑なパンデミックの間、マスクやワクチンが重要なツールとして機能し、効果的な介入を設計するために、個々の選択と不完全なデータを説明することが重要であることを実証している。
関連論文リスト
- From Static Risk to Dynamic Trajectories: Toward World-Model-Inspired Clinical Prediction [61.12883122613684]
本稿では, 患者固有の縦断疾患の進展を推定し, 代替治療下での軌跡変化を評価するための, 臨床AIにおける介入認識型疾患軌跡モデリングに焦点をあてる。
3つの意思決定タスク(実測,反実推定,政策評価)と3つのデータ生成機構(障害発生, 治療課題, 観察過程)によって, 識別可能性を決定する。
本稿では,個別/連続時間にまたがる予測,反ファクト的軌跡,政策評価の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2026-05-16T10:45:26Z) - Learning Pareto-Optimal Pandemic Intervention Policies with MORL [1.160208922584163]
本研究では,疾患拡散防止戦略をモデル化し,評価するための枠組みを開発する。
シミュレーションでは,全国規模のパンデミックのダイナミクスを再現し,他のモデルよりも桁違いに忠実に再現する。
この研究は、公衆衛生危機を緩和するための透明で証拠に基づく政策決定を支援する。
論文 参考訳(メタデータ) (2025-10-02T12:06:29Z) - Agent-Based Model: Simulating a Virus Expansion Based on the Acceptance
of Containment Measures [65.62256987706128]
比較疫学モデルは、疾患の状態に基づいて個人を分類する。
我々は、適応されたSEIRDモデルと市民のための意思決定モデルを組み合わせたABMアーキテクチャを提案する。
スペイン・ア・コルナにおけるSARS-CoV-2感染症の進行状況について検討した。
論文 参考訳(メタデータ) (2023-07-28T08:01:05Z) - Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using
Deep Deterministic Policy Gradient [0.7244731714427565]
ロックダウン、急激な予防接種プログラム、学校閉鎖、経済刺激は、肯定的または意図しない否定的な結果をもたらす可能性がある。
ラウンドトリップを通じて自動的に最適な介入をモデル化し決定するための現在の研究は、シミュレーション目標、スケール(数千人)、介入研究に適さないモデルタイプ、探索可能な介入戦略の数(離散対連続)によって制限されている。
我々は,大規模(100,000人)の疫学的エージェントに基づくシミュレーションに基づいて,DDPGに基づく政策最適化フレームワークを用いて,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-10T09:26:07Z) - Policy Optimization for Personalized Interventions in Behavioral Health [8.10897203067601]
デジタルプラットフォームを通じて提供される行動的健康介入は、健康結果を大幅に改善する可能性がある。
患者に対するパーソナライズされた介入を最適化して長期的効果を最大化する問題について検討した。
患者システムの状態空間を個別のレベルに分解するDecompPIをダブする新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-21T21:42:03Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top exploration [39.47724912690087]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
我々は,個別モデルSTRIDEを用いてベルギーのCOVID-19流行を考察し,感染数や入院回数を最小限に抑える予防接種方針のセットを学習した。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Data-Centric Epidemic Forecasting: A Survey [56.99209141838794]
この調査は、様々なデータ駆動の方法論および実践的進歩を掘り下げるものである。
疫学的なデータセットと,流行予測に関連する新しいデータストリームを列挙する。
また,これらの予測システムの現実的な展開において生じる経験や課題についても論じる。
論文 参考訳(メタデータ) (2022-07-19T16:15:11Z) - Machine Learning-Powered Mitigation Policy Optimization in
Epidemiological Models [33.88734751290751]
疫学モデルに基づく最適な政策勧告を得るための新しいアプローチを提案する。
このようなルックアヘッド戦略は、指定された制約に順応する非自明なポリシーを推測する。
論文 参考訳(メタデータ) (2020-10-16T16:27:17Z) - Epidemic mitigation by statistical inference from contact tracing data [61.04165571425021]
我々は,個人が感染するリスクを推定するためにベイズ推定法を開発した。
本稿では,感染防止のための検査・隔離戦略を最適化するために,確率論的リスク推定手法を提案する。
我々のアプローチは、最近接触した個人間の通信のみを必要とする、完全に分散されたアルゴリズムに変換されます。
論文 参考訳(メタデータ) (2020-09-20T12:24:45Z) - Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control [19.022696762983017]
新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
本稿では,データ駆動型意思決定の促進と長期的コストの最小化を目的とした多目的モデルに基づく強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-09T23:55:27Z) - A Deep Q-learning/genetic Algorithms Based Novel Methodology For
Optimizing Covid-19 Pandemic Government Actions [63.669642197519934]
我々はSEIR疫学モデルを用いて、人口の時間とともにウイルスウイルスの進化を表現している。
報酬システムにより、アクションのシーケンス(統合、自己同化、二メートル距離、制限を取らない)を評価する。
どちらの意味でも、パンデミックの悪影響を抑えるために政府が取るべき行動を発見する上で、我々の方法論が有効な手段であることを実証する。
論文 参考訳(メタデータ) (2020-05-15T17:17:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。