論文の概要: Learning Fair Policies for Infectious Diseases Mitigation using Path Integral Control
- arxiv url: http://arxiv.org/abs/2502.09831v1
- Date: Fri, 14 Feb 2025 00:08:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-17 18:06:36.926581
- Title: Learning Fair Policies for Infectious Diseases Mitigation using Path Integral Control
- Title(参考訳): 経路積分制御を用いた感染症軽減のための公正な政策の学習
- Authors: Zhuangzhuang Jia, Hyuk Park, Gökçe Dayanıklı, Grani A. Hanasusanto,
- Abstract要約: 感染症は社会に大きな公衆衛生上の問題を引き起こす。
本研究では,不確実性のある意思決定のための枠組みを提案し,公平性に配慮した病害軽減政策を策定する。
- 参考スコア(独自算出の注目度): 0.4583163610461423
- License:
- Abstract: Infectious diseases pose major public health challenges to society, highlighting the importance of designing effective policies to reduce economic loss and mortality. In this paper, we propose a framework for sequential decision-making under uncertainty to design fairness-aware disease mitigation policies that incorporate various measures of unfairness. Specifically, our approach learns equitable vaccination and lockdown strategies based on a stochastic multi-group SIR model. To address the challenges of solving the resulting sequential decision-making problem, we adopt the path integral control algorithm as an efficient solution scheme. Through a case study, we demonstrate that our approach effectively improves fairness compared to conventional methods and provides valuable insights for policymakers.
- Abstract(参考訳): 感染症は社会に大きな公衆衛生上の課題をもたらし、経済的損失と死亡率を減らすための効果的な政策を設計することの重要性を強調している。
本稿では,不確実性を考慮した意思決定のための枠組みを提案する。
具体的には,確率的マルチグループSIRモデルに基づく予防接種とロックダウン戦略について考察する。
逐次決定問題の解決の課題に対処するために,経路積分制御アルゴリズムを効率的な解法として採用する。
ケーススタディを通じて,本手法が従来の手法に比べて公平性を効果的に向上し,政策立案者に価値ある洞察を与えることを示す。
関連論文リスト
- Including frameworks of public health ethics in computational modelling of infectious disease interventions [36.437757915645385]
倫理的意思決定において重要なものとして認識される多くの値は、計算モデルから欠落している。
本研究では,SARS-CoV-2などの病原体に対するワクチン接種のための簡易な計算モデルの評価に,複数の公衆衛生値を統合するための概念実証アプローチを示す。
論文 参考訳(メタデータ) (2025-01-31T04:22:25Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Stochastic Methods for AUC Optimization subject to AUC-based Fairness
Constraints [51.12047280149546]
公正な予測モデルを得るための直接的なアプローチは、公正な制約の下で予測性能を最適化することでモデルを訓練することである。
フェアネスを考慮した機械学習モデルのトレーニング問題を,AUCに基づくフェアネス制約のクラスを対象とする最適化問題として定式化する。
フェアネス測定値の異なる実世界のデータに対するアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-12-23T22:29:08Z) - Reinforcement Learning with Stepwise Fairness Constraints [50.538878453547966]
本稿では,段階的公正性制約を伴う強化学習について紹介する。
我々は、ポリシーの最適性と公正性違反に関して、強力な理論的保証を持つ学習アルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-11-08T04:06:23Z) - Policy Optimization with Advantage Regularization for Long-Term Fairness
in Decision Systems [14.095401339355677]
長期的な公正性は,学習に基づく意思決定システムの設計と展開において重要な要素である。
近年の研究では,マルコフ決定プロセス(MDP)を用いて意思決定を長期的公正性要件で定式化する手法が提案されている。
深層強化学習による政策最適化手法は、より厳密な意思決定ポリシーを見つけるのに有効であることを示す。
論文 参考訳(メタデータ) (2022-10-22T20:41:36Z) - Exploring the Pareto front of multi-objective COVID-19 mitigation
policies using reinforcement learning [1.7056617973440933]
感染症の発生は公衆衛生や社会プロセスに破壊的な影響を及ぼす可能性がある。
現在の研究は、病原体の攻撃率のような単一の目的でポリシーを最適化することに焦点を当てている。
深層多目的強化学習を適用し,最先端のアルゴリズムを用いて解の集合を学習する。
論文 参考訳(メタデータ) (2022-04-11T11:55:06Z) - Off-Policy Imitation Learning from Observations [78.30794935265425]
観察からの学習(lfo)は、多くのアプリケーションが利用できる実用的な強化学習シナリオである。
オフポリシ最適化を原則的に実現するサンプル効率の高いLfOアプローチを提案する。
我々のアプローチは、サンプル効率と性能の両面で最先端のロコモーションに匹敵する。
論文 参考訳(メタデータ) (2021-02-25T21:33:47Z) - Reliable Off-policy Evaluation for Reinforcement Learning [53.486680020852724]
シーケンシャルな意思決定問題において、非政治評価は、目標政策の期待累積報酬を推定する。
本稿では、1つまたは複数のログデータを用いて、ロバストで楽観的な累積報酬推定を提供する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-08T23:16:19Z) - Machine Learning-Powered Mitigation Policy Optimization in
Epidemiological Models [33.88734751290751]
疫学モデルに基づく最適な政策勧告を得るための新しいアプローチを提案する。
このようなルックアヘッド戦略は、指定された制約に順応する非自明なポリシーを推測する。
論文 参考訳(メタデータ) (2020-10-16T16:27:17Z) - Multi-Objective Model-based Reinforcement Learning for Infectious
Disease Control [19.022696762983017]
新型コロナウイルス(COVID-19)などの重症感染症が公衆衛生に大きな脅威をもたらす。
学校閉鎖や自宅待機命令などの厳格な規制措置は大きな効果がある一方で、経済的損失も大きい。
本稿では,データ駆動型意思決定の促進と長期的コストの最小化を目的とした多目的モデルに基づく強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-09T23:55:27Z) - Adaptive Estimator Selection for Off-Policy Evaluation [48.66170976187225]
オフポリシー評価設定における推定器選択のための汎用的データ駆動手法を開発した。
また,本手法の性能保証を確立し,オラクル推定器と競合することを示す。
論文 参考訳(メタデータ) (2020-02-18T16:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。