論文の概要: H2-MARL: Multi-Agent Reinforcement Learning for Pareto Optimality in Hospital Capacity Strain and Human Mobility during Epidemic
- arxiv url: http://arxiv.org/abs/2503.10907v1
- Date: Thu, 13 Mar 2025 21:40:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-17 13:04:48.442338
- Title: H2-MARL: Multi-Agent Reinforcement Learning for Pareto Optimality in Hospital Capacity Strain and Human Mobility during Epidemic
- Title(参考訳): H2-MARL:てんかん時の病院容量と人体移動性におけるパレート最適性のためのマルチエージェント強化学習
- Authors: Xueting Luo, Hao Deng, Jihong Yang, Yao Shen, Huanhuan Guo, Zhiyuan Sun, Mingqing Liu, Jiming Wei, Shengjie Zhao,
- Abstract要約: 我々は,病状伝達をシミュレートするオンライン更新可能なパラメータを用いたタウンシップレベルの感染モデルを構築した。
我々は、様々な規模の4つの代表都市から10億以上の記録を含むタウンシップレベルの人体移動データセットを構築した。
H2-MARLは最適な二重目的トレードオフ能力を有しており、ヒトの移動制限損失を最小限に抑えつつ、病院の容量を最小化することができる。
- 参考スコア(独自算出の注目度): 10.359719487924108
- License:
- Abstract: The necessity of achieving an effective balance between minimizing the losses associated with restricting human mobility and ensuring hospital capacity has gained significant attention in the aftermath of COVID-19. Reinforcement learning (RL)-based strategies for human mobility management have recently advanced in addressing the dynamic evolution of cities and epidemics; however, they still face challenges in achieving coordinated control at the township level and adapting to cities of varying scales. To address the above issues, we propose a multi-agent RL approach that achieves Pareto optimality in managing hospital capacity and human mobility (H2-MARL), applicable across cities of different scales. We first develop a township-level infection model with online-updatable parameters to simulate disease transmission and construct a city-wide dynamic spatiotemporal epidemic simulator. On this basis, H2-MARL is designed to treat each division as an agent, with a trade-off dual-objective reward function formulated and an experience replay buffer enriched with expert knowledge built. To evaluate the effectiveness of the model, we construct a township-level human mobility dataset containing over one billion records from four representative cities of varying scales. Extensive experiments demonstrate that H2-MARL has the optimal dual-objective trade-off capability, which can minimize hospital capacity strain while minimizing human mobility restriction loss. Meanwhile, the applicability of the proposed model to epidemic control in cities of varying scales is verified, which showcases its feasibility and versatility in practical applications.
- Abstract(参考訳): 人体移動の制限に伴う損失の最小化と病院の容量確保の両立を両立させる必要性が、新型コロナウイルスの余波で大きな注目を集めている。
強化学習(Reinforcement Learning, RL)に基づく人的移動管理戦略は近年, 都市や流行のダイナミックな進化に対処するために進歩しているが, タウンシップレベルで協調的な管理を達成し, 様々な規模の都市に適応する上で, 課題に直面している。
以上の課題に対処するため,病院容量と人体移動性(H2-MARL)を管理する上で,Paretoの最適性を実現するマルチエージェントRL手法を提案する。
まず,病状伝播をシミュレートするオンライン更新可能なパラメータを用いたタウンシップレベルの感染モデルを構築し,都市全体の動的時空間流行シミュレータを構築した。
この理由から,H2-MARLは各部門をエージェントとして扱うように設計され,トレードオフ二重目的報酬関数を定式化し,知識の豊富な経験リプレイバッファを構築できる。
モデルの有効性を評価するため、様々な規模の4つの代表都市から10億以上の記録を含むタウンシップレベルの人体移動データセットを構築した。
H2-MARLは最適な二重目的トレードオフ能力を有しており、ヒトの移動制限損失を最小限に抑えつつ、病院の容量を最小化することができる。
一方, 様々な規模の都市における疫病対策へのモデルの適用性を検証し, 実用化におけるその実現可能性と汎用性を示す。
関連論文リスト
- Collaborative Imputation of Urban Time Series through Cross-city Meta-learning [54.438991949772145]
メタ学習型暗黙的ニューラル表現(INR)を利用した新しい協調的計算パラダイムを提案する。
次に,モデルに依存しないメタ学習による都市間協調学習手法を提案する。
20のグローバル都市から得られた多様な都市データセットの実験は、我々のモデルの優れた計算性能と一般化可能性を示している。
論文 参考訳(メタデータ) (2025-01-20T07:12:40Z) - ST-MoE-BERT: A Spatial-Temporal Mixture-of-Experts Framework for Long-Term Cross-City Mobility Prediction [6.0588503913405045]
我々はST-MoE-BERTと呼ばれる人間の移動パターンを予測する頑健な手法を提案する。
本手法は,Mixture-of-ExpertsアーキテクチャとBERTモデルを統合し,複雑な移動力学を捉える。
本稿では,GEO-BLEUおよびDTWにおける提案手法の有効性について述べる。
論文 参考訳(メタデータ) (2024-10-18T00:32:18Z) - COLA: Cross-city Mobility Transformer for Human Trajectory Simulation [44.157114416533915]
モデル非依存転送フレームワークを用いた都市間mObiLity trAnsformer (COLA) を開発した。
COLAはトランスフォーマーを、都市固有の特性のためのプライベートモジュールと、都市・ユニバーサルモビリティパターンのための共有モジュールに分割する。
実装された都市間ベースラインは,その優位性と有効性を示している。
論文 参考訳(メタデータ) (2024-03-04T07:45:29Z) - Agent-Based Model: Simulating a Virus Expansion Based on the Acceptance
of Containment Measures [65.62256987706128]
比較疫学モデルは、疾患の状態に基づいて個人を分類する。
我々は、適応されたSEIRDモデルと市民のための意思決定モデルを組み合わせたABMアーキテクチャを提案する。
スペイン・ア・コルナにおけるSARS-CoV-2感染症の進行状況について検討した。
論文 参考訳(メタデータ) (2023-07-28T08:01:05Z) - STORM-GAN: Spatio-Temporal Meta-GAN for Cross-City Estimation of Human
Mobility Responses to COVID-19 [17.611056163940404]
我々は, 都市間移動度推定問題に, 深層メタジェネレーション・フレームワークを用いて取り組む試みを初めて行った。
S-Temporal Meta-Generative Adrial Network (STORM-GAN) モデルを提案する。
提案手法は推定性能を大幅に向上し,性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-20T15:55:41Z) - Continuous Trajectory Generation Based on Two-Stage GAN [50.55181727145379]
本稿では,道路網上の連続軌道を生成するために,新たな2段階生成対向フレームワークを提案する。
具体的には、A*アルゴリズムの人間の移動性仮説に基づいてジェネレータを構築し、人間の移動性について学習する。
判別器では, 逐次報酬と移動ヤウ報酬を組み合わせることで, 発電機の有効性を高める。
論文 参考訳(メタデータ) (2023-01-16T09:54:02Z) - Safety-compliant Generative Adversarial Networks for Human Trajectory
Forecasting [95.82600221180415]
群衆における人間予測は、社会的相互作用をモデル化し、衝突のないマルチモーダル分布を出力するという課題を提示する。
SGANv2は、動き時間相互作用モデリングと変圧器に基づく識別器設計を備えた安全に配慮したSGANアーキテクチャである。
論文 参考訳(メタデータ) (2022-09-25T15:18:56Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Policy-Aware Mobility Model Explains the Growth of COVID-19 in Cities [36.94575237918065]
新型コロナウイルスの感染拡大を遅らせるためには、非医薬品の介入を考慮する必要がある。
都市内モビリティと政策導入を新しいメタポピュレーションSEIRモデルに組み込むことで、米国の都市における複雑なCOVID-19成長パターンを正確に予測できることを示す。
論文 参考訳(メタデータ) (2021-02-21T07:39:17Z) - Reinforced Contact Tracing and Epidemic Intervention [8.141401074784406]
我々は,スマートディファレンスコントロール戦略を探索するIDRLECA(Reinforcement Learning Epidemic Control Agent)を開発した。
IDRLECAは感染を非常に低いレベルで抑制し、95%以上の人体移動を維持できる。
論文 参考訳(メタデータ) (2021-02-04T08:31:48Z) - Reinforced Epidemic Control: Saving Both Lives and Economy [14.008719195238774]
個人データを必要としない生活・経済ジレンマに対する解決策を提案する。
地域間移動を動的に制御することで、疫病の伝染を抑制することで、民間データ要求を回避します。
我々は,移動制御ポリシーを探索するためのDURLECA (Dual-Objective Reinforcement-Learning Epidemic Control Agent) を開発した。
論文 参考訳(メタデータ) (2020-08-04T00:44:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。