論文の概要: Decisions and Deployment: The Five-Year SAHELI Project (2020-2025) on Restless Multi-Armed Bandits for Improving Maternal and Child Health
- arxiv url: http://arxiv.org/abs/2604.07384v1
- Date: Wed, 08 Apr 2026 03:22:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.433834
- Title: Decisions and Deployment: The Five-Year SAHELI Project (2020-2025) on Restless Multi-Armed Bandits for Improving Maternal and Child Health
- Title(参考訳): 意思決定と展開:母子保健改善のためのレストレスマルチアーメッドバンドによる5年間のSAHELIプロジェクト(2020-2025)
- Authors: Shresth Verma, Arpan Dasgupta, Neha Madhiwalla, Aparna Taneja, Milind Tambe,
- Abstract要約: SAHELIプロジェクト(2020-2025)は、インドの母子保健プログラムで不足するリソースを割り当てるためにAIを使用している。
SAHELIシステムは、Restless Multi-Armed Bandit (RMAB) フレームワークを用いて、このシーケンシャルなリソース割り当て問題を解決する。
重要な方法論的革新は、従来の2段階の"予測と最適化"アプローチから、決定的焦点学習への移行である。
- 参考スコア(独自算出の注目度): 30.733903110193264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Maternal and child health is a critical concern around the world. In many global health programs disseminating preventive care and health information, limited healthcare worker resources prevent continuous, personalised engagement with vulnerable beneficiaries. In such scenarios, it becomes crucial to optimally schedule limited live-service resources to maximise long-term engagement. To address this fundamental challenge, the multi-year SAHELI project (2020-2025), in collaboration with partner NGO ARMMAN, leverages AI to allocate scarce resources in a maternal and child health program in India. The SAHELI system solves this sequential resource allocation problem using a Restless Multi-Armed Bandit (RMAB) framework. A key methodological innovation is the transition from a traditional Two-Stage "predict-then-optimize" approach to Decision-Focused Learning (DFL), which directly aligns the framework's learning method with the ultimate goal of maximizing beneficiary engagement. Empirical evaluation through large-scale randomized controlled trials demonstrates that the DFL policy reduced cumulative engagement drops by 31% relative to the current standard of care, significantly outperforming the Two-Stage model. Crucially, the studies also confirmed that this increased program engagement translates directly into statistically significant improvements in real-world health behaviors, notably the continued consumption of vital iron and calcium supplements by new mothers. Ultimately, the SAHELI project provides a scalable blueprint for applying sequential decision-making AI to optimize resource allocation in health programs.
- Abstract(参考訳): 母と子の健康は世界にとって重要な問題である。
予防医療や医療情報を広める多くのグローバルヘルスプログラムでは、限られた医療従事者資源は、脆弱な受益者との個人化された継続的なエンゲージメントを妨げている。
このようなシナリオでは、長期のエンゲージメントを最大化するために、限られたライブサービスリソースを最適にスケジュールすることが重要になります。
この根本的な課題に対処するため、パートナーのNGO ARMMANと共同で複数年にわたるSAHELIプロジェクト(2020-2025)は、インドの母子保健プログラムで不足するリソースを割り当てるためにAIを活用している。
SAHELIシステムは、Restless Multi-Armed Bandit (RMAB) フレームワークを用いて、このシーケンシャルなリソース割り当て問題を解決する。
重要な方法論的革新は、従来の2段階の「予測を最適化する」アプローチから、決定的焦点学習(DFL)への移行である。
大規模ランダム化比較試験による経験的評価は、DFLポリシーが現在のケア基準と比較して累積エンゲージメント低下を31%削減し、Two-Stageモデルを大幅に上回ったことを示している。
重要な点として、このプログラムのエンゲージメントの増加は、特に新しい母親が重要な鉄とカルシウムサプリメントを消費し続けることで、実際の健康行動の統計的に重要な改善をもたらすことも確認された。
最終的にSAHELIプロジェクトは、シーケンシャルな意思決定AIを適用して、健康プログラムのリソース割り当てを最適化するためのスケーラブルな青写真を提供する。
関連論文リスト
- IRL for Restless Multi-Armed Bandits with Applications in Maternal and Child Health [52.79219652923714]
本論文は,RMABに対する所望の報酬を学習するために,逆強化学習(IRL)を用いた最初の事例である。
本研究は,母子保健遠隔医療プログラムにおける改善された成果を示すものである。
論文 参考訳(メタデータ) (2024-12-11T15:28:04Z) - Optimizing Vital Sign Monitoring in Resource-Constrained Maternal Care: An RL-Based Restless Bandit Approach [31.228987526386558]
ワイヤレスのバイタルサインモニタリングデバイスは、継続的監視のための労働効率の高いソリューションを提供する。
本稿では,Restless Multi-Armed Bandit パラダイムの変種としてモデル化することで,この問題に対するアロケーションアルゴリズムを考案する。
シミュレーションでは、我々の手法が最高のベースラインを最大4ドルまで上回ります。
論文 参考訳(メタデータ) (2024-10-10T21:20:07Z) - Efficient Public Health Intervention Planning Using Decomposition-Based
Decision-Focused Learning [33.14258196945301]
介入計画の高速化のために、レスレスマルチアーマッドバンド(RMAB)の構造を利用する方法を示す。
私たちはインドのNGOであるARMMANの実際のデータを使って、我々のアプローチが最先端のアプローチよりも最大2桁高速であることを示す。
論文 参考訳(メタデータ) (2024-03-08T21:31:00Z) - A Decision-Language Model (DLM) for Dynamic Restless Multi-Armed Bandit Tasks in Public Health [29.894488663882328]
大規模言語モデル(LLM)は、ロボット制御とナビゲーションの領域にまたがる包括的な自動プランナーとして登場した。
本稿では,RMAB ポリシーを動的に微調整する RMAB のための決定言語モデル (DLM) を提案する。
論文 参考訳(メタデータ) (2024-02-22T18:58:27Z) - Deep Reinforcement Learning for Efficient and Fair Allocation of Health Care Resources [47.57108369791273]
医療資源の枯渇は、レーションの避けられない結果をもたらす可能性がある。
医療資源割り当てプロトコルの普遍的な標準は存在しない。
本稿では,患者の疾患進行と患者間の相互作用効果を統合するためのトランスフォーマーベースのディープQネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-15T17:28:06Z) - Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care [46.2482873419289]
我々は、より信頼性の高いクリティカルケアポリシーを得るための深いQ-ラーニングアプローチを導入する。
本手法を,集中治療室のシミュレーション環境と実際の健康記録を用いて,オフライン・オフ・セッティングで評価した。
論文 参考訳(メタデータ) (2023-06-13T18:02:57Z) - Field Study in Deploying Restless Multi-Armed Bandits: Assisting
Non-Profits in Improving Maternal and Child Health [28.43878945119807]
携帯電話は、非営利団体が彼らの受益者に重要な健康情報をタイムリーに届けることを可能にする。
このような情報提供プログラムにおける重要な課題は、かなりの数の受益者がプログラムから離脱することである。
そこで我々は,NPOが受益者とのライブ対話を実現するためのレストレスマルチアーメッド・バンディットシステムを開発した。
論文 参考訳(メタデータ) (2021-09-16T16:04:48Z) - Contingency-Aware Influence Maximization: A Reinforcement Learning
Approach [52.109536198330126]
インフルエンス(IM)問題は、インフルエンスの普及を最大化する、ソーシャルネットワーク内のシードノードのサブセットを見つけることを目的としている。
本研究では、招待されたノードがシードであるかどうかが不確実なIM問題(contingency-aware IM)に焦点をあてる。
最初の成功にもかかわらず、より多くのコミュニティへのソリューションの推進における大きな実践上の障害は、欲張りのアルゴリズムの巨大な実行時である。
論文 参考訳(メタデータ) (2021-06-13T16:42:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。