論文の概要: Learn to Intervene: An Adaptive Learning Policy for Restless Bandits in
Application to Preventive Healthcare
- arxiv url: http://arxiv.org/abs/2105.07965v1
- Date: Mon, 17 May 2021 15:44:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 19:03:44.655660
- Title: Learn to Intervene: An Adaptive Learning Policy for Restless Bandits in
Application to Preventive Healthcare
- Title(参考訳): 介入を学ぶ:予防医療への応用におけるレストバンドの適応的学習政策
- Authors: Arpita Biswas, Gaurav Aggarwal, Pradeep Varakantham, Milind Tambe
- Abstract要約: レストレスマルチアームバンディット(RMAB)問題に対するWhittle IndexベースのQ-Learningメカニズムを提案する。
本手法は,複数のベンチマークを用いたRMABの既存の学習方法と,母体保健データセットを改良する。
- 参考スコア(独自算出の注目度): 39.41918282603752
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many public health settings, it is important for patients to adhere to
health programs, such as taking medications and periodic health checks.
Unfortunately, beneficiaries may gradually disengage from such programs, which
is detrimental to their health. A concrete example of gradual disengagement has
been observed by an organization that carries out a free automated call-based
program for spreading preventive care information among pregnant women. Many
women stop picking up calls after being enrolled for a few months. To avoid
such disengagements, it is important to provide timely interventions. Such
interventions are often expensive and can be provided to only a small fraction
of the beneficiaries. We model this scenario as a restless multi-armed bandit
(RMAB) problem, where each beneficiary is assumed to transition from one state
to another depending on the intervention. Moreover, since the transition
probabilities are unknown a priori, we propose a Whittle index based Q-Learning
mechanism and show that it converges to the optimal solution. Our method
improves over existing learning-based methods for RMABs on multiple benchmarks
from literature and also on the maternal healthcare dataset.
- Abstract(参考訳): 多くの公衆衛生設定において、患者は薬の服用や定期的な健康チェックなどの健康プログラムを遵守することが重要である。
残念ながら、受益者はそうしたプログラムから徐々に切り離される可能性がある。
妊婦に予防ケア情報を広める無料の自動コールベースプログラムを実施する組織によって、段階的な離脱の具体例が観察されている。
多くの女性は、数ヶ月登録した後、電話を取るのをやめます。
このような離脱を避けるためには、タイムリーな介入を行うことが重要である。
このような介入は、しばしば高価であり、受益者のごく一部にしか提供できない。
我々は、このシナリオを、各受益者が介入に応じてある状態から別の状態へ遷移する、レスレスマルチアーム・バンディット(RMAB)問題としてモデル化する。
さらに, 遷移確率は前もって未知であるため, ホイットル指数に基づくq学習機構を提案し, 最適解に収束することを示す。
本手法は,複数のベンチマークを用いたRMABの既存の学習方法と,母体保健データセットを改良する。
関連論文リスト
- Optimizing Vital Sign Monitoring in Resource-Constrained Maternal Care: An RL-Based Restless Bandit Approach [31.228987526386558]
ワイヤレスのバイタルサインモニタリングデバイスは、継続的監視のための労働効率の高いソリューションを提供する。
本稿では,Restless Multi-Armed Bandit パラダイムの変種としてモデル化することで,この問題に対するアロケーションアルゴリズムを考案する。
シミュレーションでは、我々の手法が最高のベースラインを最大4ドルまで上回ります。
論文 参考訳(メタデータ) (2024-10-10T21:20:07Z) - Improving Health Information Access in the World's Largest Maternal Mobile Health Program via Bandit Algorithms [24.4450506603579]
本論文は,母子保健における世界最大級のmHealthプログラムであるKilkariに焦点を当てる。
本稿では,自動ドロップアウトの削減とプログラムへのエンゲージメント向上を目的としたCHAHAKシステムを提案する。
論文 参考訳(メタデータ) (2024-05-14T07:21:49Z) - Deep Reinforcement Learning for Efficient and Fair Allocation of Health Care Resources [47.57108369791273]
医療資源の枯渇は、レーションの避けられない結果をもたらす可能性がある。
医療資源割り当てプロトコルの普遍的な標準は存在しない。
本稿では,患者の疾患進行と患者間の相互作用効果を統合するためのトランスフォーマーベースのディープQネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-15T17:28:06Z) - Multi-Label Quantification [78.83284164605473]
定量化とは、教師なしデータサンプルにおいて、興味あるクラスの相対周波数の予測子を生成する教師付き学習課題である。
本研究では,その相対頻度をより正確に予測するために,興味あるクラス間の依存関係を活用しようとするクラス有病率値の推定手法を提案する。
論文 参考訳(メタデータ) (2022-11-15T11:29:59Z) - When to Ask for Help: Proactive Interventions in Autonomous
Reinforcement Learning [57.53138994155612]
強化学習の長期的な目標は、世界で自律的に対話し学習できるエージェントを設計することである。
重要な課題は、ロボットアームが物体をテーブルから押し出したときなど、外部からの援助を必要とする不可逆状態の存在である。
本研究では,非可逆状態の検出と回避を効率よく学習し,エージェントが侵入した場合に積極的に支援を求めるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-19T17:57:24Z) - The Survival Bandit Problem [65.68378556428861]
我々は、サバイバル・バンディット問題(S-MAB)と呼ばれるマルチアーム・バンディット問題(MAB)の新たな変種を紹介し、研究する。
どちらの問題においても、いわゆる累積報酬を最大化することが目的であるが、この新しい変種では累積報酬が予め設定された閾値を下回った場合、手続きが中断される。
この単純なMABの拡張は、多くの実用的な応用から導かれる。
論文 参考訳(メタデータ) (2022-06-07T05:23:14Z) - Field Study in Deploying Restless Multi-Armed Bandits: Assisting
Non-Profits in Improving Maternal and Child Health [28.43878945119807]
携帯電話は、非営利団体が彼らの受益者に重要な健康情報をタイムリーに届けることを可能にする。
このような情報提供プログラムにおける重要な課題は、かなりの数の受益者がプログラムから離脱することである。
そこで我々は,NPOが受益者とのライブ対話を実現するためのレストレスマルチアーメッド・バンディットシステムを開発した。
論文 参考訳(メタデータ) (2021-09-16T16:04:48Z) - Selective Intervention Planning using RMABs: Increasing Program
Engagement to Improve Maternal and Child Health Outcomes [34.38042786168279]
インドに本拠を置く非営利団体ARMMANと連携し、コールベースの情報プログラムをさらに活用しています。
意識プログラムに登録された30万人以上の女性の匿名化通話記録を分析した。
コールログと受益者の人口統計情報から長期的なエンゲージメントパターンを予測するための機械学習ベースのモデルを構築しました。
論文 参考訳(メタデータ) (2021-03-07T08:47:24Z) - Collapsing Bandits and Their Application to Public Health Interventions [45.45852113386041]
Collpasing Banditsは、新しいレスレスマルチアーム・バンディット(RMAB)セットで、各アームがバイナリ状態のマルコフ過程に従う。
我々は、RMABのWhittle index技術を用いて、Colapsing Bandits問題がインデックス化可能である条件を導出する。
本アルゴリズムは,最先端のRMAB技術と比較して3次精度の高速化を実現する。
論文 参考訳(メタデータ) (2020-07-05T00:33:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。