論文の概要: Limited Resource Allocation in a Non-Markovian World: The Case of
Maternal and Child Healthcare
- arxiv url: http://arxiv.org/abs/2305.12640v1
- Date: Mon, 22 May 2023 02:26:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-23 18:55:12.790338
- Title: Limited Resource Allocation in a Non-Markovian World: The Case of
Maternal and Child Healthcare
- Title(参考訳): 非マルコフ世界の限られた資源配分--母子保健を事例として
- Authors: Panayiotis Danassis, Shresth Verma, Jackson A. Killian, Aparna Taneja,
Milind Tambe
- Abstract要約: 低リソース環境におけるスケジューリング介入の問題点を考察し,順応性やエンゲージメントを高めることを目的とする。
過去の研究は、この問題に対する数種類のRestless Multi-armed Bandit (RMAB) ベースのソリューションの開発に成功している。
我々のパートナーであるNGO ARMMAN の母体健康意識プログラムにおける実世界データに対する Markov の仮定から大きく逸脱した。
一般化された非マルコフ的RMAB設定に取り組むために、(i)各参加者の軌跡を時系列としてモデル化し、(ii)時系列予測モデルのパワーを利用して将来の状態を予測し、(iii)時間を提案する。
- 参考スコア(独自算出の注目度): 27.812174610119452
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of many healthcare programs depends on participants' adherence.
We consider the problem of scheduling interventions in low resource settings
(e.g., placing timely support calls from health workers) to increase adherence
and/or engagement. Past works have successfully developed several classes of
Restless Multi-armed Bandit (RMAB) based solutions for this problem.
Nevertheless, all past RMAB approaches assume that the participants' behaviour
follows the Markov property. We demonstrate significant deviations from the
Markov assumption on real-world data on a maternal health awareness program
from our partner NGO, ARMMAN. Moreover, we extend RMABs to continuous state
spaces, a previously understudied area. To tackle the generalised non-Markovian
RMAB setting we (i) model each participant's trajectory as a time-series, (ii)
leverage the power of time-series forecasting models to learn complex patterns
and dynamics to predict future states, and (iii) propose the Time-series Arm
Ranking Index (TARI) policy, a novel algorithm that selects the RMAB arms that
will benefit the most from an intervention, given our future state predictions.
We evaluate our approach on both synthetic data, and a secondary analysis on
real data from ARMMAN, and demonstrate significant increase in engagement
compared to the SOTA, deployed Whittle index solution. This translates to 16.3
hours of additional content listened, 90.8% more engagement drops prevented,
and reaching more than twice as many high dropout-risk beneficiaries.
- Abstract(参考訳): 多くの医療プログラムの成功は参加者の順守にかかっている。
我々は,低リソース環境(医療従事者からのタイムリーサポートコールなど)におけるスケジュール介入の問題点について考察する。
過去の研究は、この問題に対する数種類のRestless Multi-armed Bandit (RMAB) ベースのソリューションの開発に成功した。
それでも、過去のrmabアプローチはすべて、参加者の行動がマルコフ特性に従うと仮定している。
我々のパートナーであるNGO ARMMAN の母体健康意識プログラムにおける実世界データに対する Markov の仮定から大きく逸脱した。
さらに、RMABsを以前検討された領域である連続状態空間に拡張する。
一般化された非マルコフrmab設定に取り組むために
(i)各参加者の軌跡を時系列としてモデル化する。
(ii)時系列予測モデルの力を利用して、複雑なパターンやダイナミクスを学習し、将来の状態を予測する。
(iii)tari(time-series arm ranking index)ポリシーを提案する。これは、我々の将来の状態予測を考えると、介入から最大限の利益を得るrmabアームを選択する新しいアルゴリズムである。
我々は,合成データとARMMANの実データに対する二次解析の両方に対するアプローチを評価し,WhittleインデックスソリューションをデプロイしたSOTAと比較して,エンゲージメントが著しく向上したことを示す。
これは16.3時間の追加コンテンツがリスニングされ、90.8%のエンゲージメント低下が防止され、リスクの高い受益者が2倍以上に達することを意味する。
関連論文リスト
- Efficient Public Health Intervention Planning Using Decomposition-Based
Decision-Focused Learning [33.14258196945301]
介入計画の高速化のために、レスレスマルチアーマッドバンド(RMAB)の構造を利用する方法を示す。
私たちはインドのNGOであるARMMANの実際のデータを使って、我々のアプローチが最先端のアプローチよりも最大2桁高速であることを示す。
論文 参考訳(メタデータ) (2024-03-08T21:31:00Z) - A Bayesian Approach to Online Learning for Contextual Restless Bandits with Applications to Public Health [36.83063109531146]
RMABに対するオンラインRLアプローチであるBCoR(Bayesian Learning for Contextual RMABs)について述べる。
BCoRの重要な強みは、腕内と腕間の共有情報を利用して、未知のRMAB遷移ダイナミクスを素早く学習する能力である。
論文 参考訳(メタデータ) (2024-02-07T15:11:37Z) - Optimal Best Arm Identification with Fixed Confidence in Restless Bandits [66.700654953613]
本研究は,有限個の腕を持つレスレス・マルチアーム・バンディット・セッティングにおけるベスト・アーム識別について検討する。
各アームによって生成された離散時間データは、共通の有限状態空間で値を取る同質マルコフ連鎖を形成する。
その結果,あるマルコフ決定過程の長期的挙動の追跡とその状態-行動的訪問比率が,逆および達成可能性境界を解析するための重要な要素であることが示唆された。
論文 参考訳(メタデータ) (2023-10-20T10:04:05Z) - Fairness for Workers Who Pull the Arms: An Index Based Policy for
Allocation of Restless Bandit Tasks [30.323831598899773]
異種労働者によるMulti-worker restless bandits(MWRMAB)と呼ばれる新しいRMAB設定について考察する。
目標は、各労働者の予算制約を満たしつつ、期待される報酬を最大化する介入スケジュールを計画することである。
コントリビューションは,(1)不均一なコストと作業者ごとの予算に対応するためにWhittleインデックスのマルチワーカー拡張を提供し,(2)公正性を達成するためのインデックスベースのスケジューリングポリシを開発する。
論文 参考訳(メタデータ) (2023-03-01T19:59:42Z) - Efficient Resource Allocation with Fairness Constraints in Restless
Multi-Armed Bandits [8.140037969280716]
Restless Multi-Armed Bandits (RMAB)は、公衆衛生介入における意思決定問題を表現するための適応モデルである。
本稿では,RMAB意思決定が期待値の最大化を図りつつ,異なるアームに対して公平であることを保証することに関心がある。
論文 参考訳(メタデータ) (2022-06-08T13:28:29Z) - Multi-Armed Bandit Problem with Temporally-Partitioned Rewards: When
Partial Feedback Counts [53.579515853222986]
時間分割リワード(TP-MAB)を用いたマルチアーメッド・バンディット(Multi-Armed Bandit)について検討する。
この設定は、プル後の有限時間スパン上で報酬が拡張されるケースに対する遅延フィードバックバンディットの自然な拡張である。
本稿では,TP-UCB-FRとTP-UCB-EWの2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-01T15:56:59Z) - Best Arm Identification in Restless Markov Multi-Armed Bandits [85.55466536537293]
マルチアームバンディット環境における最適な腕を特定することの問題点について検討する。
決定エンティティは、上限誤差確率を条件として、ベストアームのインデックスをできるだけ早く見つけることを希望する。
このポリシーは、$R$に依存する上限を達成し、$Rtoinfty$として単調に増加しないことを示す。
論文 参考訳(メタデータ) (2022-03-29T04:58:04Z) - Addressing the Long-term Impact of ML Decisions via Policy Regret [49.92903850297013]
意思決定者が腕を引っ張るたびに、各腕からの報酬が進化する状況について検討する。
我々は、許容可能な機会の逐次配分は、成長の可能性を考慮に入れなければならないと論じている。
十分に長い時間的地平線に対して、確実にサブ線形ポリシーを後悔するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-02T17:38:10Z) - Approximate Bayesian Computation for an Explicit-Duration Hidden Markov
Model of COVID-19 Hospital Trajectories [55.786207368853084]
新型コロナウイルス(COVID-19)のパンデミックの中、病院の資源をモデル化する問題に取り組んでいます。
幅広い適用性のために、関心のある領域の患者レベルデータが利用できない、一般的なが困難なシナリオに注目します。
本稿では,ACED-HMM(ACED-HMM)と呼ばれる集合数正規化隠れマルコフモデルを提案する。
論文 参考訳(メタデータ) (2021-04-28T15:32:42Z) - Collapsing Bandits and Their Application to Public Health Interventions [45.45852113386041]
Collpasing Banditsは、新しいレスレスマルチアーム・バンディット(RMAB)セットで、各アームがバイナリ状態のマルコフ過程に従う。
我々は、RMABのWhittle index技術を用いて、Colapsing Bandits問題がインデックス化可能である条件を導出する。
本アルゴリズムは,最先端のRMAB技術と比較して3次精度の高速化を実現する。
論文 参考訳(メタデータ) (2020-07-05T00:33:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。