論文の概要: Policy Optimization for Personalized Interventions in Behavioral Health
- arxiv url: http://arxiv.org/abs/2303.12206v2
- Date: Sat, 30 Sep 2023 17:38:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-03 19:56:04.231011
- Title: Policy Optimization for Personalized Interventions in Behavioral Health
- Title(参考訳): 行動保健における個人化介入の政策最適化
- Authors: Jackie Baek, Justin J. Boutilier, Vivek F. Farias, Jonas Oddur
Jonasson, Erez Yoeli
- Abstract要約: デジタルプラットフォームを通じて提供される行動的健康介入は、健康結果を大幅に改善する可能性がある。
患者に対するパーソナライズされた介入を最適化して長期的効果を最大化する問題について検討した。
この問題に対する新たなアプローチとして,政策イテレーションの一段階を近似したDecompPIを提案する。
- 参考スコア(独自算出の注目度): 8.69967783513041
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Behavioral health interventions, delivered through digital platforms, have
the potential to significantly improve health outcomes, through education,
motivation, reminders, and outreach. We study the problem of optimizing
personalized interventions for patients to maximize a long-term outcome, where
interventions are costly and capacity-constrained. We assume there exists a
dataset collected from an initial pilot study that we can leverage. We present
a new approach for this problem that we dub DecompPI, which approximates one
step of policy iteration. Implementing DecompPI simply consists of a prediction
task using the dataset, alleviating the need for online experimentation.
DecompPI is a generic model-free algorithm that can be used irrespective of the
underlying patient behavior model. We derive theoretical guarantees on a
simple, special case of the model that is representative of our problem
setting. We establish an approximation ratio for DecompPI with respect to the
improvement beyond a null policy that does not allocate interventions.
Specifically, when the initial policy used to collect the data is randomized,
the approximation ratio of the improvement approaches 1/2 as the intervention
capacity of the initial policy decreases. We show that this guarantee is robust
to estimation errors. We conduct a rigorous empirical case study using
real-world data from a mobile health platform for improving treatment adherence
for tuberculosis. Using a validated simulation model, we demonstrate that
DecompPI can provide the same efficacy as the status quo approach with
approximately half the capacity of interventions. DecompPI is simple and easy
to implement for organizations aiming to improve long-term behavior through
targeted interventions, and this paper demonstrates its strong performance both
theoretically and empirically.
- Abstract(参考訳): デジタルプラットフォームを通じて提供される行動的健康介入は、教育、モチベーション、リマインダー、アウトリーチを通じて、健康成果を著しく改善する可能性がある。
本研究では,患者に対するパーソナライズされた介入を最適化して長期的効果を最大化する問題について検討する。
最初のパイロット研究から収集したデータセットが、私たちが活用できると仮定します。
この問題に対する新たなアプローチとして,政策イテレーションの一段階を近似したDecompPIを提案する。
DecompPIの実装は、単にデータセットを使用した予測タスクで構成され、オンライン実験の必要性を軽減する。
DecompPIは、基礎となる患者行動モデルに関係なく使用できる汎用的なモデルフリーアルゴリズムである。
我々は、我々の問題設定を代表するモデルの単純で特別な場合の理論的保証を導出する。
我々は、介入を割り当てないnullポリシーを超えた改善に関して、DecompPIの近似比を確立する。
具体的には、データ収集に使用する初期ポリシーがランダム化されると、初期ポリシーの介入能力が低下するにつれて改善の近似比率が1/2に近づく。
この保証は推定誤差に対して堅牢であることを示す。
我々は, 実世界データを用いた厳密な事例研究を行い, 結核治療の付着性を改善する。
検証されたシミュレーションモデルを用いて、DecompPIは、約半分の介入能力でステータスクオアプローチと同じ効果を提供できることを示した。
DecompPIは,対象とした介入による長期的行動改善を目指す組織に対して,シンプルかつ簡単な実装である。
関連論文リスト
- Addressing Data Heterogeneity in Federated Learning of Cox Proportional Hazards Models [8.798959872821962]
本稿では,フェデレーションサバイバル分析の分野,特にCox Proportional Hazards(CoxPH)モデルについて概説する。
本稿では,合成データセットと実世界のアプリケーション間のモデル精度を向上させるために,特徴ベースのクラスタリングを用いたFLアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-20T18:34:20Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Safe AI for health and beyond -- Monitoring to transform a health
service [51.8524501805308]
機械学習アルゴリズムの出力を監視するために必要なインフラストラクチャを評価する。
モデルのモニタリングと更新の例を示す2つのシナリオを提示します。
論文 参考訳(メタデータ) (2023-03-02T17:27:45Z) - Causal Inference under Data Restrictions [0.0]
この論文は、不確実性とデータ制限の下での現代の因果推論に焦点を当てている。
これには、ネオアジュバント臨床試験、分散データネットワーク、堅牢な個別化意思決定へのアプリケーションが含まれる。
論文 参考訳(メタデータ) (2023-01-20T20:14:32Z) - Data-pooling Reinforcement Learning for Personalized Healthcare
Intervention [20.436521180168455]
我々は、一般的な摂動値反復フレームワークに基づく新しいデータプール強化学習(RL)アルゴリズムを開発した。
提案アルゴリズムは,従来の手法では推定精度とは対照的に,(後悔によって測定された)決定性能と直接結びつくことの重み付けという,3つの主要な革新とともに,履歴データを適応的にプールする。
提案手法の理論的発展を実証的に優れた性能で実証し,未計画の読解を防止するために,解凍後介入の文脈におけるケーススタディにより検証した。
論文 参考訳(メタデータ) (2022-11-16T15:52:49Z) - Optimal discharge of patients from intensive care via a data-driven
policy learning framework [58.720142291102135]
退院課題は、退院期間の短縮と退院決定後の退院や死亡のリスクとの不確実なトレードオフに対処することが重要である。
本研究は、このトレードオフを捉えるためのエンドツーエンドの汎用フレームワークを導入し、最適放電タイミング決定を推奨する。
データ駆動型アプローチは、患者の生理的状態を捉えた同種で離散的な状態空間表現を導出するために用いられる。
論文 参考訳(メタデータ) (2021-12-17T04:39:33Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - Privacy-preserving medical image analysis [53.4844489668116]
医用画像におけるプライバシ保護機械学習(PPML)のためのソフトウェアフレームワークであるPriMIAを提案する。
集合型学習モデルの分類性能は,未発見データセットの人間専門家と比較して有意に良好である。
グラデーションベースのモデル反転攻撃に対するフレームワークのセキュリティを実証的に評価する。
論文 参考訳(メタデータ) (2020-12-10T13:56:00Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - Optimizing Medical Treatment for Sepsis in Intensive Care: from
Reinforcement Learning to Pre-Trial Evaluation [2.908482270923597]
本研究の目的は, 介入を最適化する強化学習(RL)が, 学習方針の治験に対する規制に適合する経路を遡及的に得る枠組みを確立することである。
我々は,死の主な原因の一つであり,複雑で不透明な患者動態のため治療が困難である集中治療室の感染症に焦点を当てた。
論文 参考訳(メタデータ) (2020-03-13T20:31:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。