論文の概要: Data-pooling Reinforcement Learning for Personalized Healthcare
Intervention
- arxiv url: http://arxiv.org/abs/2211.08998v1
- Date: Wed, 16 Nov 2022 15:52:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 16:51:51.916352
- Title: Data-pooling Reinforcement Learning for Personalized Healthcare
Intervention
- Title(参考訳): 個人化医療介入のためのデータプール強化学習
- Authors: Xinyun Chen, Pengyi Shi, Shanwen Pu
- Abstract要約: 我々は、一般的な摂動値反復フレームワークに基づく新しいデータプール強化学習(RL)アルゴリズムを開発した。
提案アルゴリズムは,従来の手法では推定精度とは対照的に,(後悔によって測定された)決定性能と直接結びつくことの重み付けという,3つの主要な革新とともに,履歴データを適応的にプールする。
提案手法の理論的発展を実証的に優れた性能で実証し,未計画の読解を防止するために,解凍後介入の文脈におけるケーススタディにより検証した。
- 参考スコア(独自算出の注目度): 20.436521180168455
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivated by the emerging needs of personalized preventative intervention in
many healthcare applications, we consider a multi-stage, dynamic
decision-making problem in the online setting with unknown model parameters. To
deal with the pervasive issue of small sample size in personalized planning, we
develop a novel data-pooling reinforcement learning (RL) algorithm based on a
general perturbed value iteration framework. Our algorithm adaptively pools
historical data, with three main innovations: (i) the weight of pooling ties
directly to the performance of decision (measured by regret) as opposed to
estimation accuracy in conventional methods; (ii) no parametric assumptions are
needed between historical and current data; and (iii) requiring data-sharing
only via aggregate statistics, as opposed to patient-level data. Our
data-pooling algorithm framework applies to a variety of popular RL algorithms,
and we establish a theoretical performance guarantee showing that our pooling
version achieves a regret bound strictly smaller than that of the no-pooling
counterpart. We substantiate the theoretical development with empirically
better performance of our algorithm via a case study in the context of
post-discharge intervention to prevent unplanned readmissions, generating
practical insights for healthcare management. In particular, our algorithm
alleviates privacy concerns about sharing health data, which (i) opens the door
for individual organizations to levering public datasets or published studies
to better manage their own patients; and (ii) provides the basis for public
policy makers to encourage organizations to share aggregate data to improve
population health outcomes for the broader community.
- Abstract(参考訳): 多くの医療アプリケーションにおけるパーソナライズされた予防介入の必要性に動機づけられ、未知のモデルパラメータを持つオンライン環境でのマルチステージ、ダイナミックな意思決定の問題を考える。
パーソナライズドプランニングにおける小サンプルサイズの広範的問題に対処するため,汎用的な摂動値反復フレームワークに基づく新しいデータプール強化学習(RL)アルゴリズムを開発した。
我々のアルゴリズムは、歴史的データを適応的にプールする。
一 従来の方法による推定精度とは対照的に、決定(後悔によって測る)の遂行に直結する際の重み
(二 履歴データと現在データの間にパラメトリックな仮定は必要ない。)
(iii)患者レベルのデータとは対照的に、集計統計のみを通してデータ共有を要求すること。
我々のデータプーリングアルゴリズムフレームワークは、様々なRLアルゴリズムに適用され、我々は、プールバージョンが、ノープールのアルゴリズムよりも厳密に小さい後悔の限界を達成することを示す理論的性能保証を確立する。
我々は,計画外の再送を防止し,医療管理に実用的な洞察を与えるため,退院後介入のケーススタディを通じて,理論開発を経験的に優れたアルゴリズムの性能で実証する。
特に,我々のアルゴリズムは,健康データ共有に関するプライバシー上の懸念を緩和する。
一 個々の組織が、自身の患者をよりよく管理するための公開データセットや公開研究を高めるための扉を開くこと。
(二)公共政策立案者が集団データを共有し、広い地域社会の健康状態を改善することを奨励する基盤を提供する。
関連論文リスト
- Pseudo-Probability Unlearning: Towards Efficient and Privacy-Preserving Machine Unlearning [59.29849532966454]
本稿では,PseudoProbability Unlearning (PPU)を提案する。
提案手法は,最先端の手法に比べて20%以上の誤りを忘れる改善を実現している。
論文 参考訳(メタデータ) (2024-11-04T21:27:06Z) - Multi-Source Conformal Inference Under Distribution Shift [41.701790856201036]
複数のバイアスのあるデータソースを活用することにより,対象個体数の分布自由な予測区間を得るという課題を考察する。
対象集団および源集団における未観測結果の定量値に対する効率的な影響関数を導出する。
本稿では、効率向上のための重み付き情報ソースとバイアス低減のための重み付き非情報ソースに対するデータ適応戦略を提案する。
論文 参考訳(メタデータ) (2024-05-15T13:33:09Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Policy Optimization for Personalized Interventions in Behavioral Health [8.10897203067601]
デジタルプラットフォームを通じて提供される行動的健康介入は、健康結果を大幅に改善する可能性がある。
患者に対するパーソナライズされた介入を最適化して長期的効果を最大化する問題について検討した。
患者システムの状態空間を個別のレベルに分解するDecompPIをダブする新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-21T21:42:03Z) - CEDAR: Communication Efficient Distributed Analysis for Regressions [9.50726756006467]
患者レベルのデータを共有することなく、複数のEHRデータベース上での分散学習への関心が高まっている。
本稿では,局所的な最適推定値を集約する通信効率のよい新しい手法を提案する。
本稿では,統計的推測法と差分プライバシーに関する理論的検討を行い,シミュレーションおよび実データ解析におけるその性能評価を行う。
論文 参考訳(メタデータ) (2022-07-01T09:53:44Z) - Decentralized Distributed Learning with Privacy-Preserving Data
Synthesis [9.276097219140073]
医療分野では、患者と臨床データの均一性を生かして、多施設共同研究がより一般化可能な発見をもたらすことがしばしばある。
最近のプライバシー規制は、データの共有を妨げ、その結果、診断と予後をサポートする機械学習ベースのソリューションを考案する。
ローカルノードの機能を統合する分散分散手法を提案し、プライバシを維持しながら複数のデータセットをまたいで一般化可能なモデルを提供する。
論文 参考訳(メタデータ) (2022-06-20T23:49:38Z) - Federated Offline Reinforcement Learning [55.326673977320574]
マルチサイトマルコフ決定プロセスモデルを提案する。
我々は,オフラインRLを対象とした最初のフェデレーション最適化アルゴリズムを設計する。
提案アルゴリズムでは,学習ポリシーの準最適性は,データが分散していないような速度に匹敵する,理論的保証を与える。
論文 参考訳(メタデータ) (2022-06-11T18:03:26Z) - Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。
本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。
理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文 参考訳(メタデータ) (2022-01-31T20:58:47Z) - The Medkit-Learn(ing) Environment: Medical Decision Modelling through
Simulation [81.72197368690031]
医用シーケンシャルな意思決定に特化して設計された新しいベンチマークスイートを提案する。
Medkit-Learn(ing) Environmentは、高忠実度合成医療データに簡単かつ簡単にアクセスできるPythonパッケージである。
論文 参考訳(メタデータ) (2021-06-08T10:38:09Z) - Sample-Efficient Reinforcement Learning via Counterfactual-Based Data
Augmentation [15.451690870640295]
医療などのいくつかのシナリオでは、通常、各患者に利用可能なレコードはごくわずかであり、現在の強化学習アルゴリズムの適用を妨げる。
構造因果モデル(SCM)を利用して状態ダイナミクスをモデル化する,データ効率の高いRLアルゴリズムを提案する。
本研究は, 軽度条件下では反実結果が識別可能であり, 反実に基づく拡張データセット上のq学習が最適値関数に収束することを示す。
論文 参考訳(メタデータ) (2020-12-16T17:21:13Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。