論文の概要: Deep Reinforcement Learning for Efficient and Fair Allocation of Health Care Resources
- arxiv url: http://arxiv.org/abs/2309.08560v2
- Date: Thu, 22 Aug 2024 05:05:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-23 20:07:24.761077
- Title: Deep Reinforcement Learning for Efficient and Fair Allocation of Health Care Resources
- Title(参考訳): 医療資源の効率的かつ公平な配置のための深層強化学習
- Authors: Yikuan Li, Chengsheng Mao, Kaixuan Huang, Hanyin Wang, Zheng Yu, Mengdi Wang, Yuan Luo,
- Abstract要約: 医療資源の枯渇は、レーションの避けられない結果をもたらす可能性がある。
医療資源割り当てプロトコルの普遍的な標準は存在しない。
本稿では,患者の疾患進行と患者間の相互作用効果を統合するためのトランスフォーマーベースのディープQネットワークを提案する。
- 参考スコア(独自算出の注目度): 47.57108369791273
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scarcity of health care resources could result in the unavoidable consequence of rationing. For example, ventilators are often limited in supply, especially during public health emergencies or in resource-constrained health care settings, such as amid the pandemic of COVID-19. Currently, there is no universally accepted standard for health care resource allocation protocols, resulting in different governments prioritizing patients based on various criteria and heuristic-based protocols. In this study, we investigate the use of reinforcement learning for critical care resource allocation policy optimization to fairly and effectively ration resources. We propose a transformer-based deep Q-network to integrate the disease progression of individual patients and the interaction effects among patients during the critical care resource allocation. We aim to improve both fairness of allocation and overall patient outcomes. Our experiments demonstrate that our method significantly reduces excess deaths and achieves a more equitable distribution under different levels of ventilator shortage, when compared to existing severity-based and comorbidity-based methods in use by different governments. Our source code is included in the supplement and will be released on Github upon publication.
- Abstract(参考訳): 医療資源の枯渇は、レーションの避けられない結果をもたらす可能性がある。
例えば、人工呼吸器は供給に制限されることが多く、特に公衆衛生の緊急事態や、新型コロナウイルス(COVID-19)のパンデミックなど、資源に制約のある医療環境においてである。
現在、医療資源割り当てプロトコルの普遍的な標準は存在せず、様々な基準やヒューリスティックベースのプロトコルに基づいて患者を優先順位付けしている。
本研究では, 要介護資源配分政策最適化における強化学習の活用について検討した。
本稿では,患者の病状進行と医療資源配分時の患者間の相互作用効果を統合するためのトランスフォーマーベースのディープQネットワークを提案する。
配分の公平さと患者の全体的な成果の両方を改善することを目的としている。
以上の結果から, 従来の重症度・包括性に基づく方法と比較して, 過度の死亡率を大幅に低減し, 異なるレベルの換気器不足下でのより公平な分布を達成できることが示唆された。
ソースコードはサプリメントに含まれており、公開時にGithubで公開される予定です。
関連論文リスト
- Enhancing Performance for Highly Imbalanced Medical Data via Data Regularization in a Federated Learning Setting [6.22153888560487]
本手法の目的は,心血管疾患予測のためのモデル性能を向上させることである。
本手法は, 心臓血管疾患予測のための4つのデータセットにまたがって評価され, 異なるクライアントに分散している。
論文 参考訳(メタデータ) (2024-05-30T19:15:38Z) - Reduced-Rank Multi-objective Policy Learning and Optimization [57.978477569678844]
実際には、因果研究者は先験を念頭において1つの結果を持っていない。
政府支援の社会福祉プログラムでは、政策立案者は貧困の多次元的性質を理解するために多くの成果を集めている。
本稿では、最適政策学習の文脈において、複数の結果に対するデータ駆動型次元性推論手法を提案する。
論文 参考訳(メタデータ) (2024-04-29T08:16:30Z) - Learning Optimal and Fair Policies for Online Allocation of Scarce
Societal Resources from Data Collected in Deployment [5.0904557821667]
当社は、予算制約を満たしつつ、期待される成果を最大化するオンラインポリシーを設計するために、デプロイメントで収集された管理データを使用します。
当社の政策は,ホームレスからの退去率を1.9%向上させ,人種ごとの配分や結果に公平な政策は,フェアネスの非常に低い価格で得られることを示す。
論文 参考訳(メタデータ) (2023-11-23T01:40:41Z) - Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care [46.2482873419289]
我々は、より信頼性の高いクリティカルケアポリシーを得るための深いQ-ラーニングアプローチを導入する。
本手法を,集中治療室のシミュレーション環境と実際の健康記録を用いて,オフライン・オフ・セッティングで評価した。
論文 参考訳(メタデータ) (2023-06-13T18:02:57Z) - Data-pooling Reinforcement Learning for Personalized Healthcare
Intervention [20.436521180168455]
我々は、一般的な摂動値反復フレームワークに基づく新しいデータプール強化学習(RL)アルゴリズムを開発した。
提案アルゴリズムは,従来の手法では推定精度とは対照的に,(後悔によって測定された)決定性能と直接結びつくことの重み付けという,3つの主要な革新とともに,履歴データを適応的にプールする。
提案手法の理論的発展を実証的に優れた性能で実証し,未計画の読解を防止するために,解凍後介入の文脈におけるケーススタディにより検証した。
論文 参考訳(メタデータ) (2022-11-16T15:52:49Z) - Reconciling Risk Allocation and Prevalence Estimation in Public Health
Using Batched Bandits [0.0]
多くの公衆衛生環境では、既知の脆弱な領域に資源を割り当てることと、問題の全体的な頻度について学ぶことに緊張感がある。
ドアツードアのCovid-19テストプログラムにインスパイアされた私たちは、多武装のバンディット戦略とサンプリング理論からの洞察を組み合わせて、リスクの高い地域へのリソースの割り当てを続けながら、正確な有病率推定を回復する方法を実証しました。
論文 参考訳(メタデータ) (2021-10-25T22:33:46Z) - Towards a fairer reimbursement system for burn patients using
cost-sensitive classification [0.0]
英国におけるPPSの導入は、Health Resource Groups(HRGs)の創設につながった。
HRGは、再納のために同様のリソース利用を共有する臨床に類似した患者のグループを特定することを目的としている。
本稿では,データ駆動モデルと患者レベルのコストを取り入れて,資源使用量と重大さの均一性を向上する手法を提案する。
論文 参考訳(メタデータ) (2021-07-01T15:23:21Z) - The Medkit-Learn(ing) Environment: Medical Decision Modelling through
Simulation [81.72197368690031]
医用シーケンシャルな意思決定に特化して設計された新しいベンチマークスイートを提案する。
Medkit-Learn(ing) Environmentは、高忠実度合成医療データに簡単かつ簡単にアクセスできるPythonパッケージである。
論文 参考訳(メタデータ) (2021-06-08T10:38:09Z) - Coordinated Online Learning for Multi-Agent Systems with Coupled
Constraints and Perturbed Utility Observations [91.02019381927236]
本研究では, 資源制約を満たすため, エージェントを安定な集団状態へ誘導する新しい手法を提案する。
提案手法は,ゲームラグランジアンの拡張によるリソース負荷に基づく分散リソース価格設定手法である。
論文 参考訳(メタデータ) (2020-10-21T10:11:17Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。