論文の概要: Identifying and mitigating bias in algorithms used to manage patients in
a pandemic
- arxiv url: http://arxiv.org/abs/2111.00340v1
- Date: Sat, 30 Oct 2021 21:10:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-03 10:36:54.088129
- Title: Identifying and mitigating bias in algorithms used to manage patients in
a pandemic
- Title(参考訳): パンデミックで患者を管理するアルゴリズムにおける偏見の同定と緩和
- Authors: Yifan Li, Garrett Yoon, Mustafa Nasir-Moin, David Rosenberg, Sean
Neifert, and Douglas Kondziolka, Eric Karl Oermann
- Abstract要約: 現実のデータセットを使用して、新型コロナウイルスの死亡率、人工呼吸器の状態、入院状態を予測するために、ロジスティック回帰モデルが作成された。
モデルではバイアス試験の回数が57%減少した。
キャリブレーション後, 予測モデルの平均感度は0.527から0.955に増加した。
- 参考スコア(独自算出の注目度): 4.756860520861679
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Numerous COVID-19 clinical decision support systems have been developed.
However many of these systems do not have the merit for validity due to
methodological shortcomings including algorithmic bias. Methods Logistic
regression models were created to predict COVID-19 mortality, ventilator status
and inpatient status using a real-world dataset consisting of four hospitals in
New York City and analyzed for biases against race, gender and age. Simple
thresholding adjustments were applied in the training process to establish more
equitable models. Results Compared to the naively trained models, the
calibrated models showed a 57% decrease in the number of biased trials, while
predictive performance, measured by area under the receiver/operating curve
(AUC), remained unchanged. After calibration, the average sensitivity of the
predictive models increased from 0.527 to 0.955. Conclusion We demonstrate that
naively training and deploying machine learning models on real world data for
predictive analytics of COVID-19 has a high risk of bias. Simple implemented
adjustments or calibrations during model training can lead to substantial and
sustained gains in fairness on subsequent deployment.
- Abstract(参考訳): 多くのcovid-19臨床判断支援システムが開発されている。
しかし、これらのシステムの多くは、アルゴリズムバイアスを含む方法論的欠点のために有効性を持たない。
方法 ロジスティック回帰モデルは、ニューヨーク市の4つの病院からなる現実のデータセットを用いて、新型コロナウイルスの死亡率、人工呼吸器の状態、入院状態を予測するために作成され、人種、性別、年齢に対する偏見を分析した。
トレーニングプロセスに簡単なしきい値調整を適用し、より公平なモデルを構築した。
その結果, 評価モデルと比較すると, 偏差試験回数は57%減少し, 受信/操作曲線 (AUC) 下の領域で測定された予測性能は変わらなかった。
キャリブレーション後, 予測モデルの平均感度は0.527から0.955に増加した。
結論 新型コロナウイルス(covid-19)の予測分析のために、現実世界のデータに機械学習モデルを訓練し、デプロイすることは、バイアスのリスクが高いことを実証する。
モデルトレーニング中に簡単に実装された調整やキャリブレーションは、その後の展開に対して相当かつ持続的な利益をもたらす可能性がある。
関連論文リスト
- Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Symptom-based Machine Learning Models for the Early Detection of
COVID-19: A Narrative Review [0.0]
機械学習モデルは、患者の報告した症状、臨床データ、医療画像などを取り入れて、大規模なデータセットを分析することができる。
本稿では、その性能と限界を含む、COVID-19を予測するための症状のみの機械学習モデルの概要について概説する。
また、画像ベースモデルと比較して、症状ベースのモデルの性能についても検討する。
論文 参考訳(メタデータ) (2023-12-08T01:41:42Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Systematic investigation into generalization of COVID-19 CT deep
learning models with Gabor ensemble for lung involvement scoring [9.94980188821453]
本研究は,COVID-19 CTデータを用いたキーパブリッシュモデルの一般化可能性について検討する。
次に、独立した新しいデータセットを使用して、新型コロナウイルスの重症度に関するこれらのモデルの予測能力を評価する。
論文 参考訳(メタデータ) (2021-04-20T03:49:48Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Comparative Analysis of Machine Learning Approaches to Analyze and
Predict the Covid-19 Outbreak [10.307715136465056]
疫学領域における新型コロナウイルスの流行を予測するための機械学習(ML)アプローチの比較分析を行った。
これらの結果から,短期的政策の意思決定を支援するMLアルゴリズムの利点が明らかになった。
論文 参考訳(メタデータ) (2021-02-11T11:57:33Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Individualized Prediction of COVID-19 Adverse outcomes with MLHO [9.197411456718708]
我々は、反復的な特徴とアルゴリズムの選択を利用して健康状態を予測するエンドツーエンドの機械学習フレームワークを開発した。
入院前患者の健康状態と人口統計を表わす特徴として,約600点を用いた4つの有害な結果のモデル化を行った。
以上の結果から, 人口統計学的変数は, 新型コロナウイルス感染後の副作用の予測因子として重要であるが, 過去の臨床記録の組み入れは, 信頼性の高い予測モデルに欠かせないことが示唆された。
論文 参考訳(メタデータ) (2020-08-10T02:44:52Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。