論文の概要: Correcting heterogeneous diagnostic bias when developing clinical prediction models using causal hidden Markov models
- arxiv url: http://arxiv.org/abs/2605.06059v1
- Date: Thu, 07 May 2026 11:43:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.734368
- Title: Correcting heterogeneous diagnostic bias when developing clinical prediction models using causal hidden Markov models
- Title(参考訳): 因果隠れマルコフモデルを用いた臨床予測モデルの開発における異種診断バイアスの補正
- Authors: Jose Benitez-Aurioles, Ricardo Silva, Brian McMillan, Matthew Sperrin,
- Abstract要約: 本稿では,差分診断遅延による予測モデルにおけるそのようなバイアスを補正する手法を提案する。
本研究のアプローチをシミュレーションデータで検証し,電子健康記録を用いた慢性腎臓病予測のケーススタディに適用した。
- 参考スコア(独自算出の注目度): 2.3491907829767533
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In routine care, individuals identified a priori as high-risk are usually tested for conditions more frequently. Protected attributes, such as sex or ethnicity may also determine testing frequency. Such heterogeneous detection rates across a population induce label error. This causes systematic model error for specific groups and biases performance metrics during validation. This paper proposes a method to correct for such bias in prediction models due to differential diagnostic delay. We use a causal inference framework to define our target estimand: an individual's diagnosis probability in a counterfactual scenario where their diagnosis rate matches that of a reference group. We model the longitudinal process as a hidden Markov model, in which confirmatory test results are emissions from a latent progressive disease stage. We validate our approach in simulated data and apply it to a case study of chronic kidney disease prediction using electronic health records. In simulations, our method reduces prediction bias and improves calibration-in-the-large, correcting the Observed:Expected ratio in the underdiagnosed group from 1.34 (standard deviation: 0.09) in a model developed without any correction for underdiagnosis bias to 1.02 (0.09). Violations of assumptions in the simulation affected the estimation of model parameters, but the proposed approach nonetheless remained better calibrated than the standard model. In the clinical case study, we identify diabetes as the main driver of observability, with an odds ratio of 10.36 (95% confidence interval, 9.80 - 11.02) in 6-month urine albumin-creatinine ratio testing rate. Using our approach to predict the counterfactual diagnostic rate in patients without diabetes, we improved the Observed:Expected ratio of a developed clinical prediction model from 1.55 (1.51 - 1.59) to 1.01 (0.98 - 1.04).
- Abstract(参考訳): 日常的なケアでは、プライオリをハイリスクと特定する個人は通常、より頻繁にテストされる。
性別や民族などの保護された属性は、テスト頻度も決定できる。
このような集団間の異種検出速度はラベルエラーを引き起こす。
これは特定のグループに対する体系的なモデルエラーを引き起こし、検証中のパフォーマンス指標をバイアスする。
本稿では,差分診断遅延による予測モデルにおけるそのようなバイアスを補正する手法を提案する。
本研究は,対象推定値の定義に因果推論フレームワークを用い,診断率と基準群とが一致した対実シナリオにおける個人の診断確率を推定する。
本研究は, 長期経過過程を隠れマルコフモデルとしてモデル化し, 検査結果が潜伏進行性疾患の段階からの排出であることを示す。
本研究のアプローチをシミュレーションデータで検証し,電子健康記録を用いた慢性腎臓病予測のケーススタディに適用した。
シミュレーションでは, 予測バイアスを低減し, キャリブレーション・イン・ザ・ラージを改良し, 下診断群における検出比を1.34 (標準偏差: 0.09) から1.02 (0.09) に補正した。
シミュレーションにおける仮定の違反は, モデルパラメータの推定に影響を及ぼしたが, 提案手法は標準モデルよりもキャリブレーションが良好であった。
臨床症例では,6カ月間の尿アルブミン-クレアチニン比試験では,糖尿病が10.36(95%信頼区間,9.80~11.02)のオッズ比で可観測性の主要な要因であると考えられた。
糖尿病を伴わない患者では, 予防的診断率を予測するために, 臨床予測モデルが1.55 (1.51 - 1.59) から1.01 (0.98 - 1.04) に改善された。
関連論文リスト
- An Explainable and Fair AI Tool for PCOS Risk Assessment: Calibration, Subgroup Equity, and Interactive Clinical Deployment [0.10026496861838446]
本稿では,多嚢胞性卵巣症候群(PCOS)の予測のための,公平で解釈可能な機械学習フレームワークを提案する。
このフレームワークは、SHAPに基づく特徴属性と人口統計監査を統合し、予測的説明と観察的差異を関連付ける。
StreamlitベースのWebインターフェースは、リアルタイムPCOSリスク評価、ロッテルダム基準評価、インタラクティブな「What-if」分析を可能にする。
論文 参考訳(メタデータ) (2025-11-08T16:14:56Z) - Pre-validation Revisited [79.92204034170092]
シミュレーションと応用による予測,推測,誤差推定における事前検証の特性と利点を示す。
そこで本研究では, あるモデル下での事前検証予測のためのテスト統計量の解析的分布だけでなく, 推論を行うための一般的なブートストラップ手順も提案する。
論文 参考訳(メタデータ) (2025-05-21T00:20:14Z) - Evidential time-to-event prediction with calibrated uncertainty quantification [12.446406577462069]
Time-to-event分析は、臨床予後と治療勧告に関する洞察を提供する。
本稿では,時間とイベントの予測に特化して設計された明らかな回帰モデルを提案する。
我々のモデルは正確かつ信頼性の高い性能を提供し、最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-11-12T15:06:04Z) - SepsisLab: Early Sepsis Prediction with Uncertainty Quantification and Active Sensing [67.8991481023825]
セプシスは米国での院内死亡の主な原因である。
既存の予測モデルは通常、情報不足の少ない高品質なデータで訓練される。
限られた観察により信頼性の低い高リスク患者に対して,ロバストな能動センシングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-24T04:47:36Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Performance of externally validated machine learning models based on
histopathology images for the diagnosis, classification, prognosis, or
treatment outcome prediction in female breast cancer: A systematic review [0.5792122879054292]
女性乳癌の診断、分類、予後、治療結果予測のための外部検証された機械学習モデル。
診断用MLモデル3例,分類用4例,予後用2例,予後用1例について検討した。
ほとんどの研究では畳み込みニューラルネットワークとロジスティック回帰アルゴリズムが使用されている。
論文 参考訳(メタデータ) (2023-12-09T18:27:56Z) - Calibrated and Conformal Propensity Scores for Causal Effect Estimation [10.209143402485406]
学習された確率スコアモデルの確率的出力は校正されるべきである。
校正確率スコアはGWAS解析の速度を2倍以上に向上させる。
論文 参考訳(メタデータ) (2023-06-01T06:26:26Z) - Bayesian prognostic covariate adjustment [59.75318183140857]
疾患の結果に関する歴史的データは、様々な方法で臨床試験の分析に組み込むことができる。
我々は, 予測モデルからの予後スコアを用いて, 治療効果推定の効率を向上する既存の文献に基づいて構築する。
論文 参考訳(メタデータ) (2020-12-24T05:19:03Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。