論文の概要: Domain constraints improve risk prediction when outcome data is missing
- arxiv url: http://arxiv.org/abs/2312.03878v2
- Date: Tue, 12 Mar 2024 20:12:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 17:58:32.188200
- Title: Domain constraints improve risk prediction when outcome data is missing
- Title(参考訳): ドメイン制約は結果データが欠落した場合のリスク予測を改善する
- Authors: Sidhika Balachandar, Nikhil Garg, Emma Pierson
- Abstract要約: 機械学習モデルにより, 検査対象者および検査対象者双方のリスクを正確に推定できることが示唆された。
本研究は,癌リスク予測のケーススタディに適用し,そのモデルが癌診断を予測していることを示す。
- 参考スコア(独自算出の注目度): 1.8396936042059067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning models are often trained to predict the outcome resulting
from a human decision. For example, if a doctor decides to test a patient for
disease, will the patient test positive? A challenge is that historical
decision-making determines whether the outcome is observed: we only observe
test outcomes for patients doctors historically tested. Untested patients, for
whom outcomes are unobserved, may differ from tested patients along observed
and unobserved dimensions. We propose a Bayesian model class which captures
this setting. The purpose of the model is to accurately estimate risk for both
tested and untested patients. Estimating this model is challenging due to the
wide range of possibilities for untested patients. To address this, we propose
two domain constraints which are plausible in health settings: a prevalence
constraint, where the overall disease prevalence is known, and an expertise
constraint, where the human decision-maker deviates from purely risk-based
decision-making only along a constrained feature set. We show theoretically and
on synthetic data that domain constraints improve parameter inference. We apply
our model to a case study of cancer risk prediction, showing that the model's
inferred risk predicts cancer diagnoses, its inferred testing policy captures
known public health policies, and it can identify suboptimalities in test
allocation. Though our case study is in healthcare, our analysis reveals a
general class of domain constraints which can improve model estimation in many
settings.
- Abstract(参考訳): 機械学習モデルは、しばしば人間の決定による結果を予測するために訓練される。
例えば、ある医師が患者の病気の検査を決めた場合、患者は陽性か?
課題は、歴史的意思決定が結果が観察されるかどうかを判断することであり、我々は歴史的に検査された患者のテスト結果のみを観察する。
結果が得られない未検査の患者は、観察された範囲や観察されていない範囲で検査された患者と異なる場合がある。
この設定を捉えるベイズモデルクラスを提案する。
このモデルの目的は、検査と未検査の両方の患者のリスクを正確に見積もることである。
未検査患者の幅広い可能性のために、このモデルの推定は困難である。
そこで,本論文では, 健康状態において有効な2つの領域の制約を提案する。病原性制約, 全体の病原性が知られていること, および, ヒトの意思決定者が, 制約された特徴セットに沿ってのみ、純粋にリスクベースの意思決定から逸脱する専門的制約である。
領域制約がパラメータ推論を改善するという,理論的および合成データについて述べる。
本研究は, がんリスク予測のケーススタディに適用し, そのモデルが癌診断を予測し, その推定テストポリシが既知の公衆衛生政策を捉え, テストアロケーションにおける準最適性を同定できることを示す。
我々のケーススタディは医療分野ですが、多くの環境でモデル推定を改善することのできる、ドメイン制約の一般的なクラスを明らかにしています。
関連論文リスト
- Ethical considerations of use of hold-out sets in clinical prediction model management [0.4194295877935868]
我々は、善意、非正当性、自律性、正義の倫理的原則に焦点をあてる。
また,様々なホールドアウトセットサンプリング手法による統計的問題についても論じる。
論文 参考訳(メタデータ) (2024-06-05T11:42:46Z) - Towards a Transportable Causal Network Model Based on Observational
Healthcare Data [1.333879175460266]
本稿では,選択図,不足グラフ,因果発見,事前知識を1つのグラフィカルモデルに組み合わせた新しい手法を提案する。
このモデルは、患者の2つの異なるコホートからなるデータから学習する。
結果として得られた因果ネットワークモデルは、リスク評価、正確性、説明可能性の観点から専門家臨床医によって検証される。
論文 参考訳(メタデータ) (2023-11-13T13:23:31Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Diagnosis Uncertain Models For Medical Risk Prediction [80.07192791931533]
本研究は, 患者の診断にはアクセスできない, バイタルサイン, 検査値, 既往歴にアクセス可能な患者リスクモデルについて考察する。
このようなすべての原因のリスクモデルが、診断全体にわたって良い一般化を持つが、予測可能な障害モードを持つことが示される。
患者診断の不確実性から生じるリスク予測の不確実性を明示的にモデル化し,この問題に対する対策を提案する。
論文 参考訳(メタデータ) (2023-06-29T23:36:04Z) - Counterfactual Prediction Under Outcome Measurement Error [29.071173441651734]
本研究では、過去の意思決定方針から結果測定誤差、治療効果、選択バイアスによって導入されたモデル信頼性に対する交差脅威について検討する。
我々は,これらの課題の複合効果を補正するリスク最小化手法を開発した。
論文 参考訳(メタデータ) (2023-02-22T03:34:19Z) - What Do You See in this Patient? Behavioral Testing of Clinical NLP
Models [69.09570726777817]
本稿では,入力の変化に関する臨床結果モデルの振る舞いを評価する拡張可能なテストフレームワークを提案する。
私たちは、同じデータを微調整しても、モデル行動は劇的に変化し、最高のパフォーマンスのモデルが常に最も医学的に可能なパターンを学習していないことを示しています。
論文 参考訳(メタデータ) (2021-11-30T15:52:04Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - Uncertainty estimation for classification and risk prediction on medical
tabular data [0.0]
本研究は,医療データの分類とリスク予測のための不確実性推定の理解を深めるものである。
医療などのデータ共有分野において、モデルの予測の不確実性を測定する能力は、意思決定支援ツールの改善につながる可能性がある。
論文 参考訳(メタデータ) (2020-04-13T08:46:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。