論文の概要: Disparate Model Performance and Stability in Machine Learning Clinical Support for Diabetes and Heart Diseases
- arxiv url: http://arxiv.org/abs/2412.19495v1
- Date: Fri, 27 Dec 2024 07:31:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:28:33.075090
- Title: Disparate Model Performance and Stability in Machine Learning Clinical Support for Diabetes and Heart Diseases
- Title(参考訳): 糖尿病と心臓疾患に対する機械学習臨床支援における異なるモデル性能と安定性
- Authors: Ioannis Bilionis, Ricardo C. Berrios, Luis Fernandez-Luque, Carlos Castillo,
- Abstract要約: 調査により、慢性疾患データセットとその派生した機械学習モデルにおいて、性別と年齢に関連する不等式が広く明らかになった。
25,000人以上の慢性疾患患者のデータを分析したところ、男女差は軽度であり、男性には予測精度が好ましく、若年者には有意な年齢差がみられた。
特に高齢患者では、7つのデータセットで矛盾した予測精度を示し、データの複雑さとモデルの性能が低下した。
- 参考スコア(独自算出の注目度): 2.9247093478805324
- License:
- Abstract: Machine Learning (ML) algorithms are vital for supporting clinical decision-making in biomedical informatics. However, their predictive performance can vary across demographic groups, often due to the underrepresentation of historically marginalized populations in training datasets. The investigation reveals widespread sex- and age-related inequities in chronic disease datasets and their derived ML models. Thus, a novel analytical framework is introduced, combining systematic arbitrariness with traditional metrics like accuracy and data complexity. The analysis of data from over 25,000 individuals with chronic diseases revealed mild sex-related disparities, favoring predictive accuracy for males, and significant age-related differences, with better accuracy for younger patients. Notably, older patients showed inconsistent predictive accuracy across seven datasets, linked to higher data complexity and lower model performance. This highlights that representativeness in training data alone does not guarantee equitable outcomes, and model arbitrariness must be addressed before deploying models in clinical settings.
- Abstract(参考訳): 機械学習(ML)アルゴリズムは、生体情報学における臨床的意思決定を支援するために不可欠である。
しかし、それらの予測性能は、しばしばトレーニングデータセットにおける歴史的に疎外された人口の過小評価のために、人口統計群によって異なる可能性がある。
この調査は、慢性疾患データセットとその派生MLモデルにおいて、性および年齢に関連する幅広い不等式を明らかにする。
このようにして、体系的な任意性と、精度やデータの複雑さといった従来のメトリクスを組み合わせた、新しい分析フレームワークが導入された。
25,000人以上の慢性疾患患者のデータを分析したところ、男女差は軽度であり、男性には予測精度が好ましく、若年者には有意な年齢差がみられた。
特に高齢患者では、7つのデータセットで矛盾した予測精度を示し、データの複雑さとモデルの性能が低下した。
このことは、トレーニングデータ単独における代表性は、公平な結果を保証するものではなく、モデルが臨床環境にデプロイする前には、モデルの任意性に対処する必要があることを強調している。
関連論文リスト
- Enhancing End Stage Renal Disease Outcome Prediction: A Multi-Sourced Data-Driven Approach [7.212939068975618]
10,326人のCKD患者のデータを利用して,2009年から2018年までの臨床とクレーム情報を組み合わせた。
24ヶ月の観測窓は早期検出と予測精度のバランスをとるのに最適であると同定された。
2021年のeGFR方程式は予測精度を改善し、特にアフリカ系アメリカ人の偏見を低減した。
論文 参考訳(メタデータ) (2024-10-02T03:21:01Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Learning and DiSentangling Patient Static Information from Time-series
Electronic HEalth Record (STEER) [3.079694232219292]
医療における機械学習の最近の研究は、患者のプライバシとアルゴリズムの公正性に関する懸念を提起している。
そこで我々は,患者の静的情報を予測するための時系列電子健康記録データの有用性を体系的に検討した。
生の時系列データだけでなく、機械学習モデルから学習した表現も、さまざまな静的情報を予測するためにトレーニングできることがわかった。
論文 参考訳(メタデータ) (2023-09-20T14:54:48Z) - Adapting Machine Learning Diagnostic Models to New Populations Using a Small Amount of Data: Results from Clinical Neuroscience [21.420302408947194]
我々は、ソースグループからのデータを最適に組み合わせ、ターゲットグループで予測する、重み付き経験的リスク最小化手法を開発した。
本研究では,アルツハイマー病の診断と脳年齢推定のためのMLモデルを構築するため,20の神経画像研究から15,363人のマルチソースデータに適用した。
論文 参考訳(メタデータ) (2023-08-06T18:05:39Z) - Disability prediction in multiple sclerosis using performance outcome
measures and demographic data [8.85999610143128]
我々は,多次元,手頃な,物理的,スマートフォンによるパフォーマンス評価尺度(POM)を,人口統計と併用して,疾患の進行を予測する。
我々の知る限りでは、POMと人口統計データを用いて病気の進行を予測することが可能であることを初めて示す。
論文 参考訳(メタデータ) (2022-04-08T09:57:00Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Longitudinal modeling of MS patient trajectories improves predictions of
disability progression [2.117653457384462]
本研究は, 実世界の患者データから情報を最適に抽出する作業に対処する。
本研究では,患者軌跡モデリングに適した機械学習手法を用いることで,患者の障害進行を2年間の地平線で予測できることを示す。
文献で利用可能なモデルと比較して、この研究はMS病の進行予測に最も完全な患者履歴を使用する。
論文 参考訳(メタデータ) (2020-11-09T20:48:00Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。