論文の概要: Predicting Metabolic Dysfunction-Associated Steatotic Liver Disease using Machine Learning Methods
- arxiv url: http://arxiv.org/abs/2510.22293v1
- Date: Sat, 25 Oct 2025 13:36:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.025785
- Title: Predicting Metabolic Dysfunction-Associated Steatotic Liver Disease using Machine Learning Methods
- Title(参考訳): 機械学習を用いた代謝障害関連脂肪肝疾患の予測
- Authors: Mary E. An, Paul Griffin, Jonathan G. Stine, Ramakrishna Balakrishnan, Ram Sriram, Soundar Kumara,
- Abstract要約: 我々は、公正で厳密で再現可能なMASLD予測モデルを開発した。
MASLDは米国の成人の33%に影響を与え、最も一般的な慢性肝疾患である。
- 参考スコア(独自算出の注目度): 0.8642326601683298
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Background: Metabolic Dysfunction-Associated Steatotic Liver Disease (MASLD) affects ~33% of U.S. adults and is the most common chronic liver disease. Although often asymptomatic, progression can lead to cirrhosis. Early detection is important, as lifestyle interventions can prevent disease progression. We developed a fair, rigorous, and reproducible MASLD prediction model and compared it to prior methods using a large electronic health record database. Methods: We evaluated LASSO logistic regression, random forest, XGBoost, and a neural network for MASLD prediction using clinical feature subsets, including the top 10 SHAP-ranked features. To reduce disparities in true positive rates across racial and ethnic subgroups, we applied an equal opportunity postprocessing method. Results: This study included 59,492 patients in the training data, 24,198 in the validating data, and 25,188 in the testing data. The LASSO logistic regression model with the top 10 features was selected for its interpretability and comparable performance. Before fairness adjustment, the model achieved AUROC of 0.84, accuracy of 78%, sensitivity of 72%, specificity of 79%, and F1-score of 0.617. After equal opportunity postprocessing, accuracy modestly increased to 81% and specificity to 94%, while sensitivity decreased to 41% and F1-score to 0.515, reflecting the fairness trade-off. Conclusions: We developed the MASER prediction model (MASLD Static EHR Risk Prediction), a LASSO logistic regression model which achieved competitive performance for MASLD prediction (AUROC 0.836, accuracy 77.6%), comparable to previously reported ensemble and tree-based models. Overall, this approach demonstrates that interpretable models can achieve a balance of predictive performance and fairness in diverse patient populations.
- Abstract(参考訳): 背景: 代謝障害関連脂肪肝疾患(MASLD)は、米国の成人の約33%に影響を及ぼし、最も一般的な慢性肝疾患である。
無症候性であることが多いが、進行は肝硬変を引き起こすことがある。
早期発見は、ライフスタイルの介入が疾患の進行を妨げるため重要である。
我々は、公正で厳密で再現可能なMASLD予測モデルを開発し、それを大規模な電子健康記録データベースを用いて以前の手法と比較した。
方法: RASOロジスティック回帰, ランダムフォレスト, XGBoost, および臨床特徴サブセットを用いたMASLD予測のためのニューラルネットワークの評価を行った。
人種と民族の集団間での真の正の比率の格差を減らすために,同程度の機会後処理手法を適用した。
結果: トレーニングデータでは59,492人, 検証データでは24,198人, 検査データでは25,188人であった。
LASSOのロジスティック回帰モデルは、その解釈可能性と同等のパフォーマンスのためにトップ10の機能を持つ。
公正度調整前、AUROCの精度は0.84、精度は78%、感度は72%、特異性は79%、F1スコアは0.617であった。
機会後処理後, 精度は81%, 特異度は94%, 感度は41%, F1スコアは0.515に低下した。
結論:MASER予測モデル (MASLD Static EHR Risk Prediction) は,MASLD予測の競合性能(AUROC 0.836,精度77.6%)を達成したLASSOロジスティック回帰モデルである。
このアプローチは, 多様な患者集団において, 解釈可能なモデルが, 予測性能と公平性のバランスを達成できることを実証する。
関連論文リスト
- An Explainable AI-Enhanced Machine Learning Approach for Cardiovascular Disease Detection and Risk Assessment [0.0]
心臓病は依然として世界的な健康上の問題である。
従来の診断方法では、心臓病のリスクを正確に特定し、管理することができない。
機械学習は、心臓疾患の診断の正確性、効率、スピードを大幅に向上させる可能性がある。
論文 参考訳(メタデータ) (2025-07-15T10:38:38Z) - A SHAP-based explainable multi-level stacking ensemble learning method for predicting the length of stay in acute stroke [3.2906073576204955]
既存の機械学習モデルは、最適以下の予測性能、限定的な一般化可能性を示し、システムレベルの要因を見落としている。
我々は,虚血性脳梗塞と出血性脳梗塞に対する解釈可能な多段階重ねアンサンブルモデルを開発した。
説明可能なアンサンブルモデルは,虚血性脳卒中におけるLOSの延長を効果的に予測する。
出血性脳卒中にはさらなる検証が必要である。
論文 参考訳(メタデータ) (2025-05-30T01:08:26Z) - CRTRE: Causal Rule Generation with Target Trial Emulation Framework [47.2836994469923]
ターゲットトライアルエミュレーションフレームワーク(CRTRE)を用いた因果ルール生成という新しい手法を提案する。
CRTREは、アソシエーションルールの因果効果を推定するためにランダム化トライアル設計原則を適用している。
次に、病気発症予測などの下流アプリケーションにそのような関連ルールを組み込む。
論文 参考訳(メタデータ) (2024-11-10T02:40:06Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Identifying and mitigating bias in algorithms used to manage patients in
a pandemic [4.756860520861679]
現実のデータセットを使用して、新型コロナウイルスの死亡率、人工呼吸器の状態、入院状態を予測するために、ロジスティック回帰モデルが作成された。
モデルではバイアス試験の回数が57%減少した。
キャリブレーション後, 予測モデルの平均感度は0.527から0.955に増加した。
論文 参考訳(メタデータ) (2021-10-30T21:10:56Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Joint Prediction and Time Estimation of COVID-19 Developing Severe
Symptoms using Chest CT Scan [49.209225484926634]
術後に重篤な症状を発症するかどうかを判定するための共同分類法と回帰法を提案する。
提案手法は,各試料の重量を考慮し,外乱の影響を低減し,不均衡な分類の問題を検討する。
提案手法では, 重症症例の予測精度76.97%, 相関係数0.524, 変換時間0.55日差が得られた。
論文 参考訳(メタデータ) (2020-05-07T12:16:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。