論文の概要: Binary Gaussian Copula Synthesis: A Novel Data Augmentation Technique to
Advance ML-based Clinical Decision Support Systems for Early Prediction of
Dialysis Among CKD Patients
- arxiv url: http://arxiv.org/abs/2403.00965v1
- Date: Fri, 1 Mar 2024 20:32:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 15:48:05.687863
- Title: Binary Gaussian Copula Synthesis: A Novel Data Augmentation Technique to
Advance ML-based Clinical Decision Support Systems for Early Prediction of
Dialysis Among CKD Patients
- Title(参考訳): 二元ガウスコプラ合成法 : CKD患者の早期透析予測のためのMLに基づく臨床診断支援システムのための新しいデータ拡張法
- Authors: Hamed Khosravi, Srinjoy Das, Abdullah Al-Mamun, Imtiaz Ahmed
- Abstract要約: アメリカ疾病管理センターは、米国成人3700万人以上が慢性腎臓病(CKD)を患っていると推定している。
このうち10人のうち9人は、早期に症状がないことから、自分の状態に気付いていない。
透析の早期予測は、患者の結果を大幅に改善できるため、重要である。
- 参考スコア(独自算出の注目度): 4.80104397397529
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The Center for Disease Control estimates that over 37 million US adults
suffer from chronic kidney disease (CKD), yet 9 out of 10 of these individuals
are unaware of their condition due to the absence of symptoms in the early
stages. It has a significant impact on patients' quality of life, particularly
when it progresses to the need for dialysis. Early prediction of dialysis is
crucial as it can significantly improve patient outcomes and assist healthcare
providers in making timely and informed decisions. However, developing an
effective machine learning (ML)-based Clinical Decision Support System (CDSS)
for early dialysis prediction poses a key challenge due to the imbalanced
nature of data. To address this challenge, this study evaluates various data
augmentation techniques to understand their effectiveness on real-world
datasets. We propose a new approach named Binary Gaussian Copula Synthesis
(BGCS). BGCS is tailored for binary medical datasets and excels in generating
synthetic minority data that mirrors the distribution of the original data.
BGCS enhances early dialysis prediction by outperforming traditional methods in
detecting dialysis patients. For the best ML model, Random Forest, BCGS
achieved a 72% improvement, surpassing the state-of-the-art augmentation
approaches. Also, we present a ML-based CDSS, designed to aid clinicians in
making informed decisions. CDSS, which utilizes decision tree models, is
developed to improve patient outcomes, identify critical variables, and thereby
enable clinicians to make proactive decisions, and strategize treatment plans
effectively for CKD patients who are more likely to require dialysis in the
near future. Through comprehensive feature analysis and meticulous data
preparation, we ensure that the CDSS's dialysis predictions are not only
accurate but also actionable, providing a valuable tool in the management and
treatment of CKD.
- Abstract(参考訳): 疾病管理センターは、米国の成人3700万人以上が慢性腎臓病(CKD)に罹患していると推定している。
特に透析の必要性が増すと、患者の生活の質に大きな影響を及ぼす。
透析の早期予測は、患者の成果を大幅に改善し、医療提供者の時間的および情報的意思決定を支援するため、重要である。
しかし、早期透析予測のための効果的な機械学習(ML)ベースの臨床決定支援システム(CDSS)の開発は、データの不均衡性のために重要な課題となっている。
この課題に対処するため,本研究では,実世界のデータセット上での有効性を理解するために,様々なデータ拡張手法を評価する。
本稿では,BGCS (Binary Gaussian Copula Synthesis) という新しい手法を提案する。
BGCSはバイナリ医療データセット用に調整されており、元のデータの分布を反映した合成マイノリティデータの生成に優れています。
bgcsは、従来の透析患者検出法を上回ることで、早期透析予測を促進する。
最高のMLモデルであるRandom Forestでは、BCGSは72%の改善を達成し、最先端のAugmentationアプローチを上回った。
また,臨床医の意思決定支援を目的としたMLベースのCDSSを提案する。
決定木モデルを用いたCDSSは、患者の結果を改善し、重要な変数を特定し、臨床医が積極的に意思決定できるようにし、近い将来透析を必要とする可能性の高いCKD患者に対して効果的に治療計画を策定する。
包括的特徴分析と綿密なデータ準備を通じて,CDSSの透析予測が正確であるだけでなく,有効であることを確認し,CKDの管理と治療に有用なツールを提供する。
関連論文リスト
- Enhancing End Stage Renal Disease Outcome Prediction: A Multi-Sourced Data-Driven Approach [7.212939068975618]
10,326人のCKD患者のデータを利用して,2009年から2018年までの臨床とクレーム情報を組み合わせた。
24ヶ月の観測窓は早期検出と予測精度のバランスをとるのに最適であると同定された。
2021年のeGFR方程式は予測精度を改善し、特にアフリカ系アメリカ人の偏見を低減した。
論文 参考訳(メタデータ) (2024-10-02T03:21:01Z) - SepsisLab: Early Sepsis Prediction with Uncertainty Quantification and Active Sensing [67.8991481023825]
セプシスは米国での院内死亡の主な原因である。
既存の予測モデルは通常、情報不足の少ない高品質なデータで訓練される。
限られた観察により信頼性の低い高リスク患者に対して,ロバストな能動センシングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-24T04:47:36Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Enhancing Mortality Prediction in Heart Failure Patients: Exploring
Preprocessing Methods for Imbalanced Clinical Datasets [0.0]
心不全 (Heart failure, HF) は、患者の管理決定を導く上で、死亡率の正確な予測が重要な役割を果たす重要な疾患である。
本稿では,スケーリング,アウトレーヤ処理,再サンプリングを含む包括的事前処理フレームワークを提案する。
適切な前処理技術と機械学習(ML)アルゴリズムを活用することで,HF患者の死亡予測性能を向上させることを目指す。
論文 参考訳(メタデータ) (2023-09-30T18:31:15Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Literature-Augmented Clinical Outcome Prediction [10.46990394710927]
EBMとAIベースの臨床モデルとのギャップを埋める技術を導入する。
集中治療(ICU)患者情報に基づいて患者固有の文献を自動的に検索するシステムを提案する。
我々のモデルは,最近の強靭なベースラインと比較して,3つの課題に対する予測精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-11-16T11:19:02Z) - Improvement of a Prediction Model for Heart Failure Survival through
Explainable Artificial Intelligence [0.0]
本研究は、心不全生存予測モデルの説明可能性分析と評価について述べる。
このモデルでは、最高のアンサンブルツリーアルゴリズムを選択できるデータワークフローパイプラインと、最高の機能選択テクニックが採用されている。
本論文の主な貢献は、精度-説明可能性バランスに基づいて、HF生存率の最良の予測モデルを選択するための説明可能性駆動型アプローチである。
論文 参考訳(メタデータ) (2021-08-20T09:03:26Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - Longitudinal modeling of MS patient trajectories improves predictions of
disability progression [2.117653457384462]
本研究は, 実世界の患者データから情報を最適に抽出する作業に対処する。
本研究では,患者軌跡モデリングに適した機械学習手法を用いることで,患者の障害進行を2年間の地平線で予測できることを示す。
文献で利用可能なモデルと比較して、この研究はMS病の進行予測に最も完全な患者履歴を使用する。
論文 参考訳(メタデータ) (2020-11-09T20:48:00Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。