論文の概要: MixEHR-Nest: Identifying Subphenotypes within Electronic Health Records through Hierarchical Guided-Topic Modeling
- arxiv url: http://arxiv.org/abs/2410.13217v1
- Date: Thu, 17 Oct 2024 04:48:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-18 13:20:40.175236
- Title: MixEHR-Nest: Identifying Subphenotypes within Electronic Health Records through Hierarchical Guided-Topic Modeling
- Title(参考訳): MixEHR-Nest:階層的ガイド-トピックモデリングによる電子健康記録中のサブフェノタイプ同定
- Authors: Ruohan Wang, Zilong Wang, Ziyang Song, David Buckeridge, Yue Li,
- Abstract要約: マルチモーダルEHRデータを用いて,数千の疾患からサブフェノタイプトピックを推定する,ガイド付きトピックモデルMixEHR-Nestを提案する。
MixEHR-Nestは、疾患の進行と重症度を予測する表現型ごとに異なるパターンを持つ亜フェノタイプを同定することができる。
- 参考スコア(独自算出の注目度): 11.338180666952894
- License:
- Abstract: Automatic subphenotyping from electronic health records (EHRs)provides numerous opportunities to understand diseases with unique subgroups and enhance personalized medicine for patients. However, existing machine learning algorithms either focus on specific diseases for better interpretability or produce coarse-grained phenotype topics without considering nuanced disease patterns. In this study, we propose a guided topic model, MixEHR-Nest, to infer sub-phenotype topics from thousands of disease using multi-modal EHR data. Specifically, MixEHR-Nest detects multiple subtopics from each phenotype topic, whose prior is guided by the expert-curated phenotype concepts such as Phenotype Codes (PheCodes) or Clinical Classification Software (CCS) codes. We evaluated MixEHR-Nest on two EHR datasets: (1) the MIMIC-III dataset consisting of over 38 thousand patients from intensive care unit (ICU) from Beth Israel Deaconess Medical Center (BIDMC) in Boston, USA; (2) the healthcare administrative database PopHR, comprising 1.3 million patients from Montreal, Canada. Experimental results demonstrate that MixEHR-Nest can identify subphenotypes with distinct patterns within each phenotype, which are predictive for disease progression and severity. Consequently, MixEHR-Nest distinguishes between type 1 and type 2 diabetes by inferring subphenotypes using CCS codes, which do not differentiate these two subtype concepts. Additionally, MixEHR-Nest not only improved the prediction accuracy of short-term mortality of ICU patients and initial insulin treatment in diabetic patients but also revealed the contributions of subphenotypes. For longitudinal analysis, MixEHR-Nest identified subphenotypes of distinct age prevalence under the same phenotypes, such as asthma, leukemia, epilepsy, and depression. The MixEHR-Nest software is available at GitHub: https://github.com/li-lab-mcgill/MixEHR-Nest.
- Abstract(参考訳): エレクトロニック・ヘルス・レコード(EHR)からの自動サブフェノティピングは、独自のサブグループを持つ疾患を理解し、患者のためのパーソナライズド・メディカルを増強する多くの機会を提供する。
しかし、既存の機械学習アルゴリズムは、より理解しやすい特定の疾患に焦点を当てるか、曖昧な疾患パターンを考慮せずに粗い表現型トピックを生成する。
本研究では,マルチモーダルEHRデータを用いて,数千の疾患からサブフェノタイプトピックを推定するためのガイド付きトピックモデルMixEHR-Nestを提案する。
具体的には、MixEHR-Nestは、フェノタイプコード (PheCodes) や臨床分類ソフトウェア (CCS) などの専門家が作成した表現型概念に先立って、各表現型トピックから複数のサブトピックを検出する。
The MIMIC-III dataset consist of a 38000 patients from intensive care unit (ICU) from Beth Israel Deaconess Medical Center (BIDMC) from Boston, USA, (2) care management database PopHR, including 1.30万 patients from Montreal, Canada。
実験の結果,MixEHR-Nestは各表現型に異なるパターンを持つ亜フェノタイプを同定でき,疾患の進行と重症度を予測できることがわかった。
その結果、MixEHR-NestはCCSコードを用いてサブフェノタイプを推論することで、タイプ1とタイプ2の糖尿病を区別し、これら2つのサブタイプ概念を区別しない。
さらに、MixEHR-Nestは、ICU患者の短期死亡の予測精度と糖尿病患者の初期インスリン治療の改善だけでなく、亜フェノタイプの寄与も明らかにした。
縦断的分析では、MixEHR-Nestは喘息、白血病、てんかん、うつ病などの同じ表現型で、年齢の異なる亜フェノタイプを同定した。
MixEHR-NestソフトウェアはGitHubで入手できる。
関連論文リスト
- A Demographic-Conditioned Variational Autoencoder for fMRI Distribution Sampling and Removal of Confounds [49.34500499203579]
変動型オートエンコーダ(VAE)ベースのモデルであるDemoVAEを作成し、人口統計学から fMRI の特徴を推定する。
ユーザが供給する人口動態に基づいて,高品質な合成fMRIデータを生成する。
論文 参考訳(メタデータ) (2024-05-13T17:49:20Z) - Next Visit Diagnosis Prediction via Medical Code-Centric Multimodal Contrastive EHR Modelling with Hierarchical Regularisation [0.0]
NECHOは,階層的正規化を伴う新しい医用コード中心のマルチモーダル・コントラスト学習フレームワークである。
まず, 医用コード, 人口統計, 臨床ノートを含む多面的情報をネットワーク設計を用いて統合する。
また,EHRデータの階層構造を学習するために,医療オントロジーにおける親レベル情報を用いてモダリティ固有のエンコーダを正規化する。
論文 参考訳(メタデータ) (2024-01-22T01:58:32Z) - MixEHR-SurG: a joint proportional hazard and guided topic model for inferring mortality-associated topics from electronic health records [18.87817671852005]
ヘテロジニアスEHRデータとモデル生存ハザードを同時に統合するために、MixEHR-SurGと呼ばれる教師付きトピックモデルを提案する。
これにより、患者死亡に関連するPheCode固有の表現型トピックを推測できる、高度に解釈可能なサバイバルトピックモデルが導かれる。
論文 参考訳(メタデータ) (2023-12-20T22:13:45Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - PheME: A deep ensemble framework for improving phenotype prediction from
multi-modal data [42.56953523499849]
PheMEは, 構造化EHRのマルチモーダルデータを用いたアンサンブル・フレームワークであり, 非構造化臨床ノートを用いて, 正確なフェノタイプ予測を行う。
我々はアンサンブル学習を活用し、単一モーダルモデルと多モーダルモデルからの出力を組み合わせて表現型予測を改善する。
論文 参考訳(メタデータ) (2023-03-19T23:41:04Z) - POPDx: An Automated Framework for Patient Phenotyping across 392,246
Individuals in the UK Biobank Study [8.888983935373574]
本稿では,すべての英国バイオバンク参加者に対して,表現型符号を暗示する表現型認識法について述べる。
英国バイオバンクから392,246人の表現型および健康関連情報を抽出した。
POPDxは1,538個の表現型符号の確率を同時に推定するバイリニア機械学習フレームワークである。
論文 参考訳(メタデータ) (2022-08-23T22:43:39Z) - Supervised multi-specialist topic model with applications on large-scale
electronic health record data [3.322262654060203]
本研究では,MixEHR-Sを,EHRデータから専門分野別トピックを共同推定する。
効率的な推論のために,閉形式崩壊変分推論アルゴリズムを開発した。
MixEHR-Sは3つの応用において、最も予測可能な潜在トピックの中で臨床的に有意義な潜在トピックを授与した。
論文 参考訳(メタデータ) (2021-05-04T01:27:11Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Personalized pathology test for Cardio-vascular disease: Approximate
Bayesian computation with discriminative summary statistics learning [48.7576911714538]
近似計算を用いて生物学的に有意なパラメータを推定するための血小板沈着モデルと推論手法を提案する。
この研究は、CVDの検出と治療のためのパーソナライズされた病理検査の先例のない機会を開く。
論文 参考訳(メタデータ) (2020-10-13T15:20:21Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。