論文の概要: Enhancing Phenotype Discovery in Electronic Health Records through Prior Knowledge-Guided Unsupervised Learning
- arxiv url: http://arxiv.org/abs/2511.02102v1
- Date: Mon, 03 Nov 2025 22:25:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:05.698561
- Title: Enhancing Phenotype Discovery in Electronic Health Records through Prior Knowledge-Guided Unsupervised Learning
- Title(参考訳): 事前知識指導型教師なし学習による電子健康記録における現象型発見の促進
- Authors: Melanie Mayer, Kimberly Lactaoen, Gary E. Weissman, Blanca E. Himes, Rebecca A. Hubbard,
- Abstract要約: 表現型化のためのベイジアン潜在クラスフレームワークを運用する。
2型(T2)炎症の特徴により,喘息サブフェノタイプが同定された。
- 参考スコア(独自算出の注目度): 1.0414011156637284
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objectives: Unsupervised learning with electronic health record (EHR) data has shown promise for phenotype discovery, but approaches typically disregard existing clinical information, limiting interpretability. We operationalize a Bayesian latent class framework for phenotyping that incorporates domain-specific knowledge to improve clinical meaningfulness of EHR-derived phenotypes and illustrate its utility by identifying an asthma sub-phenotype informed by features of Type 2 (T2) inflammation. Materials and methods: We illustrate a framework for incorporating clinical knowledge into a Bayesian latent class model via informative priors to guide unsupervised clustering toward clinically relevant subgroups. This approach models missingness, accounting for potential missing-not-at-random patterns, and provides patient-level probabilities for phenotype assignment with uncertainty. Using reusable and flexible code, we applied the model to a large asthma EHR cohort, specifying informative priors for T2 inflammation-related features and weakly informative priors for other clinical variables, allowing the data to inform posterior distributions. Results and Conclusion: Using encounter data from January 2017 to February 2024 for 44,642 adult asthma patients, we found a bimodal posterior distribution of phenotype assignment, indicating clear class separation. The T2 inflammation-informed class (38.7%) was characterized by elevated eosinophil levels and allergy markers, plus high healthcare utilization and medication use, despite weakly informative priors on the latter variables. These patterns suggest an "uncontrolled T2-high" sub-phenotype. This demonstrates how our Bayesian latent class modeling approach supports hypothesis generation and cohort identification in EHR-based studies of heterogeneous diseases without well-established phenotype definitions.
- Abstract(参考訳): 目的:電子健康記録(EHR)データを用いた教師なし学習は表現型発見の可能性を示唆しているが、アプローチは通常既存の臨床情報を無視し、解釈可能性を制限する。
EHR由来の表現型の臨床的意義を高めるために、ドメイン固有の知識を取り入れた表現型のためのベイジアン潜在クラスフレームワークを運用し、第2型(T2)炎症の特徴によって誘導される喘息サブフェノタイプを同定し、その有用性を説明する。
資料と方法: 臨床知識をベイジアン潜在クラスモデルに組み込むための枠組みについて, 教師なしクラスタリングを臨床関連サブグループへ導くための情報的事前情報を用いて説明する。
このアプローチは、失明をモデル化し、潜在的に失明しないランダムパターンを考慮し、不確実性を伴う表現型代入に対する患者レベルの確率を提供する。
再利用可能なフレキシブルなコードを用いて,T2炎症関連特徴と,他の臨床変数に対する弱い情報的先行性を指定することで,大喘息 EHR コーホートにモデルを適用した。
結果と結論: 成人喘息44,642例を対象に, 2017年1月から2024年2月にかけての出会うデータを用いて, 表現型代入の2モーダル後部分布が明らかであった。
T2炎症インフォームドクラス(38.7%)は、好酸球レベルとアレルギーマーカーの上昇、高医療利用と薬物使用が特徴である。
これらのパターンは、"制御されていないT2ハイ"サブフェノタイプを示唆している。
このことは、EHRに基づく表現型定義のない異種疾患の研究において、ベイジアン潜在クラスモデリングが仮説生成とコホート同定をどのようにサポートするかを示す。
関連論文リスト
- A Weakly Supervised Transformer for Rare Disease Diagnosis and Subphenotyping from EHRs with Pulmonary Case Studies [28.253741893497136]
WEST(Wakly Supervised Transformer for rare disease phenotyping and subphenotyping from EHRs)を提案する。
ボストン小児病院のEHRデータを用いて2つの稀な肺疾患についてWESTを評価し, 表現型分類, 臨床的に有意な亜フェノタイプ同定, 疾患進行の予測において, 既存の方法よりも優れていることを示した。
論文 参考訳(メタデータ) (2025-07-01T23:11:20Z) - Supervised Coupled Matrix-Tensor Factorization (SCMTF) for Computational Phenotyping of Patient Reported Outcomes in Ulcerative Colitis [1.2545963971598164]
フェノタイピング(英: Phenotyping)とは、異なるタイプの疾患の進行を識別するために、患者のグループを識別する過程である。
患者が報告した症状は、通常、他のデータタイプよりも騒々しく、主観的で、はるかに疎外である。
本稿では,新しい教師付き行列-テンソル因子化法(SCMTF)を用いて,患者報告結果(PROs)を活用するための計算表現型の適用について検討する。
論文 参考訳(メタデータ) (2025-06-24T23:55:11Z) - On the Within-class Variation Issue in Alzheimer's Disease Detection [66.70233526150723]
Alzheimer's Disease (AD) 検出では、ADと非ADの個人を区別するために、機械学習の分類モデルを使用している。
そこで本研究では,サンプルスコア推定器を用いて,認知的スコアと整合した標本特異的なソフトスコアを生成できることを確認した。
ソフトターゲット蒸留(SoTD)とインスタンスレベルの再分散(InRe)の2つの簡易かつ効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-09-22T02:06:05Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Prediction of drug effectiveness in rheumatoid arthritis patients based
on machine learning algorithms [2.5759046095742453]
慢性関節リウマチ(RA)は、患者の免疫系が誤って自身の組織を標的としたときに引き起こされる自己免疫疾患である。
機械学習(ML)は、患者の電子的健康記録のパターンを特定し、患者の結果を改善する最良の臨床治療を予測する可能性がある。
本研究は, 臨床データから情報を取り出すためのデータ処理パイプラインを設計し, 機能的使用のために前処理し, 2) 薬物に対するRA患者の反応を予測し, 分類モデルの性能を評価するためのTNFフレームワークを導入した。
論文 参考訳(メタデータ) (2022-10-14T15:15:37Z) - Unsupervised EHR-based Phenotyping via Matrix and Tensor Decompositions [0.6875312133832078]
本稿では,低ランク近似に基づく計算表現法について概観する。
近年,様々な制約を組み込んだ低ランクデータ近似手法が開発され,解釈可能性の向上が図られている。
論文 参考訳(メタデータ) (2022-09-01T09:47:27Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Attention-based Neural Bag-of-Features Learning for Sequence Data [143.62294358378128]
2D-Attention (2DA) は、シーケンスデータの一般的なアテンション定式化である。
提案したアテンションモジュールは、最近提案されたNeural Bag of Feature(NBoF)モデルに組み込まれ、学習能力を高める。
実験により,提案手法はNBoFモデルの性能を向上させるだけでなく,ノイズに耐性を持つことを示す。
論文 参考訳(メタデータ) (2020-05-25T17:51:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。