論文の概要: Inference of Dependency Knowledge Graph for Electronic Health Records
- arxiv url: http://arxiv.org/abs/2312.15611v1
- Date: Mon, 25 Dec 2023 04:45:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 17:31:54.850379
- Title: Inference of Dependency Knowledge Graph for Electronic Health Records
- Title(参考訳): 電子健康記録における依存知識グラフの推測
- Authors: Zhiwei Xu, Ziming Gan, Doudou Zhou, Shuting Shen, Junwei Lu, Tianxi
Cai
- Abstract要約: 動的対数線形トピックモデルに基づくスパース知識グラフの導出フレームワークを提案する。
このモデルでは、経験的ポイントワイド相互情報行列上で特異値分解を行うことにより、KG埋め込みを推定する。
次に、KG低ランク推定器のエントリーワイド正規度を確立し、制御されたI型誤差によるスパースグラフエッジの回復を可能にする。
- 参考スコア(独自算出の注目度): 13.35941801610195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The effective analysis of high-dimensional Electronic Health Record (EHR)
data, with substantial potential for healthcare research, presents notable
methodological challenges. Employing predictive modeling guided by a knowledge
graph (KG), which enables efficient feature selection, can enhance both
statistical efficiency and interpretability. While various methods have emerged
for constructing KGs, existing techniques often lack statistical certainty
concerning the presence of links between entities, especially in scenarios
where the utilization of patient-level EHR data is limited due to privacy
concerns. In this paper, we propose the first inferential framework for
deriving a sparse KG with statistical guarantee based on the dynamic log-linear
topic model proposed by \cite{arora2016latent}. Within this model, the KG
embeddings are estimated by performing singular value decomposition on the
empirical pointwise mutual information matrix, offering a scalable solution. We
then establish entrywise asymptotic normality for the KG low-rank estimator,
enabling the recovery of sparse graph edges with controlled type I error. Our
work uniquely addresses the under-explored domain of statistical inference
about non-linear statistics under the low-rank temporal dependent models, a
critical gap in existing research. We validate our approach through extensive
simulation studies and then apply the method to real-world EHR data in
constructing clinical KGs and generating clinical feature embeddings.
- Abstract(参考訳): 高次元電子健康記録(EHR)データの効果的な分析は、医療研究にかなりの可能性を秘めている。
効率的な特徴選択を可能にする知識グラフ(kg)による予測モデリングを用いることで、統計的効率と解釈可能性の両方を高めることができる。
kgを構築するための様々な方法が登場しているが、既存の技術では、特にプライバシー上の懸念から患者レベルのehrデータの利用が制限されるシナリオにおいて、エンティティ間のリンクの存在に関する統計的確実性が欠如している。
本稿では, \cite{arora2016latent} によって提案された動的対数線形トピックモデルに基づく統計的保証付きスパース kg を導出するための最初の推論フレームワークを提案する。
このモデルでは、KG埋め込みは経験的ポイントワイド相互情報行列上で特異値分解を行い、スケーラブルな解を提供する。
次に、kg低ランク推定器の入出力漸近正規性を確立し、タイプiの誤差を制御したスパースグラフエッジの回復を可能にした。
本研究は,既存の研究における重要なギャップである低ランク時間依存モデルの下での非線形統計量に関する,未熟な統計的推論領域に一意的に取り組んだものである。
そこで本研究では,本手法を実世界のehrデータに適用し,臨床kgsの構築と臨床特徴の埋め込みを行う。
関連論文リスト
- Addressing Data Heterogeneity in Federated Learning of Cox Proportional Hazards Models [8.798959872821962]
本稿では,フェデレーションサバイバル分析の分野,特にCox Proportional Hazards(CoxPH)モデルについて概説する。
本稿では,合成データセットと実世界のアプリケーション間のモデル精度を向上させるために,特徴ベースのクラスタリングを用いたFLアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-20T18:34:20Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - TACCO: Task-guided Co-clustering of Clinical Concepts and Patient Visits for Disease Subtyping based on EHR Data [42.96821770394798]
TACCOは、EMHデータのハイパーグラフモデリングに基づいて、臨床概念と患者訪問のクラスターを共同で発見する新しいフレームワークである。
我々は,表現型分類と心血管リスク予測の下流臨床課題に対して,公共MIMIC-IIIデータセットとエモリー内部CRADLEデータセットを用いて実験を行った。
深層モデル解析,クラスタリング結果解析,臨床ケーススタディは,TACCOが提供した改良されたユーティリティと洞察に富んだ解釈をさらに検証する。
論文 参考訳(メタデータ) (2024-06-14T14:18:38Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Knowledge Graph Embedding with Electronic Health Records Data via Latent
Graphical Block Model [13.398292423857756]
潜在的グラフィカルブロックモデル (LGBM) を用いて, EHR特徴量間の条件依存構造を推定する。
提案した推定器の統計率を確立し,ブロック構造の完全回復を示す。
論文 参考訳(メタデータ) (2023-05-31T16:18:46Z) - Causal Inference via Nonlinear Variable Decorrelation for Healthcare
Applications [60.26261850082012]
線形および非線形共振の両方を扱う可変デコリレーション正規化器を用いた新しい手法を提案する。
我々は、モデル解釈可能性を高めるために、元の特徴に基づくアソシエーションルールマイニングを用いた新しい表現として、アソシエーションルールを採用する。
論文 参考訳(メタデータ) (2022-09-29T17:44:14Z) - Tree-Guided Rare Feature Selection and Logic Aggregation with Electronic
Health Records Data [7.422597776308963]
希少な二項特徴を持つ大規模回帰のための木誘導的特徴選択と論理集約手法を提案する。
EHRデータを用いた自殺リスクスタディでは、我々のアプローチは、以前のメンタルヘルス診断を選択して集約することができる。
論文 参考訳(メタデータ) (2022-06-18T03:52:43Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。