論文の概要: Knowledge Graph Embedding with Electronic Health Records Data via Latent
Graphical Block Model
- arxiv url: http://arxiv.org/abs/2305.19997v1
- Date: Wed, 31 May 2023 16:18:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 15:23:06.963058
- Title: Knowledge Graph Embedding with Electronic Health Records Data via Latent
Graphical Block Model
- Title(参考訳): 潜在グラフィカルブロックモデルによる電子健康記録データを用いたナレッジグラフ埋め込み
- Authors: Junwei Lu, Jin Yin, Tianxi Cai
- Abstract要約: 潜在的グラフィカルブロックモデル (LGBM) を用いて, EHR特徴量間の条件依存構造を推定する。
提案した推定器の統計率を確立し,ブロック構造の完全回復を示す。
- 参考スコア(独自算出の注目度): 13.398292423857756
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the increasing adoption of electronic health records (EHR), large
scale EHRs have become another rich data source for translational clinical
research. Despite its potential, deriving generalizable knowledge from EHR data
remains challenging. First, EHR data are generated as part of clinical care
with data elements too detailed and fragmented for research. Despite recent
progress in mapping EHR data to common ontology with hierarchical structures,
much development is still needed to enable automatic grouping of local EHR
codes to meaningful clinical concepts at a large scale. Second, the total
number of unique EHR features is large, imposing methodological challenges to
derive reproducible knowledge graph, especially when interest lies in
conditional dependency structure. Third, the detailed EHR data on a very large
patient cohort imposes additional computational challenge to deriving a
knowledge network. To overcome these challenges, we propose to infer the
conditional dependency structure among EHR features via a latent graphical
block model (LGBM). The LGBM has a two layer structure with the first providing
semantic embedding vector (SEV) representation for the EHR features and the
second overlaying a graphical block model on the latent SEVs. The block
structures on the graphical model also allows us to cluster synonymous features
in EHR. We propose to learn the LGBM efficiently, in both statistical and
computational sense, based on the empirical point mutual information matrix. We
establish the statistical rates of the proposed estimators and show the perfect
recovery of the block structure. Numerical results from simulation studies and
real EHR data analyses suggest that the proposed LGBM estimator performs well
in finite sample.
- Abstract(参考訳): 電子健康記録(EHR)の普及により、大規模なEHRは、翻訳臨床研究のためのもう1つの豊富なデータソースとなっている。
その可能性にもかかわらず、EHRデータから一般化可能な知識を導き出すことは依然として困難である。
第一に、EHRデータはデータ要素を詳細に記述しすぎ、研究のために断片化している臨床医療の一部として生成される。
階層構造を持つ共通オントロジーへのEHRデータのマッピングは近年進歩しているが、局所的なEHRコードの自動グループ化を大規模に行うためには、多くの開発が必要である。
第二に、独特なEHRの特徴の総数は膨大であり、特に条件付き依存構造にある場合、再現可能な知識グラフを導出するための方法論的課題を示唆している。
第三に、非常に大きな患者コホート上の詳細なEHRデータは、知識ネットワークの導出にさらなる計算課題を課している。
これらの課題を克服するため,我々は潜伏型グラフィカルブロックモデル(lgbm)を用いてehrの機能間の条件付き依存性構造を推定する。
LGBMは2層構造を持ち、EHRの特徴に対して第1にセマンティック埋め込みベクトル(SEV)表現を提供し、第2に潜伏SEV上のグラフィカルブロックモデルをオーバーレイする。
グラフィカルモデル上のブロック構造は、EHRで同義的な特徴をクラスタリングすることを可能にする。
実験点相互情報行列に基づいて,LGBMを統計的・計算的両面で効率的に学習することを提案する。
提案した推定器の統計率を確立し,ブロック構造の完全回復を示す。
シミュレーション研究と実EHRデータ解析の結果から,提案したLGBM推定器は有限試料で良好に動作したことが示唆された。
関連論文リスト
- FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Recent Advances in Predictive Modeling with Electronic Health Records [71.19967863320647]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - Inference of Dependency Knowledge Graph for Electronic Health Records [13.35941801610195]
動的対数線形トピックモデルに基づくスパース知識グラフの導出フレームワークを提案する。
このモデルでは、経験的ポイントワイド相互情報行列上で特異値分解を行うことにより、KG埋め込みを推定する。
次に、KG低ランク推定器のエントリーワイド正規度を確立し、制御されたI型誤差によるスパースグラフエッジの回復を可能にする。
論文 参考訳(メタデータ) (2023-12-25T04:45:36Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Toward Cohort Intelligence: A Universal Cohort Representation Learning
Framework for Electronic Health Record Analysis [15.137213823470544]
本稿では, 患者間の詳細なコホート情報を活用することで, EHR活用を促進するための共通コホート表現 lEarning (CORE) フレームワークを提案する。
COREは多様なバックボーンモデルに容易に適用でき、コホート情報を医療手法に注入してパフォーマンスを高める普遍的なプラグインフレームワークとして機能する。
論文 参考訳(メタデータ) (2023-04-10T09:12:37Z) - Modeling electronic health record data using a knowledge-graph-embedded
topic model [6.170782354287972]
エンド・ツー・エンドの知識グラフに基づくマルチモーダル組込みトピックモデルであるKG-ETMを提案する。
KG-ETMは、医療知識グラフから埋め込みを学習することで、HRデータから潜伏病トピックを抽出する。
また,本モデルでは,患者層化と薬剤推奨のための解釈可能かつ正確な患者表現も発見できる。
論文 参考訳(メタデータ) (2022-06-03T07:58:17Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - Self-Supervised Graph Learning with Hyperbolic Embedding for Temporal
Health Event Prediction [13.24834156675212]
本稿では,情報フローを組み込んだハイパーボリック埋め込み手法を提案する。
我々は、これらの事前学習された表現をグラフニューラルネットワークに組み込んで、疾患の合併症を検出する。
本稿では,EHRデータを完全に活用する自己教師付き学習フレームワークに,階層型で強化された履歴予測代行タスクを提案する。
論文 参考訳(メタデータ) (2021-06-09T00:42:44Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。