論文の概要: sEHR-CE: Language modelling of structured EHR data for efficient and
generalizable patient cohort expansion
- arxiv url: http://arxiv.org/abs/2211.17121v1
- Date: Wed, 30 Nov 2022 16:00:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 16:12:19.022041
- Title: sEHR-CE: Language modelling of structured EHR data for efficient and
generalizable patient cohort expansion
- Title(参考訳): sEHR-CE: 効率的で一般化可能な患者コホート拡大のための構造化EHRデータの言語モデリング
- Authors: Anna Munoz-Farre, Harry Rose, Sera Aylin Cakiroglu
- Abstract要約: sEHR-CEは、異種臨床データセットの統合表現型化と分析を可能にするトランスフォーマーに基づく新しいフレームワークである。
大規模研究である英国バイオバンクのプライマリ・セカンダリ・ケアデータを用いてアプローチを検証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electronic health records (EHR) offer unprecedented opportunities for
in-depth clinical phenotyping and prediction of clinical outcomes. Combining
multiple data sources is crucial to generate a complete picture of disease
prevalence, incidence and trajectories. The standard approach to combining
clinical data involves collating clinical terms across different terminology
systems using curated maps, which are often inaccurate and/or incomplete. Here,
we propose sEHR-CE, a novel framework based on transformers to enable
integrated phenotyping and analyses of heterogeneous clinical datasets without
relying on these mappings. We unify clinical terminologies using textual
descriptors of concepts, and represent individuals' EHR as sections of text. We
then fine-tune pre-trained language models to predict disease phenotypes more
accurately than non-text and single terminology approaches. We validate our
approach using primary and secondary care data from the UK Biobank, a
large-scale research study. Finally, we illustrate in a type 2 diabetes use
case how sEHR-CE identifies individuals without diagnosis that share clinical
characteristics with patients.
- Abstract(参考訳): 電子健康記録(EHR)は、詳細な臨床表現と臨床結果の予測のための前例のない機会を提供する。
複数のデータソースを組み合わせることは、病気の発生率、発生率、および軌跡の全体像を生成するのに不可欠である。
臨床データを結合する標準的なアプローチは、キュレートされた地図を使用して異なる用語体系をまたいで臨床用語を照合することであり、これはしばしば不正確で不完全である。
本稿では,トランスフォーマーをベースとした新しいフレームワークであるsEHR-CEを提案する。
概念のテキスト記述子を用いて臨床用語を統一し,個人のehrをテキストのセクションとして表現する。
次に, 言語モデルを用いて, 非テキストや単一用語のアプローチよりも, 病気の表現型を正確に予測する。
大規模研究である英国バイオバンクのプライマリケアデータとセカンダリケアデータを用いて,我々のアプローチを検証する。
最後に, 2型糖尿病の症例において, sehr-ceが診断を受けず, 患者と臨床特徴を共有できる個人を識別する方法を示す。
関連論文リスト
- Generative AI for Synthetic Data Across Multiple Medical Modalities: A Systematic Review of Recent Developments and Challenges [2.1835659964186087]
本稿では,様々な医療データ型を合成するための生成モデルについて,体系的に検討する。
本研究は、幅広い医療データモダリティを包含し、様々な生成モデルについて検討する。
論文 参考訳(メタデータ) (2024-06-27T14:00:11Z) - Clustering of Disease Trajectories with Explainable Machine Learning: A Case Study on Postoperative Delirium Phenotypes [13.135589459700865]
本稿では,パーソナライズされたPODリスク予測のための教師付き機械学習と,潜在的POD表現型を明らかにするための教師なしクラスタリング技術を組み合わせたアプローチを提案する。
SHAPの特徴空間におけるクラスタリング患者は,真の表現型を回復し,生の特徴空間におけるクラスタリングに優れることを示した。
論文 参考訳(メタデータ) (2024-05-06T10:05:46Z) - Next Visit Diagnosis Prediction via Medical Code-Centric Multimodal Contrastive EHR Modelling with Hierarchical Regularisation [0.0]
NECHOは,階層的正規化を伴う新しい医用コード中心のマルチモーダル・コントラスト学習フレームワークである。
まず, 医用コード, 人口統計, 臨床ノートを含む多面的情報をネットワーク設計を用いて統合する。
また,EHRデータの階層構造を学習するために,医療オントロジーにおける親レベル情報を用いてモダリティ固有のエンコーダを正規化する。
論文 参考訳(メタデータ) (2024-01-22T01:58:32Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - Leveraging text data for causal inference using electronic health records [1.4182510510164876]
本稿では,電子健康データによる因果推論を支援するためにテキストデータを活用する統一的なフレームワークを提案する。
従来のマッチング分析にテキストデータを組み込むことで、推定処理効果の妥当性を高めることができることを示す。
これらの手法は、臨床データの二次解析範囲を、構造化ERHデータに制限された領域にまで広げる可能性があると考えている。
論文 参考訳(メタデータ) (2023-06-09T16:06:02Z) - This Patient Looks Like That Patient: Prototypical Networks for
Interpretable Diagnosis Prediction from Clinical Text [56.32427751440426]
臨床実践においては、そのようなモデルは正確であるだけでなく、医師に解釈可能で有益な結果を与える必要がある。
本稿では,プロトタイプネットワークに基づく新しい手法であるProtoPatientを紹介する。
利用可能な2つの臨床データセット上でモデルを評価し、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-16T10:12:07Z) - A Multimodal Transformer: Fusing Clinical Notes with Structured EHR Data
for Interpretable In-Hospital Mortality Prediction [8.625186194860696]
臨床ノートと構造化HRデータを融合し,院内死亡率の予測に役立てる新しいマルチモーダルトランスフォーマーを提案する。
そこで本研究では,臨床ノートにおいて重要な単語を選択するための統合的勾配(IG)手法を提案する。
また,臨床 BERT における領域適応型事前訓練とタスク適応型微調整の重要性についても検討した。
論文 参考訳(メタデータ) (2022-08-09T03:49:52Z) - Cross-Lingual Knowledge Transfer for Clinical Phenotyping [55.92262310716537]
本稿では,英語を使わないクリニックに対して,このタスクを実行するための言語間知識伝達戦略について検討する。
ギリシャ語とスペイン語のクリニックに対して,異なる臨床領域のクリニカルノートを活用して,これらの戦略を評価する。
以上の結果から,多言語データを用いることで,臨床表現型モデルが改善され,データの疎度を補うことが可能であることが示唆された。
論文 参考訳(メタデータ) (2022-08-03T08:33:21Z) - MIMO: Mutual Integration of Patient Journey and Medical Ontology for
Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文 参考訳(メタデータ) (2021-07-20T07:04:52Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。