Fugu-MT 論文翻訳(概要): sEHR-CE: Language modelling of structured EHR data for efficient and generalizable patient cohort expansion

論文の概要: sEHR-CE: Language modelling of structured EHR data for efficient and generalizable patient cohort expansion

arxiv url: http://arxiv.org/abs/2211.17121v1
Date: Wed, 30 Nov 2022 16:00:43 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-01 16:12:19.022041
Title: sEHR-CE: Language modelling of structured EHR data for efficient and generalizable patient cohort expansion
Title（参考訳）: sEHR-CE: 効率的で一般化可能な患者コホート拡大のための構造化EHRデータの言語モデリング
Authors: Anna Munoz-Farre, Harry Rose, Sera Aylin Cakiroglu
Abstract要約: sEHR-CEは、異種臨床データセットの統合表現型化と分析を可能にするトランスフォーマーに基づく新しいフレームワークである。大規模研究である英国バイオバンクのプライマリ・セカンダリ・ケアデータを用いてアプローチを検証する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Electronic health records (EHR) offer unprecedented opportunities for in-depth clinical phenotyping and prediction of clinical outcomes. Combining multiple data sources is crucial to generate a complete picture of disease prevalence, incidence and trajectories. The standard approach to combining clinical data involves collating clinical terms across different terminology systems using curated maps, which are often inaccurate and/or incomplete. Here, we propose sEHR-CE, a novel framework based on transformers to enable integrated phenotyping and analyses of heterogeneous clinical datasets without relying on these mappings. We unify clinical terminologies using textual descriptors of concepts, and represent individuals' EHR as sections of text. We then fine-tune pre-trained language models to predict disease phenotypes more accurately than non-text and single terminology approaches. We validate our approach using primary and secondary care data from the UK Biobank, a large-scale research study. Finally, we illustrate in a type 2 diabetes use case how sEHR-CE identifies individuals without diagnosis that share clinical characteristics with patients.
Abstract（参考訳）: 電子健康記録(EHR)は、詳細な臨床表現と臨床結果の予測のための前例のない機会を提供する。複数のデータソースを組み合わせることは、病気の発生率、発生率、および軌跡の全体像を生成するのに不可欠である。臨床データを結合する標準的なアプローチは、キュレートされた地図を使用して異なる用語体系をまたいで臨床用語を照合することであり、これはしばしば不正確で不完全である。本稿では,トランスフォーマーをベースとした新しいフレームワークであるsEHR-CEを提案する。概念のテキスト記述子を用いて臨床用語を統一し,個人のehrをテキストのセクションとして表現する。次に, 言語モデルを用いて, 非テキストや単一用語のアプローチよりも, 病気の表現型を正確に予測する。大規模研究である英国バイオバンクのプライマリケアデータとセカンダリケアデータを用いて,我々のアプローチを検証する。最後に, 2型糖尿病の症例において, sehr-ceが診断を受けず, 患者と臨床特徴を共有できる個人を識別する方法を示す。

関連論文リスト

CURENet: Combining Unified Representations for Efficient Chronic Disease Prediction [24.569877750738286]
CURENetは、構造化されていない臨床ノート、検査結果、患者の時系列データを統合するマルチモーダルモデルである。 CURENetは、さまざまな臨床データ間の複雑な相互作用を捉え、慢性疾患のより信頼性の高い予測モデルを作成することができる。
論文参考訳（メタデータ） (2025-11-14T15:52:22Z)
Integrating Genomics into Multimodal EHR Foundation Models [56.31910745104141]
本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文参考訳（メタデータ） (2025-10-24T15:56:40Z)
Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文参考訳（メタデータ） (2025-05-30T14:42:02Z)
Patient Trajectory Prediction: Integrating Clinical Notes with Transformers [0.0]
本稿では,非構造的臨床ノートをトランスフォーマーベース深層学習モデルに統合し,シーケンシャルな疾患予測を行うアプローチを提案する。 MIMIC-IVデータセットの実験は、提案手法が構造化データのみに依存する従来のモデルよりも優れていることを示した。
論文参考訳（メタデータ） (2025-02-25T09:14:07Z)
Exploring Long-Term Prediction of Type 2 Diabetes Microvascular Complications [4.711968364396988]
2型糖尿病患者の微小血管合併症の予測には,コードに依存しないアプローチを用いる。本手法は,臨床言語モデルを用いて,個々のEHRをテキストとして符号化する。コードに依存しないアプローチがコードベースモデルより優れていることを示す。
論文参考訳（メタデータ） (2024-12-02T09:54:51Z)
Generative AI for Synthetic Data Across Multiple Medical Modalities: A Systematic Review of Recent Developments and Challenges [2.1835659964186087]
本稿では,様々な医療データ型を合成するための生成モデルについて,体系的に検討する。本研究は、幅広い医療データモダリティを包含し、様々な生成モデルについて検討する。
論文参考訳（メタデータ） (2024-06-27T14:00:11Z)
Clustering of Disease Trajectories with Explainable Machine Learning: A Case Study on Postoperative Delirium Phenotypes [13.135589459700865]
本稿では,パーソナライズされたPODリスク予測のための教師付き機械学習と,潜在的POD表現型を明らかにするための教師なしクラスタリング技術を組み合わせたアプローチを提案する。 SHAPの特徴空間におけるクラスタリング患者は,真の表現型を回復し,生の特徴空間におけるクラスタリングに優れることを示した。
論文参考訳（メタデータ） (2024-05-06T10:05:46Z)
Next Visit Diagnosis Prediction via Medical Code-Centric Multimodal Contrastive EHR Modelling with Hierarchical Regularisation [0.0]
NECHOは,階層的正規化を伴う新しい医用コード中心のマルチモーダル・コントラスト学習フレームワークである。まず, 医用コード, 人口統計, 臨床ノートを含む多面的情報をネットワーク設計を用いて統合する。また,EHRデータの階層構造を学習するために,医療オントロジーにおける親レベル情報を用いてモダリティ固有のエンコーダを正規化する。
論文参考訳（メタデータ） (2024-01-22T01:58:32Z)
Radiology Report Generation Using Transformers Conditioned with Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文参考訳（メタデータ） (2023-11-18T14:52:26Z)
Leveraging text data for causal inference using electronic health records [1.4182510510164876]
本稿では,電子健康データによる因果推論を支援するためにテキストデータを活用する統一的なフレームワークを提案する。従来のマッチング分析にテキストデータを組み込むことで、推定処理効果の妥当性を高めることができることを示す。これらの手法は、臨床データの二次解析範囲を、構造化ERHデータに制限された領域にまで広げる可能性があると考えている。
論文参考訳（メタデータ） (2023-06-09T16:06:02Z)
This Patient Looks Like That Patient: Prototypical Networks for Interpretable Diagnosis Prediction from Clinical Text [56.32427751440426]
臨床実践においては、そのようなモデルは正確であるだけでなく、医師に解釈可能で有益な結果を与える必要がある。本稿では,プロトタイプネットワークに基づく新しい手法であるProtoPatientを紹介する。利用可能な2つの臨床データセット上でモデルを評価し、既存のベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (2022-10-16T10:12:07Z)
A Multimodal Transformer: Fusing Clinical Notes with Structured EHR Data for Interpretable In-Hospital Mortality Prediction [8.625186194860696]
臨床ノートと構造化HRデータを融合し,院内死亡率の予測に役立てる新しいマルチモーダルトランスフォーマーを提案する。そこで本研究では,臨床ノートにおいて重要な単語を選択するための統合的勾配(IG)手法を提案する。また,臨床 BERT における領域適応型事前訓練とタスク適応型微調整の重要性についても検討した。
論文参考訳（メタデータ） (2022-08-09T03:49:52Z)
Cross-Lingual Knowledge Transfer for Clinical Phenotyping [55.92262310716537]
本稿では,英語を使わないクリニックに対して,このタスクを実行するための言語間知識伝達戦略について検討する。ギリシャ語とスペイン語のクリニックに対して,異なる臨床領域のクリニカルノートを活用して,これらの戦略を評価する。以上の結果から,多言語データを用いることで,臨床表現型モデルが改善され,データの疎度を補うことが可能であることが示唆された。
論文参考訳（メタデータ） (2022-08-03T08:33:21Z)
MIMO: Mutual Integration of Patient Journey and Medical Ontology for Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文参考訳（メタデータ） (2021-07-20T07:04:52Z)
Predicting Clinical Diagnosis from Patients Electronic Health Records Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文参考訳（メタデータ） (2020-07-15T09:22:55Z)
Trajectories, bifurcations and pseudotime in large clinical datasets: applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文参考訳（メタデータ） (2020-07-07T21:04:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。