論文の概要: Using natural language processing and structured medical data to
phenotype patients hospitalized due to COVID-19
- arxiv url: http://arxiv.org/abs/2302.01536v1
- Date: Fri, 3 Feb 2023 04:22:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-06 17:21:04.357255
- Title: Using natural language processing and structured medical data to
phenotype patients hospitalized due to COVID-19
- Title(参考訳): 自然言語処理と構造化医療データを用いたCOVID-19感染患者の表現型患者
- Authors: Feier Chang and Jay Krishnan and Jillian H Hurst and Michael E
Yarrington and Deverick J Anderson and Emily C O'Brien and Benjamin A
Goldstein
- Abstract要約: 電子カルテと異なるタイプのデータを用いた新型コロナウイルスの入院患者に対する計算可能な表現型の比較を行った。
我々は自然言語処理を用いてプロバイダノートからのデータとLASSOレグレッションとランダムフォレストを組み込んで分類アルゴリズムに適合させた。
- 参考スコア(独自算出の注目度): 2.921262108965381
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To identify patients who are hospitalized because of COVID-19 as opposed to
those who were admitted for other indications, we compared the performance of
different computable phenotype definitions for COVID-19 hospitalizations that
use different types of data from the electronic health records (EHR), including
structured EHR data elements, provider notes, or a combination of both data
types. And conduct a retrospective data analysis utilizing chart review-based
validation. Participants are 586 hospitalized individuals who tested positive
for SARS-CoV-2 during January 2022. We used natural language processing to
incorporate data from provider notes and LASSO regression and Random Forests to
fit classification algorithms that incorporated structured EHR data elements,
provider notes, or a combination of structured data and provider notes.
Results: Based on a chart review, 38% of 586 patients were determined to be
hospitalized for reasons other than COVID-19 despite having tested positive for
SARS-CoV-2. A classification algorithm that used provider notes had
significantly better discrimination than one that used structured EHR data
elements (AUROC: 0.894 vs 0.841, p < 0.001), and performed similarly to a model
that combined provider notes with structured data elements (AUROC: 0.894 vs
0.893). Assessments of hospital outcome metrics significantly differed based on
whether the population included all hospitalized patients who tested positive
for SARS-CoV-2 versus those who were determined to have been hospitalized due
to COVID-19. This work demonstrates the utility of natural language processing
approaches to derive information related to patient hospitalizations in cases
where there may be multiple conditions that could serve as the primary
indication for hospitalization.
- Abstract(参考訳): 電子健康記録(ehr)から得られた異なる種類のデータを用いて、ehrデータ要素、提供者注記、または両方のデータ型の組み合わせを組み合わせることで、covid-19で入院した患者を、他の徴候で入院した患者ではなく、covid-19で入院した患者を特定するために、covid-19の入院時に異なる計算可能な表現型定義のパフォーマンスを比較した。
チャートレビューに基づく検証を利用してふりかえりデータ分析を行う。
参加者は、2022年1月にSARS-CoV-2陽性の入院者586人である。
自然言語処理を用いて、プロバイダノートとLASSO回帰データとRandom Forestsを用いて、構造化ERHデータ要素、プロバイダノート、あるいは構造化データとプロバイダノートの組み合わせを組み込んだ分類アルゴリズムを適合させた。
結果:sars-cov-2陽性例では586例中38%が新型コロナ以外の理由で入院と判定された。
プロバイダノートを用いた分類アルゴリズムは、構造化ERHデータ要素(AUROC: 0.894 vs 0.841, p < 0.001)を使用したものよりもかなり優れた識別を行い、プロバイダノートと構造化データ要素(AUROC: 0.894 vs 0.893)を組み合わせたモデルと同様に実行された。
SARS-CoV-2陽性の入院患者と、COVID-19により入院したと判断された入院患者とで、病院の成績の指標は明らかに異なっていた。
本研究は,複数の病状がある場合の入院に関連する情報を引き出すための自然言語処理手法の有用性を実証するものである。
関連論文リスト
- A Generalizable Artificial Intelligence Model for COVID-19
Classification Task Using Chest X-ray Radiographs: Evaluated Over Four
Clinical Datasets with 15,097 Patients [6.209420804714487]
トレーニングされたモデルの一般化性は、4つの異なる実世界の臨床データセットを用いて遡及的に評価された。
単一ソースの臨床データセットを使用してトレーニングされたAIモデルは、内部時間テストセットに適用すると、AUCが0.82に達した。
医療画像・データ資源センターが収集した多施設のCOVID-19データセットに適用すると、AUCは0.79に達した。
論文 参考訳(メタデータ) (2022-10-04T04:12:13Z) - A Scalable Workflow to Build Machine Learning Classifiers with
Clinician-in-the-Loop to Identify Patients in Specific Diseases [10.658425378457363]
臨床医は、EHR(Electronic Health Records)から疾患のある患者を識別するために、ICD(International Classification of Diseases)などの医療コーディングシステムを利用することができる。
近年の研究では、ICD符号は、実際の臨床実践において特定の疾患に対して、患者を正確に特徴づけることができないことが示唆されている。
本稿では,構造化データと非構造化テキストノートの両方を,NLP,AutoML,Cysian-in-the-Loop機構などの技術で活用するスケーラブルなワークフローを提案する。
論文 参考訳(メタデータ) (2022-05-18T12:24:07Z) - Lung Ultrasound Segmentation and Adaptation between COVID-19 and
Community-Acquired Pneumonia [0.17159130619349347]
深層ニューラルネットワークを用いた超音声的B線分割作業に着目する。
我々は、COVID-19とCAP肺超音波データの両方を用いて、ネットワークをトレーニングする。
いずれかのタイプの肺疾患を推測する際には、様々な臨床応用が期待できる。
論文 参考訳(メタデータ) (2021-08-06T14:17:51Z) - Quantification of pulmonary involvement in COVID-19 pneumonia by means
of a cascade oftwo U-nets: training and assessment on multipledatasets using
different annotation criteria [83.83783947027392]
本研究は、新型コロナウイルスの肺病変の同定、セグメント化、定量化のために人工知能(AI)を活用することを目的とする。
2つのU-netのカスケードをベースとした自動解析パイプラインLungQuantシステムを開発した。
LungQuantシステムにおけるCT-Severity Score(CT-SS)の精度も評価した。
論文 参考訳(メタデータ) (2021-05-06T10:21:28Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - Classification supporting COVID-19 diagnostics based on patient survey
data [82.41449972618423]
新型コロナウイルス患者の効果的なスクリーニングを可能にするロジスティック回帰とXGBoost分類器が作成された。
得られた分類モデルは、DECODEサービス(decode.polsl.pl)の基礎を提供し、COVID-19病患者のスクリーニング支援に役立てることができる。
このデータセットは、3,000以上のサンプルで構成されており、ポーランドの病院で収集されたアンケートに基づいている。
論文 参考訳(メタデータ) (2020-11-24T17:44:01Z) - Individualized Prediction of COVID-19 Adverse outcomes with MLHO [9.197411456718708]
我々は、反復的な特徴とアルゴリズムの選択を利用して健康状態を予測するエンドツーエンドの機械学習フレームワークを開発した。
入院前患者の健康状態と人口統計を表わす特徴として,約600点を用いた4つの有害な結果のモデル化を行った。
以上の結果から, 人口統計学的変数は, 新型コロナウイルス感染後の副作用の予測因子として重要であるが, 過去の臨床記録の組み入れは, 信頼性の高い予測モデルに欠かせないことが示唆された。
論文 参考訳(メタデータ) (2020-08-10T02:44:52Z) - COMPOSE: Cross-Modal Pseudo-Siamese Network for Patient Trial Matching [70.08786840301435]
本稿では, CrOss-Modal PseudO-SiamEse Network (COMPOSE) を提案する。
実験の結果,患者基準マッチングでは98.0%,患者基準マッチングでは83.7%の精度でAUCに到達できることがわかった。
論文 参考訳(メタデータ) (2020-06-15T21:01:33Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。