論文の概要: MIMIC-IV-Ext-PE: Using a large language model to predict pulmonary embolism phenotype in the MIMIC-IV dataset
- arxiv url: http://arxiv.org/abs/2411.00044v1
- Date: Tue, 29 Oct 2024 19:28:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 21:28:27.373969
- Title: MIMIC-IV-Ext-PE: Using a large language model to predict pulmonary embolism phenotype in the MIMIC-IV dataset
- Title(参考訳): MIMIC-IV-Ext-PE:MIMIC-IVデータセットにおける肺塞栓症表現型予測のための言語モデルの構築
- Authors: B. D. Lam, S. Ma, I. Kovalenko, P. Wang, O. Jafari, A. Li, S. Horng,
- Abstract要約: 肺塞栓症は院内死亡予防の主因である。
研究用のPEラベルを含む大規模な公開データセットは少ない。
我々はCTPAスキャンで得られた全放射線診断報告を抽出し、2名の医師が手動でPE陽性(急性PE)またはPE陰性(PE陰性)と診断した。
我々は、ラベルを自動的に抽出するために、以前に微調整されたBio_ClinicalBERT変換言語モデル、VTE-BERTを適用した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Pulmonary embolism (PE) is a leading cause of preventable in-hospital mortality. Advances in diagnosis, risk stratification, and prevention can improve outcomes. There are few large publicly available datasets that contain PE labels for research. Using the MIMIC-IV database, we extracted all available radiology reports of computed tomography pulmonary angiography (CTPA) scans and two physicians manually labeled the results as PE positive (acute PE) or PE negative. We then applied a previously finetuned Bio_ClinicalBERT transformer language model, VTE-BERT, to extract labels automatically. We verified VTE-BERT's reliability by measuring its performance against manual adjudication. We also compared the performance of VTE-BERT to diagnosis codes. We found that VTE-BERT has a sensitivity of 92.4% and positive predictive value (PPV) of 87.8% on all 19,942 patients with CTPA radiology reports from the emergency room and/or hospital admission. In contrast, diagnosis codes have a sensitivity of 95.4% and PPV of 83.8% on the subset of 11,990 hospitalized patients with discharge diagnosis codes. We successfully add nearly 20,000 labels to CTPAs in a publicly available dataset and demonstrate the external validity of a semi-supervised language model in accelerating hematologic research.
- Abstract(参考訳): 肺塞栓症(PE)は院内死亡予防の主因である。
診断、リスク階層化、予防の進歩は、結果を改善することができる。
研究用のPEラベルを含む大規模な公開データセットは少ない。
MIMIC-IVデータベースを用いてCTPA(CTPA)スキャンで診断し,手動でPE陽性(急性PE)またはPE陰性(PE陰性)と診断した。
次に,前述したBio_ClinicalBERT変換言語モデル,VTE-BERTを適用し,ラベルの自動抽出を行った。
我々はVTE-BERTの信頼性を手動による判断に対して測定することで検証した。
また,VTE-BERTと診断符号を比較した。
VTE-BERTの感度は92.4%であり,緊急時および入院時からCTPA放射線検査を施行した19,942例中87.8%であった。
対照的に、診断符号は95.4%、PVは83.8%であり、退院診断符号を持つ11,990人の入院患者のサブセットである。
我々は、CTPAに2万近いラベルを公開データセットに追加し、血液学的研究を加速する半教師付き言語モデルの外的妥当性を実証した。
関連論文リスト
- Diagnosis of Covid-19 Via Patient Breath Data Using Artificial
Intelligence [0.0]
本研究の目的は、患者の吐き気中の揮発性有機化合物(VOC)を検出することにより、新型コロナウイルスを検出できるPOSCTシステムを開発することである。
2020年12月から2021年3月までにイスタンブール・メディポール・メガ病院で142例の呼吸サンプルを採取した。
Gradient Boosting(グラディエント・ブースティング)アルゴリズムは、新型コロナウイルス陽性患者を予測する場合95%のリコールと、新型コロナウイルス陰性患者を予測する場合の96%の精度を提供する。
論文 参考訳(メタデータ) (2023-01-24T22:00:00Z) - A Novel Implementation of Machine Learning for the Efficient,
Explainable Diagnosis of COVID-19 from Chest CT [0.0]
本研究の目的は、胸部CTスキャンから新型コロナウイルスを機械学習で検出することである。
提案したモデルは0.927の総合精度と0.958の感度を得た。
論文 参考訳(メタデータ) (2022-06-15T18:35:22Z) - Dual-Attention Residual Network for Automatic Diagnosis of COVID-19 [6.941255691176647]
我々は,他の一般的な肺炎患者や正常者から,CT画像を用いてCOVID-19を自動同定する新たな残留ネットワークを提案する。
この方法では、他の2つのクラスと94.7%の精度、93.73%の感度、98.28%の特異性、95.26%のF1スコア、および受信機動作特性曲線(AUC)の0.99の領域を区別することができる。
論文 参考訳(メタデータ) (2021-05-14T11:59:47Z) - Quantification of pulmonary involvement in COVID-19 pneumonia by means
of a cascade oftwo U-nets: training and assessment on multipledatasets using
different annotation criteria [83.83783947027392]
本研究は、新型コロナウイルスの肺病変の同定、セグメント化、定量化のために人工知能(AI)を活用することを目的とする。
2つのU-netのカスケードをベースとした自動解析パイプラインLungQuantシステムを開発した。
LungQuantシステムにおけるCT-Severity Score(CT-SS)の精度も評価した。
論文 参考訳(メタデータ) (2021-05-06T10:21:28Z) - An Explainable AI System for Automated COVID-19 Assessment and Lesion
Categorization from CT-scans [8.694504007704994]
SARS-CoV-2病原体による新型コロナウイルス感染症は、世界中で壊滅的なパンデミックである。
深層学習パラダイムに基づくAIを用いたパイプラインを提案し,CTスキャンによるCOVID-19検出と病変分類を自動化した。
論文 参考訳(メタデータ) (2021-01-28T11:47:35Z) - Identification of Ischemic Heart Disease by using machine learning
technique based on parameters measuring Heart Rate Variability [50.591267188664666]
本研究は,243名の非侵襲的特徴(年齢,性別,左室容積率,HRV15)を用いて,一連のANNの訓練と評価を行った。
最高の結果は、7つの入力パラメータと7つの隠れノードを使用して、トレーニングと検証データセットに対して98.9%と82%の精度で得られた。
論文 参考訳(メタデータ) (2020-10-29T19:14:41Z) - Integrative Analysis for COVID-19 Patient Outcome Prediction [53.11258640541513]
我々は、集中治療室入院の必要性を予測するために、人口統計、バイタルサイン、実験室の所見から、肺不透明度の放射能と非画像の特徴を組み合わせる。
また, 地域性肺炎を含む他の肺疾患にも適用できるが, 地域性肺炎に限らない。
論文 参考訳(メタデータ) (2020-07-20T19:08:50Z) - Predicting COVID-19 Pneumonia Severity on Chest X-ray with Deep Learning [57.00601760750389]
前頭部胸部X線画像の重症度予測モデルを提案する。
このようなツールは、エスカレーションやケアの非エスカレーションに使用できる新型コロナウイルスの肺感染症の重症度を測定することができる。
論文 参考訳(メタデータ) (2020-05-24T23:13:16Z) - 3D Tomographic Pattern Synthesis for Enhancing the Quantification of
COVID-19 [13.424414148963566]
2020年4月12日時点で、コロナウイルス病(COVID-19)は18万人に感染し、11万人以上の死者を出した。
胸部CTで見られる断層像は, 臨床像の重症度と進行度と相関する。
我々は、これらの課題に対処するために、合成データセットを使用して、既存のCOVID-19データベースを拡張することを提案する。
論文 参考訳(メタデータ) (2020-05-05T01:31:40Z) - JCS: An Explainable COVID-19 Diagnosis System by Joint Classification
and Segmentation [95.57532063232198]
新型コロナウイルス感染症2019(COVID-19)は、200カ国以上でパンデミックの流行を引き起こしている。
感染を制御するためには、感染した人々を識別し、分離することが最も重要なステップである。
本稿では,新型コロナウイルスの胸部CT診断をリアルタイムかつ説明可能な,新しい関節分類システム(JCS)を開発した。
論文 参考訳(メタデータ) (2020-04-15T12:30:40Z) - Machine-Learning-Based Multiple Abnormality Prediction with Large-Scale
Chest Computed Tomography Volumes [64.21642241351857]
19,993症例から36,316巻の胸部CTデータセットを収集,解析した。
自由テキストラジオグラフィーレポートから異常ラベルを自動的に抽出するルールベース手法を開発した。
胸部CTボリュームの多臓器・多臓器分類モデルも開発した。
論文 参考訳(メタデータ) (2020-02-12T00:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。