論文の概要: A Scalable Workflow to Build Machine Learning Classifiers with
Clinician-in-the-Loop to Identify Patients in Specific Diseases
- arxiv url: http://arxiv.org/abs/2205.08891v1
- Date: Wed, 18 May 2022 12:24:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-19 16:25:40.227144
- Title: A Scalable Workflow to Build Machine Learning Classifiers with
Clinician-in-the-Loop to Identify Patients in Specific Diseases
- Title(参考訳): 臨床応用型機械学習分類器の構築と特定疾患の特定のためのスケーラブルワークフロー
- Authors: Jingqing Zhang, Atri Sharma, Luis Bolanos, Tong Li, Ashwani Tanwar,
Vibhor Gupta, Yike Guo
- Abstract要約: 臨床医は、EHR(Electronic Health Records)から疾患のある患者を識別するために、ICD(International Classification of Diseases)などの医療コーディングシステムを利用することができる。
近年の研究では、ICD符号は、実際の臨床実践において特定の疾患に対して、患者を正確に特徴づけることができないことが示唆されている。
本稿では,構造化データと非構造化テキストノートの両方を,NLP,AutoML,Cysian-in-the-Loop機構などの技術で活用するスケーラブルなワークフローを提案する。
- 参考スコア(独自算出の注目度): 10.658425378457363
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinicians may rely on medical coding systems such as International
Classification of Diseases (ICD) to identify patients with diseases from
Electronic Health Records (EHRs). However, due to the lack of detail and
specificity as well as a probability of miscoding, recent studies suggest the
ICD codes often cannot characterise patients accurately for specific diseases
in real clinical practice, and as a result, using them to find patients for
studies or trials can result in high failure rates and missing out on uncoded
patients. Manual inspection of all patients at scale is not feasible as it is
highly costly and slow.
This paper proposes a scalable workflow which leverages both structured data
and unstructured textual notes from EHRs with techniques including NLP, AutoML
and Clinician-in-the-Loop mechanism to build machine learning classifiers to
identify patients at scale with given diseases, especially those who might
currently be miscoded or missed by ICD codes.
Case studies in the MIMIC-III dataset were conducted where the proposed
workflow demonstrates a higher classification performance in terms of F1 scores
compared to simply using ICD codes on gold testing subset to identify patients
with Ovarian Cancer (0.901 vs 0.814), Lung Cancer (0.859 vs 0.828), Cancer
Cachexia (0.862 vs 0.650), and Lupus Nephritis (0.959 vs 0.855). Also, the
proposed workflow that leverages unstructured notes consistently outperforms
the baseline that uses structured data only with an increase of F1 (Ovarian
Cancer 0.901 vs 0.719, Lung Cancer 0.859 vs 0.787, Cancer Cachexia 0.862 vs
0.838 and Lupus Nephritis 0.959 vs 0.785). Experiments on the large testing set
also demonstrate the proposed workflow can find more patients who are miscoded
or missed by ICD codes. Moreover, interpretability studies are also conducted
to clinically validate the top impact features of the classifiers.
- Abstract(参考訳): 臨床医は、EHR(Electronic Health Records)から疾患のある患者を識別するために、ICD(International Classification of Diseases)のような医療コーディングシステムに依存することがある。
しかし、細部や特異性の欠如やミスコーディングの可能性を考慮し、最近の研究では、icd符号は実際の臨床実践において特定の疾患に対して正確に患者を特徴付けることができないことがしばしば示唆されており、その結果、患者を研究や治験で見つけるために使用すると、高い失敗率と未コード患者への欠如につながる可能性がある。
大規模患者全員の手動検査は、コストが高く、遅いため実現不可能である。
本稿では,ERHの構造化データと非構造化テキストノートの両方をNLP,AutoML,Crician-in-the-Loop機構などの手法で活用し,特定の疾患,特に現在ICDコードで誤コードされたり見逃されたりしている患者を識別するためのスケーラブルなワークフローを提案する。
MIMIC-III データセットのケーススタディでは,Ovarian Cancer (0.901 vs 0.814), Lung Cancer (0.859 vs 0.828), Cancer Cachexia (0.862 vs 0.650), Lupus Nephritis (0.959 vs 0.855) の鑑別にゴールドテストサブセットのICDコードを用いた場合と比較して,F1 スコアより高い分類性能を示した。
また、非構造化ノートを利用するワークフローは、f1の増加(卵巣癌0.901対0.719、肺癌0.859対0.787、癌キャッシュキシア0.862対0.838、ループス腎炎0.959対0.785)でのみ構造化データを使用するベースラインを一貫して上回っている。
大規模なテストセットの実験では、提案されたワークフローにより、ICDコードによって誤コードされたり、見逃されたりした患者がより多く見つかることを示した。
また, 分類器の最もインパクトの高い特徴を臨床的に検証するために, 解釈可能性の研究も行われている。
関連論文リスト
- A Federated Learning Framework for Stenosis Detection [70.27581181445329]
本研究は,冠動脈造影画像(CA)の狭窄検出におけるFL(Federated Learning)の使用について検討した。
アンコナのOspedale Riuniti(イタリア)で取得した200人の患者1219枚の画像を含む2施設の異種データセットについて検討した。
データセット2には、文献で利用可能な90人の患者からの7492のシーケンシャルな画像が含まれている。
論文 参考訳(メタデータ) (2023-10-30T11:13:40Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - A Generalizable Artificial Intelligence Model for COVID-19
Classification Task Using Chest X-ray Radiographs: Evaluated Over Four
Clinical Datasets with 15,097 Patients [6.209420804714487]
トレーニングされたモデルの一般化性は、4つの異なる実世界の臨床データセットを用いて遡及的に評価された。
単一ソースの臨床データセットを使用してトレーニングされたAIモデルは、内部時間テストセットに適用すると、AUCが0.82に達した。
医療画像・データ資源センターが収集した多施設のCOVID-19データセットに適用すると、AUCは0.79に達した。
論文 参考訳(メタデータ) (2022-10-04T04:12:13Z) - Learning to diagnose common thorax diseases on chest radiographs from
radiology reports in Vietnamese [0.33598755777055367]
ベトナムの放射線学報告から情報を抽出し,胸部X線(CXR)画像の正確なラベルを提供するデータ収集・アノテーションパイプラインを提案する。
このことは、ベトナムの放射線学者や臨床医が、国によって異なる可能性のある内因性診断カテゴリと密接に一致したデータに注釈を付けることで、ベトナムの放射線技師や臨床医に利益をもたらす可能性がある。
論文 参考訳(メタデータ) (2022-09-11T06:06:03Z) - Self-supervised contrastive learning of echocardiogram videos enables
label-efficient cardiac disease diagnosis [48.64462717254158]
心エコービデオを用いた自己教師型コントラスト学習手法であるエコーCLRを開発した。
左室肥大症 (LVH) と大動脈狭窄症 (AS) の分類成績は,EchoCLR の訓練により有意に改善した。
EchoCLRは、医療ビデオの表現を学習する能力に特有であり、SSLがラベル付きデータセットからラベル効率の高い疾患分類を可能にすることを実証している。
論文 参考訳(メタデータ) (2022-07-23T19:17:26Z) - A Deep Learning Based Workflow for Detection of Lung Nodules With Chest
Radiograph [0.0]
CXRから肺領域を識別するセグメンテーションモデルを構築し,それを16個のパッチに分割した。
これらのラベル付きパッチを使用して、ディープニューラルネットワーク(DNN)モデルを微調整し、パッチをポジティブまたはネガティブに分類する。
論文 参考訳(メタデータ) (2021-12-19T16:19:46Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - Collaborative residual learners for automatic icd10 prediction using
prescribed medications [45.82374977939355]
本稿では,処方用データのみを用いたicd10符号の自動予測のための協調残差学習モデルを提案する。
平均精度0.71および0.57のマルチラベル分類精度、F1スコア0.57および0.38の0.73および0.44の精度を取得し、患者および外来データセットの主診断をそれぞれ予測します。
論文 参考訳(メタデータ) (2020-12-16T07:07:27Z) - Deep Learning Applied to Chest X-Rays: Exploiting and Preventing
Shortcuts [11.511323714777298]
本稿では,特定の属性を有する患者が興味を抱く可能性が極めて高い,突発性クラススキューの症例について検討する。
深層ネットは、診断の予測を学ぶ際に、性別(AUROC=0.96)や年齢(AUROC=0.90)を含む多くの患者属性を正確に識別できることを示す。
単純な転送学習アプローチは、ショートカットを防止し、優れたパフォーマンスを促進するのに驚くほど効果的である。
論文 参考訳(メタデータ) (2020-09-21T18:52:43Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。