論文の概要: ICD Codes are Insufficient to Create Datasets for Machine Learning: An Evaluation Using All of Us Data for Coccidioidomycosis and Myocardial Infarction
- arxiv url: http://arxiv.org/abs/2407.07997v1
- Date: Wed, 10 Jul 2024 19:02:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-12 21:39:04.208336
- Title: ICD Codes are Insufficient to Create Datasets for Machine Learning: An Evaluation Using All of Us Data for Coccidioidomycosis and Myocardial Infarction
- Title(参考訳): ICD符号は機械学習のためのデータセット作成に十分でない:コクシディオイドマイシン症と心筋梗塞に対する全Usデータを用いた評価
- Authors: Abigail E. Whitlock, Gondy Leroy, Fariba M. Donovan, John N. Galgiani,
- Abstract要約: 医学において、機械学習データセットは、しばしば国際疾患分類(ICD)コードを用いて構築される。
機械学習モデルをトレーニングするデータセットを作成するのに最適なICDコードを決定することを目的としている。
- 参考スコア(独自算出の注目度): 0.7071166713283337
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In medicine, machine learning (ML) datasets are often built using the International Classification of Diseases (ICD) codes. As new models are being developed, there is a need for larger datasets. However, ICD codes are intended for billing. We aim to determine how suitable ICD codes are for creating datasets to train ML models. We focused on a rare and common disease using the All of Us database. First, we compared the patient cohort created using ICD codes for Valley fever (coccidioidomycosis, CM) with that identified via serological confirmation. Second, we compared two similarly created patient cohorts for myocardial infarction (MI) patients. We identified significant discrepancies between these two groups, and the patient overlap was small. The CM cohort had 811 patients in the ICD-10 group, 619 patients in the positive-serology group, and 24 with both. The MI cohort had 14,875 patients in the ICD-10 group, 23,598 in the MI laboratory-confirmed group, and 6,531 in both. Demographics, rates of disease symptoms, and other clinical data varied across our case study cohorts.
- Abstract(参考訳): 医学において、機械学習(ML)データセットは、しばしば国際疾患分類(ICD)コードを用いて構築される。
新しいモデルが開発されているため、より大きなデータセットが必要である。
しかし、ICDコードは請求を意図している。
MLモデルをトレーニングするデータセットを作成するのに最適なICDコードを決定することを目的としている。
われわれはAll of Usデータベースを用いた稀で一般的な疾患に焦点を当てた。
まず,バレー熱 (coccidioidomycosis, CM) のICDコードを用いて作成したコホートと血清学的診断で同定したコホートとの比較を行った。
第2に, 心筋梗塞(MI)患者に対して, 同様に作成した2種類のコホートを比較検討した。
両群間に有意差を認め, 重複例は少なかった。
CMコホートはICD-10群811例, 陽性血清型619例, 両群24例であった。
MIコホートはICD-10群14,875人,MI検査陽性群23,598人,それぞれ6,531人であった。
症例はコホート群で, デモグラフィ, 疾患症状率, その他の臨床データについて検討した。
関連論文リスト
- SMILE-UHURA Challenge -- Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms [60.35639972035727]
公開されている注釈付きデータセットの欠如は、堅牢で機械学習駆動のセグメンテーションアルゴリズムの開発を妨げている。
SMILE-UHURAチャレンジは、7T MRIで取得したTime-of-Flightアンジオグラフィーの注釈付きデータセットを提供することで、公開されている注釈付きデータセットのギャップに対処する。
Diceスコアは、それぞれのデータセットで0.838 $pm$0.066と0.716 $pm$ 0.125まで到達し、平均パフォーマンスは0.804 $pm$ 0.15までになった。
論文 参考訳(メタデータ) (2024-11-14T17:06:00Z) - FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - A Scalable Workflow to Build Machine Learning Classifiers with
Clinician-in-the-Loop to Identify Patients in Specific Diseases [10.658425378457363]
臨床医は、EHR(Electronic Health Records)から疾患のある患者を識別するために、ICD(International Classification of Diseases)などの医療コーディングシステムを利用することができる。
近年の研究では、ICD符号は、実際の臨床実践において特定の疾患に対して、患者を正確に特徴づけることができないことが示唆されている。
本稿では,構造化データと非構造化テキストノートの両方を,NLP,AutoML,Cysian-in-the-Loop機構などの技術で活用するスケーラブルなワークフローを提案する。
論文 参考訳(メタデータ) (2022-05-18T12:24:07Z) - ICDBigBird: A Contextual Embedding Model for ICD Code Classification [71.58299917476195]
文脈単語埋め込みモデルは、複数のNLPタスクにおいて最先端の結果を得た。
ICDBigBirdは、Graph Convolutional Network(GCN)を統合するBigBirdベースのモデルである。
ICD分類作業におけるBigBirdモデルの有効性を実世界の臨床データセットで実証した。
論文 参考訳(メタデータ) (2022-04-21T20:59:56Z) - Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in
Artificial Intelligence [79.038671794961]
我々はUCADI(Unified CT-COVID AI Diagnostic Initiative)を立ち上げ、各ホスト機関でAIモデルを分散的にトレーニングし、独立して実行することができる。
本研究は,中国とイギリスに所在する23の病院で採取した3,336例の胸部CT9,573例について検討した。
論文 参考訳(メタデータ) (2021-11-18T00:43:41Z) - Identifying Ventricular Arrhythmias and Their Predictors by Applying
Machine Learning Methods to Electronic Health Records in Patients With
Hypertrophic Cardiomyopathy(HCM-VAr-Risk Model) [0.3811495093928132]
心室性不整脈(VAr)を有する肥大型心筋症患者を臨床的属性を用いて同定するための機械学習の最初の応用である。
臨床的変数は93例, VArは22例であった。
提案手法では,確立した10個のSCD予測器に加えて,12個の新しいVAr予測器を同定した。
論文 参考訳(メタデータ) (2021-09-19T20:11:07Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - Collaborative residual learners for automatic icd10 prediction using
prescribed medications [45.82374977939355]
本稿では,処方用データのみを用いたicd10符号の自動予測のための協調残差学習モデルを提案する。
平均精度0.71および0.57のマルチラベル分類精度、F1スコア0.57および0.38の0.73および0.44の精度を取得し、患者および外来データセットの主診断をそれぞれ予測します。
論文 参考訳(メタデータ) (2020-12-16T07:07:27Z) - Diagnosis Prevalence vs. Efficacy in Machine-learning Based Diagnostic
Decision Support [9.323255985639499]
電子カルテ特性に基づくICD-9-CM符号の予測を行う。
疾患発生率の低下に伴いF1スコアが低下することが観察された。
統計的分析では, 疾患の有病率と有効性との間には適度な正の相関が認められた。
論文 参考訳(メタデータ) (2020-06-24T13:52:04Z) - How well do U-Net-based segmentation trained on adult cardiac magnetic
resonance imaging data generalise to rare congenital heart diseases for
surgical planning? [2.330464988780586]
先天性心疾患(TOF)患者における肺弁置換術の適応時期は, 主に心室容積と機能に基づく。
過去数年間のいくつかの大きな課題において、U-Netアーキテクチャは提供されたデータに対して印象的な結果を示している。
しかし、臨床実践においては、個々の病理や異なるスキャナー特性から派生した画像特性を考えると、データセットはより多様である。
論文 参考訳(メタデータ) (2020-02-10T08:50:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。