論文の概要: Combining Survival Analysis and Machine Learning for Mass Cancer Risk
Prediction using EHR data
- arxiv url: http://arxiv.org/abs/2309.15039v1
- Date: Tue, 26 Sep 2023 16:15:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 12:53:02.560964
- Title: Combining Survival Analysis and Machine Learning for Mass Cancer Risk
Prediction using EHR data
- Title(参考訳): EHRデータを用いた大量癌リスク予測のための生存分析と機械学習の組み合わせ
- Authors: Petr Philonenko, Vladimir Kokh, Pavel Blinov
- Abstract要約: がんスクリーニング法は、しばしば費用がかかり、時間がかかり、大規模に適用が弱い。
高度な人工知能(AI)法は、がんの検出に大いに役立つが、特定のまたは深い医療データを必要とする。
本稿では, EHRデータを用いたがんリスク予測手法を提案する。
- 参考スコア(独自算出の注目度): 1.4544466111038845
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Purely medical cancer screening methods are often costly, time-consuming, and
weakly applicable on a large scale. Advanced Artificial Intelligence (AI)
methods greatly help cancer detection but require specific or deep medical
data. These aspects affect the mass implementation of cancer screening methods.
For these reasons, it is a disruptive change for healthcare to apply AI methods
for mass personalized assessment of the cancer risk among patients based on the
existing Electronic Health Records (EHR) volume.
This paper presents a novel method for mass cancer risk prediction using EHR
data. Among other methods, our one stands out by the minimum data greedy
policy, requiring only a history of medical service codes and diagnoses from
EHR. We formulate the problem as a binary classification. This dataset contains
175 441 de-identified patients (2 861 diagnosed with cancer). As a baseline, we
implement a solution based on a recurrent neural network (RNN). We propose a
method that combines machine learning and survival analysis since these
approaches are less computationally heavy, can be combined into an ensemble
(the Survival Ensemble), and can be reproduced in most medical institutions.
We test the Survival Ensemble in some studies. Firstly, we obtain a
significant difference between values of the primary metric (Average Precision)
with 22.8% (ROC AUC 83.7%, F1 17.8%) for the Survival Ensemble versus 15.1%
(ROC AUC 84.9%, F1 21.4%) for the Baseline. Secondly, the performance of the
Survival Ensemble is also confirmed during the ablation study. Thirdly, our
method exceeds age baselines by a significant margin. Fourthly, in the blind
retrospective out-of-time experiment, the proposed method is reliable in cancer
patient detection (9 out of 100 selected). Such results exceed the estimates of
medical screenings, e.g., the best Number Needed to Screen (9 out of 1000
screenings).
- Abstract(参考訳): 純粋に医療用がんスクリーニング法はしばしば費用がかかり、時間がかかり、大規模に応用できる。
高度な人工知能(AI)法は、がんの検出に大いに役立つが、特定のまたは深い医療データを必要とする。
これらの側面は、がんスクリーニング法の大量実施に影響する。
これらの理由から、既存のElectronic Health Records(EHR)ボリュームに基づいて、がんリスクの大量パーソナライズされた評価にAI手法を適用することは、医療にとって破壊的な変化である。
本稿ではeerrデータを用いた新しい大腸癌リスク予測法を提案する。
その他の方法の1つは、医療サービスコードの歴史とEHRからの診断を必要とせず、最低限のデータ欲求政策によって際立っている。
我々は問題を二分分類として定式化する。
このデータセットは、175人の未同定患者(癌と診断された2,861人)を含む。
ベースラインとして、リカレントニューラルネットワーク(RNN)に基づくソリューションを実装している。
本稿では,機械学習と生存分析を組み合わせた手法を提案する。これらの手法は計算量が少なく,アンサンブル(サバイバルアンサンブル)に組み込むことができ,ほとんどの医療機関で再現できる。
いくつかの研究でサバイバルアンサンブルをテストする。
まず,一次測定値(平均精度)の22.8%(ROC AUC 83.7%, F1 17.8%)と生存アンサンブルの15.1%(ROC AUC 84.9%, F1 21.4%)との有意な差を求める。
第2に、アブレーション研究中にサバイバルアンサンブルのパフォーマンスも確認された。
第3に,本手法は年齢ベースラインを大きく上回っている。
第4に, ブラインド・レトロスペクティブ・オブ・タイム実験において, 提案手法は癌患者検出に信頼性がある(選択した100名中9名)。
これらの結果は、例えば、ベストナンバー・トゥ・スクリーン(1000のスクリーニングのうち9つ)など、医療スクリーニングの見積もりを上回っている。
関連論文リスト
- A Deep Learning Approach for Overall Survival Prediction in Lung Cancer
with Missing Values [1.3821435467741148]
総合生存率(OS)は、患者の状態を示す重要な指標であり、適切な治療とOS率の向上を可能にする。
我々は,NSCLCの文脈において,欠落した値を用いた生存分析の新しい手法を提案する。
OSのアドホックな損失を利用することで、検閲された患者と無検閲の患者の両方、そして時間の経過とともにリスクの変化を説明できる。
論文 参考訳(メタデータ) (2023-07-21T10:01:55Z) - Domain Transfer Through Image-to-Image Translation for Uncertainty-Aware
Prostate Cancer Classification [60.20736568336466]
臨床的に有意なPCa分類のための前立腺mp-MRIの非対位画像変換のための新しいアプローチを提案する。
我々は、明らかなディープラーニングアプローチにより、モデルの不確実性を見積もる。
提案手法は, ROC曲線(AUC)を20%以上改善することを示した。
論文 参考訳(メタデータ) (2023-07-02T05:26:54Z) - Diagnosis Uncertain Models For Medical Risk Prediction [80.07192791931533]
本研究は, 患者の診断にはアクセスできない, バイタルサイン, 検査値, 既往歴にアクセス可能な患者リスクモデルについて考察する。
このようなすべての原因のリスクモデルが、診断全体にわたって良い一般化を持つが、予測可能な障害モードを持つことが示される。
患者診断の不確実性から生じるリスク予測の不確実性を明示的にモデル化し,この問題に対する対策を提案する。
論文 参考訳(メタデータ) (2023-06-29T23:36:04Z) - Cancer-Net BCa-S: Breast Cancer Grade Prediction using Volumetric Deep
Radiomic Features from Synthetic Correlated Diffusion Imaging [82.74877848011798]
乳がんの流行は成長を続けており、2023年には米国で約30万人の女性に影響を及ぼした。
金標準のScarff-Bloom-Richardson(SBR)グレードは、化学療法に対する患者の反応を一貫して示すことが示されている。
本稿では,合成相関拡散(CDI$s$)画像を用いた乳がん鑑定における深層学習の有効性について検討する。
論文 参考訳(メタデータ) (2023-04-12T15:08:34Z) - Artificial intelligence based prediction on lung cancer risk factors
using deep learning [0.0]
早期の症状の捕捉と定義は、患者にとって最も難しい段階の1つである。
深層学習手法を用いて,肺がんを極めて高い精度で検出できるモデルを開発した。
その結果, 精度は94%, 最小損失は0.1%であった。
論文 参考訳(メタデータ) (2023-04-11T08:57:15Z) - EMT-NET: Efficient multitask network for computer-aided diagnosis of
breast cancer [58.720142291102135]
乳腺腫瘍の分類と分別を同時に行うための,効率的で軽量な学習アーキテクチャを提案する。
腫瘍分類ネットワークにセグメンテーションタスクを組み込むことにより,腫瘍領域に着目したバックボーンネットワークで表現を学習する。
腫瘍分類の精度、感度、特異性はそれぞれ88.6%、94.1%、85.3%である。
論文 参考訳(メタデータ) (2022-01-13T05:24:40Z) - Open-Set Recognition of Breast Cancer Treatments [91.3247063132127]
オープンセット認識は、テストサンプルをトレーニングや"未知"から既知のクラスの1つに分類することで、分類タスクを一般化する
乳がん患者データに対して,画像データセットの最先端結果を実現するガウス混合変分オートエンコーダモデルを適用した。
より正確でロバストな分類結果が得られ,F1の平均値が24.5%上昇したばかりでなく,臨床環境への展開性の観点からも,オープンセット認識の再検討を行った。
論文 参考訳(メタデータ) (2022-01-09T04:35:55Z) - DeepMMSA: A Novel Multimodal Deep Learning Method for Non-small Cell
Lung Cancer Survival Analysis [8.78724404464036]
我々は,非小細胞肺癌(NSCLC)生存率解析のための多モード深層学習法,DeepMMSAを提案する。
臨床データと組み合わせてCT画像を活用することにより、医用画像内の豊富な情報を肺がん生存情報に関連付けることができる。
論文 参考訳(メタデータ) (2021-06-12T11:02:14Z) - Automatic Generation of Interpretable Lung Cancer Scoring Models from
Chest X-Ray Images [9.525711971667679]
肺がんは世界中でがんの死因となっている。
深層学習技術は肺がんの診断に有効である。
これらの技術は、まだ医療コミュニティによって承認され、採用されていない。
論文 参考訳(メタデータ) (2020-12-10T04:11:59Z) - Machine Learning Against Cancer: Accurate Diagnosis of Cancer by Machine
Learning Classification of the Whole Genome Sequencing Data [0.0]
我々は,MLAC(Machine Learning Against Cancer)の新たな手法を開発し,完全精度,感度,特異性を実現した。
The Cancer Genome Atlas and Genotype-Tissue Expression project for cancerous and healthy tissues。
論文 参考訳(メタデータ) (2020-09-12T18:51:47Z) - CT-based COVID-19 Triage: Deep Multitask Learning Improves Joint
Identification and Severity Quantification [45.86448200141968]
感染リスクのある患者をできるだけ早期に分離する研究を優先するための新型コロナウイルスの同定、重度定量化、重篤な患者の研究の強調、病院への誘導、救急医療の提供の2つの基本的な設定について述べる。
両トリアージアプローチを統合するマルチタスクアプローチを提案し、利用可能なラベルを1つのモデルにまとめる畳み込みニューラルネットワークを提案する。
我々は約2000件の公開CT研究をトレーニングし、32件のCOVID-19研究、30件の細菌性肺炎、31件の健常患者、および30件の肺病理患者からなる慎重に設計したセットを用いて、典型的な患者の血流をエミュレートする。
論文 参考訳(メタデータ) (2020-06-02T08:05:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。