論文の概要: Development and external validation of a lung cancer risk estimation
tool using gradient-boosting
- arxiv url: http://arxiv.org/abs/2308.12188v1
- Date: Wed, 23 Aug 2023 15:25:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 13:44:43.746971
- Title: Development and external validation of a lung cancer risk estimation
tool using gradient-boosting
- Title(参考訳): 勾配ブースティングを用いた肺癌リスク推定ツールの開発と外部検証
- Authors: Pierre-Louis Benveniste, Julie Alberge, Lei Xing, Jean-Emmanuel
Bibault
- Abstract要約: 肺がんは世界中で死亡の重大な原因であり、早期発見が生存率の向上に重要であることを強調している。
我々は,PLCOがんスクリーニング試験のデータに基づいて学習し,NLSTで検証する機械学習(ML)ツールを提案する。
開発されたMLツールは、5年以内に肺がんを発症する可能性を推定するための無償のWebアプリケーションを提供する。
- 参考スコア(独自算出の注目度): 3.200615329024819
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Lung cancer is a significant cause of mortality worldwide, emphasizing the
importance of early detection for improved survival rates. In this study, we
propose a machine learning (ML) tool trained on data from the PLCO Cancer
Screening Trial and validated on the NLST to estimate the likelihood of lung
cancer occurrence within five years. The study utilized two datasets, the PLCO
(n=55,161) and NLST (n=48,595), consisting of comprehensive information on risk
factors, clinical measurements, and outcomes related to lung cancer. Data
preprocessing involved removing patients who were not current or former smokers
and those who had died of causes unrelated to lung cancer. Additionally, a
focus was placed on mitigating bias caused by censored data. Feature selection,
hyper-parameter optimization, and model calibration were performed using
XGBoost, an ensemble learning algorithm that combines gradient boosting and
decision trees. The ML model was trained on the pre-processed PLCO dataset and
tested on the NLST dataset. The model incorporated features such as age,
gender, smoking history, medical diagnoses, and family history of lung cancer.
The model was well-calibrated (Brier score=0.044). ROC-AUC was 82% on the PLCO
dataset and 70% on the NLST dataset. PR-AUC was 29% and 11% respectively. When
compared to the USPSTF guidelines for lung cancer screening, our model provided
the same recall with a precision of 13.1% vs. 9.3% on the PLCO dataset and 3.2%
vs. 3.1% on the NLST dataset. The developed ML tool provides a freely available
web application for estimating the likelihood of developing lung cancer within
five years. By utilizing risk factors and clinical data, individuals can assess
their risk and make informed decisions regarding lung cancer screening. This
research contributes to the efforts in early detection and prevention
strategies, aiming to reduce lung cancer-related mortality rates.
- Abstract(参考訳): 肺がんは世界中で死亡の重要な原因であり、早期発見の重要性を強調している。
本研究では,PLCOがんスクリーニング試験のデータに基づいて学習し,NLSTを用いて5年以内に肺癌の発生確率を推定する機械学習(ML)ツールを提案する。
本研究は, 危険因子, 臨床測定, 肺がん関連結果に関する総合的な情報からなるPLCO (n=55,161) とNLST (n=48,595) の2つのデータセットを用いた。
データの前処理は、現在または以前の喫煙者でない患者と、肺癌と無関係な原因で死亡した患者を除外することであった。
さらに、検閲データによるバイアス軽減にも焦点が当てられた。
勾配向上と決定木を組み合わせたアンサンブル学習アルゴリズムであるXGBoostを用いて,特徴選択,ハイパーパラメータ最適化,モデル校正を行った。
MLモデルはPLCOデータセットでトレーニングされ、NLSTデータセットでテストされた。
このモデルは、年齢、性別、喫煙歴、医療診断、肺癌の家族歴などの特徴を組み込んだ。
モデルは良好に校正された(Brier score=0.044)。
ROC-AUCはPLCOデータセットで82%、NLSTデータセットで70%であった。
PR-AUCはそれぞれ29%,11%であった。
肺がんスクリーニングのためのUSPSTFガイドラインと比較すると、PLCOデータセットでは13.1%対9.3%、NLSTデータセットでは3.2%対3.1%の精度でリコールを行った。
開発されたMLツールは、5年以内に肺がんを発症する可能性を推定するための無償のWebアプリケーションを提供する。
リスクファクターと臨床データを利用することで、個人はリスクを評価し、肺がん検診に関する情報的判断を行うことができる。
本研究は肺がん関連死亡率の低減を目的とした早期発見・予防戦略の取り組みに寄与する。
関連論文リスト
- Improving Lung Cancer Diagnosis and Survival Prediction with Deep Learning and CT Imaging [12.276877277186284]
肺癌は主要ながん関連死亡例であり、早期診断と治療は患者の生存率の向上に不可欠である。
肺がんのリスクと肺のリスクとの間に得られるネットワークの神経畳み込みネットワークをCT実験に応用することを提案する。
以上の結果から, 肺がん発生リスクと肺がん発生リスクの予測に, ミニバッチド・ロスとバイナリ・クロスエントロピーが有効であったことが示唆された。
論文 参考訳(メタデータ) (2024-08-18T05:45:08Z) - Lung-CADex: Fully automatic Zero-Shot Detection and Classification of Lung Nodules in Thoracic CT Images [45.29301790646322]
コンピュータ支援診断は早期の肺結節の検出に役立ち、その後の結節の特徴づけを促進する。
MedSAMと呼ばれるSegment Anything Modelの変種を用いて肺結節をゼロショットでセグメント化するためのCADeを提案する。
また、放射能特徴のギャラリーを作成し、コントラスト学習を通じて画像と画像のペアを整列させることにより、良性/良性としての結節的特徴付けを行うCADxを提案する。
論文 参考訳(メタデータ) (2024-07-02T19:30:25Z) - Pulmonologists-Level lung cancer detection based on standard blood test
results and smoking status using an explainable machine learning approach [2.545682175108217]
肺癌(LC)は、主に後期診断によるがん関連死亡の主な原因である。
近年, 機械学習は, 様々な疾患の発見を容易にすることによって, 医療において大きな可能性を秘めている。
LC検出のための動的アンサンブル選択(DES)に基づくMLモデルを開発した。
論文 参考訳(メタデータ) (2024-02-14T22:00:57Z) - Survival Prediction from Imbalance colorectal cancer dataset using
hybrid sampling methods and tree-based classifiers [0.0]
本稿では,大腸癌患者の1年,3年,5年生存率を予測するアルゴリズムの開発に焦点をあてる。
そこで本研究では,正の正の確率を高めるために,標準バランス手法のパイプラインを生成する手法を提案する。
本手法は大腸癌患者の死亡率予測を有意に改善する。
論文 参考訳(メタデータ) (2023-09-04T19:48:56Z) - Cancer-Net BCa-S: Breast Cancer Grade Prediction using Volumetric Deep
Radiomic Features from Synthetic Correlated Diffusion Imaging [82.74877848011798]
乳がんの流行は成長を続けており、2023年には米国で約30万人の女性に影響を及ぼした。
金標準のScarff-Bloom-Richardson(SBR)グレードは、化学療法に対する患者の反応を一貫して示すことが示されている。
本稿では,合成相関拡散(CDI$s$)画像を用いた乳がん鑑定における深層学習の有効性について検討する。
論文 参考訳(メタデータ) (2023-04-12T15:08:34Z) - Artificial intelligence based prediction on lung cancer risk factors
using deep learning [0.0]
早期の症状の捕捉と定義は、患者にとって最も難しい段階の1つである。
深層学習手法を用いて,肺がんを極めて高い精度で検出できるモデルを開発した。
その結果, 精度は94%, 最小損失は0.1%であった。
論文 参考訳(メタデータ) (2023-04-11T08:57:15Z) - The pitfalls of using open data to develop deep learning solutions for
COVID-19 detection in chest X-rays [64.02097860085202]
深層学習モデルは、胸部X線から新型コロナウイルスを識別するために開発された。
オープンソースデータのトレーニングやテストでは,結果は異例です。
データ分析とモデル評価は、人気のあるオープンソースデータセットであるCOVIDxが実際の臨床問題を代表していないことを示している。
論文 参考訳(メタデータ) (2021-09-14T10:59:11Z) - 3D Neural Network for Lung Cancer Risk Prediction on CT Volumes [0.6810862244331126]
肺がんはアメリカ合衆国で最も多いがん死の原因である。
肺がんCT検査は、死亡率を40%まで下げることが示されている。
放射線診断の基準が採用されているにもかかわらず, 経年変化が持続的であり, 包括的画像所見の不完全な特徴が現在の方法の限界として残っている。
本稿では,肺がんリスク予測のための最先端ディープラーニングアルゴリズムを再現する。
論文 参考訳(メタデータ) (2020-07-25T10:01:22Z) - Integrative Analysis for COVID-19 Patient Outcome Prediction [53.11258640541513]
我々は、集中治療室入院の必要性を予測するために、人口統計、バイタルサイン、実験室の所見から、肺不透明度の放射能と非画像の特徴を組み合わせる。
また, 地域性肺炎を含む他の肺疾患にも適用できるが, 地域性肺炎に限らない。
論文 参考訳(メタデータ) (2020-07-20T19:08:50Z) - Predicting COVID-19 Pneumonia Severity on Chest X-ray with Deep Learning [57.00601760750389]
前頭部胸部X線画像の重症度予測モデルを提案する。
このようなツールは、エスカレーションやケアの非エスカレーションに使用できる新型コロナウイルスの肺感染症の重症度を測定することができる。
論文 参考訳(メタデータ) (2020-05-24T23:13:16Z) - Automated Quantification of CT Patterns Associated with COVID-19 from
Chest CT [48.785596536318884]
提案法は,非造影胸部CTを入力として,病変,肺,葉を3次元に分割する。
この方法では、肺の重症度と葉の関与度を2つの組み合わせて測定し、COVID-19の異常度と高不透明度の存在度を定量化する。
このアルゴリズムの評価は、カナダ、ヨーロッパ、米国からの200人の参加者(感染者100人、健康管理100人)のCTで報告されている。
論文 参考訳(メタデータ) (2020-04-02T21:49:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。