論文の概要: Machine Learning Models for Predicting Smoking-Related Health Decline and Disease Risk
- arxiv url: http://arxiv.org/abs/2511.14682v1
- Date: Tue, 18 Nov 2025 17:21:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:53.228146
- Title: Machine Learning Models for Predicting Smoking-Related Health Decline and Disease Risk
- Title(参考訳): 喫煙関連健康悪化と疾病リスク予測のための機械学習モデル
- Authors: Vaskar Chakma, MD Jaheid Hasan Nerab, Abdur Rouf, Abu Sayed, Hossem MD Saim, Md. Nournabi Khan,
- Abstract要約: 喫煙は世界中で大きな死因となっている。
現在の医療検診法は、喫煙に関連する健康問題に関する早期警告の兆候を見逃すことが多い。
- 参考スコア(独自算出の注目度): 1.1288535170985818
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Smoking continues to be a major preventable cause of death worldwide, affecting millions through damage to the heart, metabolism, liver, and kidneys. However, current medical screening methods often miss the early warning signs of smoking-related health problems, leading to late-stage diagnoses when treatment options become limited. This study presents a systematic comparative evaluation of machine learning approaches for smoking-related health risk assessment, emphasizing clinical interpretability and practical deployment over algorithmic innovation. We analyzed health screening data from 55,691 individuals, examining various health indicators, including body measurements, blood tests, and demographic information. We tested three advanced prediction algorithms - Random Forest, XGBoost, and LightGBM - to determine which could most accurately identify people at high risk. This study employed a cross-sectional design to classify current smoking status based on health screening biomarkers, not to predict future disease development. Our Random Forest model performed best, achieving an Area Under the Curve (AUC) of 0.926, meaning it could reliably distinguish between high-risk and lower-risk individuals. Using SHAP (SHapley Additive exPlanations) analysis to understand what the model was detecting, we found that key health markers played crucial roles in prediction: blood pressure levels, triglyceride concentrations, liver enzyme readings, and kidney function indicators (serum creatinine) were the strongest signals of declining health in smokers.
- Abstract(参考訳): 喫煙は、心臓、代謝、肝臓、腎臓に損傷を負い、世界中で大きな死因となっている。
しかし、現在の医療スクリーニング手法では、喫煙に関連する健康問題の初期警告の兆候を見逃しがちであり、治療の選択肢が限定された場合の後期診断に繋がる。
本研究は,喫煙関連健康リスク評価のための機械学習手法の体系的比較評価を行い,臨床解釈可能性とアルゴリズムの革新的展開を強調した。
身体計測,血液検査,人口統計などの健康指標を用いて,55,691人の健診データを分析した。
我々はRandom Forest、XGBoost、LightGBMの3つの高度な予測アルゴリズムをテストし、誰がリスクの高い人を最も正確に識別できるかを判定しました。
本研究は,健康診断バイオマーカーに基づく喫煙状況の分類のための横断的設計を用いて,今後の疾患発生を予測しない。
我々のランダムフォレストモデルは、AUC(Area Under the Curve)0.926(Area Under the Curve)を達成し、高いリスクと低いリスクの個人を確実に区別することができた。
SHAP (SHapley Additive exPlanations) 分析により, 血圧, トリグリセリド濃度, 肝臓酵素濃度, 腎機能指標 (セレチニン血清) が喫煙者の健康低下の最も強いシグナルであることがわかった。
関連論文リスト
- Cardiovascular Disease Prediction using Machine Learning: A Comparative Analysis [0.0]
本研究は、68,119レコードからなる心血管疾患(CVD)データセットに関するものである。
CVDと高齢者の強い関係を明らかにするため, t-tests, Chi-square test, ANOVAなどの統計分析を行った。
ロジスティック回帰モデルでは、年齢、血圧、コレステロールが主な危険因子であり、喫煙とアルコールの予期せぬ負の関連がある。
論文 参考訳(メタデータ) (2025-07-29T15:07:32Z) - Fuzzy Rule based Intelligent Cardiovascular Disease Prediction using Complex Event Processing [0.8668211481067458]
心血管疾患 (CVD) は、不健康な食事、身体活動の欠如、その他の要因により、急速に世界的な懸念が高まっている。
最近の研究は、リスクと死亡率を減らすための正確でタイムリーな病気予測に焦点を当てている。
本稿では,リアルタイム意思決定支援のためのファジィルールに基づく臨床データ監視システムを提案する。
論文 参考訳(メタデータ) (2024-09-19T16:36:24Z) - A data balancing approach towards design of an expert system for Heart Disease Prediction [0.9895793818721335]
心臓病は深刻な世界的な健康問題で、毎年何百万人もの命がかかっています。
本稿では,決定木(DT),ランダムフォレスト(RF),線形判別分析,エクストラツリーブースト,アダブーストという5つの機械学習手法を用いた。
ランダムフォレストと決定木モデルの精度は99.83%だった。
論文 参考訳(メタデータ) (2024-07-26T08:56:13Z) - Explainable Machine Learning System for Predicting Chronic Kidney Disease in High-Risk Cardiovascular Patients [0.0]
本研究は,循環器疾患患者の慢性腎臓病(CKD)を予測できる機械学習システムを開発した。
ランダムフォレストモデルは88.2%の感度を達成した。
論文 参考訳(メタデータ) (2024-04-17T07:59:33Z) - Improving Cardiovascular Disease Prediction Through Comparative Analysis
of Machine Learning Models: A Case Study on Myocardial Infarction [0.0]
心臓血管疾患は現代世界でも主要な死因である。
正確な予測は、医療戦略の精査に欠かせない。
XGBoostがトップパフォーマンスモデルとして登場します。
論文 参考訳(メタデータ) (2023-11-01T13:41:44Z) - Interpretable Survival Analysis for Heart Failure Risk Prediction [50.64739292687567]
現状の生存モデルと解釈可能かつ競合する新しい生存分析パイプラインを提案する。
我々のパイプラインは最先端のパフォーマンスを達成し、心不全のリスク要因に関する興味深い新しい洞察を提供する。
論文 参考訳(メタデータ) (2023-10-24T02:56:05Z) - Penalized Deep Partially Linear Cox Models with Application to CT Scans
of Lung Cancer Patients [42.09584755334577]
肺がんは世界中のがん死亡の原因であり、効果的な治療法を設計するための死亡リスクを理解することの重要性を強調している。
NLST(National Lung Screening Trial)は、肺がん患者の死亡リスクを定量化するために、CTテクスチャ解析を用いている。
本稿では,SCADペナルティを組み込んで重要なテクスチャ特徴を抽出し,深層ニューラルネットワークを用いてモデルの非パラメトリック成分を推定する,Pentalized Deep partially Linear Cox Model (Penalized DPLC)を提案する。
論文 参考訳(メタデータ) (2023-03-09T15:38:16Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Robustness to Spurious Correlations via Human Annotations [100.63051542531171]
本稿では,人間に共通する因果関係の知識を活用して,素因関係に頑健なモデルを構築するための枠組みを提案する。
具体的には、人間のアノテーションを使用して、潜在的な未測定変数でトレーニング例を拡大する。
次に,未測定変数(UV-DRO)に対する分布性に頑健な新たな最適化手法を導入し,テスト時間シフトによる最悪の損失を制御する。
論文 参考訳(メタデータ) (2020-07-13T20:05:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。