論文の概要: Predictive Modeling for Breast Cancer Classification in the Context of Bangladeshi Patients: A Supervised Machine Learning Approach with Explainable AI
- arxiv url: http://arxiv.org/abs/2404.04686v1
- Date: Sat, 6 Apr 2024 17:23:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-09 20:00:13.109082
- Title: Predictive Modeling for Breast Cancer Classification in the Context of Bangladeshi Patients: A Supervised Machine Learning Approach with Explainable AI
- Title(参考訳): バングラデシュにおける乳がん分類の予測モデル : 説明可能なAIを用いた機械学習アプローチ
- Authors: Taminul Islam, Md. Alif Sheakh, Mst. Sazia Tahosin, Most. Hasna Hena, Shopnil Akash, Yousef A. Bin Jardan, Gezahign Fentahun Wondmie, Hiba-Allah Nafidi, Mohammed Bourhia,
- Abstract要約: 5種類の機械学習手法の分類精度,精度,リコール,F-1スコアを評価し,比較した。
XGBoostは97%という最高のモデル精度を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Breast cancer has rapidly increased in prevalence in recent years, making it one of the leading causes of mortality worldwide. Among all cancers, it is by far the most common. Diagnosing this illness manually requires significant time and expertise. Since detecting breast cancer is a time-consuming process, preventing its further spread can be aided by creating machine-based forecasts. Machine learning and Explainable AI are crucial in classification as they not only provide accurate predictions but also offer insights into how the model arrives at its decisions, aiding in the understanding and trustworthiness of the classification results. In this study, we evaluate and compare the classification accuracy, precision, recall, and F-1 scores of five different machine learning methods using a primary dataset (500 patients from Dhaka Medical College Hospital). Five different supervised machine learning techniques, including decision tree, random forest, logistic regression, naive bayes, and XGBoost, have been used to achieve optimal results on our dataset. Additionally, this study applied SHAP analysis to the XGBoost model to interpret the model's predictions and understand the impact of each feature on the model's output. We compared the accuracy with which several algorithms classified the data, as well as contrasted with other literature in this field. After final evaluation, this study found that XGBoost achieved the best model accuracy, which is 97%.
- Abstract(参考訳): 近年、乳がんは急速に流行し、世界中で死亡率の高い原因の1つとなっている。
全てのがんの中でも最も多い。
この病気を手動で診断するにはかなりの時間と専門知識が必要である。
乳癌の検出は時間を要するプロセスであるため、マシンベースの予測を作成することにより、そのさらなる拡散を防ぐことができる。
機械学習と説明可能なAIは、正確な予測を提供するだけでなく、モデルがその決定にどう到達するかについての洞察を提供し、分類結果の理解と信頼性を支援するため、分類において不可欠である。
本研究では,プライマリデータセット(ダッカ医科大学病院500名)を用いて,5種類の機械学習手法の分類精度,精度,リコール,F-1スコアを評価し,比較した。
決定木、ランダムフォレスト、ロジスティック回帰、ナイーブベイズ、XGBoostを含む5つの異なる教師付き機械学習技術を用いて、データセット上で最適な結果が得られた。
さらに,モデルの予測を解釈し,各特徴がモデル出力に与える影響を理解するために,XGBoostモデルにSHAP解析を適用した。
我々は、複数のアルゴリズムがデータを分類した精度と、この分野の他の文献と対比した精度を比較した。
最終評価の結果,XGBoostの精度は97%であった。
関連論文リスト
- A data balancing approach towards design of an expert system for Heart Disease Prediction [0.9895793818721335]
心臓病は深刻な世界的な健康問題で、毎年何百万人もの命がかかっています。
本稿では,決定木(DT),ランダムフォレスト(RF),線形判別分析,エクストラツリーブースト,アダブーストという5つの機械学習手法を用いた。
ランダムフォレストと決定木モデルの精度は99.83%だった。
論文 参考訳(メタデータ) (2024-07-26T08:56:13Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Machine Learning-Assisted Recurrence Prediction for Early-Stage
Non-Small-Cell Lung Cancer Patients [10.127130900852405]
再発リスクによるがん患者の成層化は、自身のケアをパーソナライズすることができる。
本研究では,早期非小細胞肺癌患者の再発確率を機械学習を用いて推定する方法を提案する。
論文 参考訳(メタデータ) (2022-11-17T19:34:16Z) - Machine Learning Approaches to Predict Breast Cancer: Bangladesh
Perspective [0.0]
本研究は,乳がんをクラスで最大精度で予測できる最良のアルゴリズムの発見に焦点をあてる。
このモデルの実装後、この研究はRandom ForestとXGBoostで94%のモデル精度を達成した。
論文 参考訳(メタデータ) (2022-06-30T01:44:53Z) - PCA-RF: An Efficient Parkinson's Disease Prediction Model based on
Random Forest Classification [3.6704226968275258]
本稿では,パーキンソン病に対する無作為な森林分類を行う病気予測手法を提案する。
このモデルの精度を主成分分析 (PCA) に適用したニューラルネットワーク (ANN) モデルと比較し, 可視差を捉えた。
モデルの精度は最大90%まで向上した。
論文 参考訳(メタデータ) (2022-03-21T18:59:08Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - A Machine Learning Challenge for Prognostic Modelling in Head and Neck
Cancer Using Multi-modal Data [0.10651507097431492]
我々は,頭頸部癌における生存予測の精度向上を目的として,機関的機械学習挑戦を行った。
画像と臨床データを用いて,12種類の提出物を別々に,あるいは組み合わせて比較した。
勝利アプローチは臨床データと腫瘍容積の非線形マルチタスク学習を用い、2年間の生存予測において高い予後精度を達成した。
論文 参考訳(メタデータ) (2021-01-28T11:20:34Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。