論文の概要: Breast Cancer Classification Using Gradient Boosting Algorithms Focusing on Reducing the False Negative and SHAP for Explainability
- arxiv url: http://arxiv.org/abs/2403.09548v1
- Date: Thu, 14 Mar 2024 16:35:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-15 19:38:09.243765
- Title: Breast Cancer Classification Using Gradient Boosting Algorithms Focusing on Reducing the False Negative and SHAP for Explainability
- Title(参考訳): False Negative と SHAP による乳がんの分類
- Authors: João Manoel Herrera Pinheiro, Marcelo Becker,
- Abstract要約: 本研究は,乳がん予測のためのブースティングに基づく各種機械学習アルゴリズムの性能評価に焦点をあてる。
本研究の目的は,AdaBoost,XGBoost,CatBoost,LightGBMといった最先端の促進アルゴリズムを用いて乳癌の予測と診断を行うことである。
- 参考スコア(独自算出の注目度): 0.6906005491572401
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cancer is one of the diseases that kill the most women in the world, with breast cancer being responsible for the highest number of cancer cases and consequently deaths. However, it can be prevented by early detection and, consequently, early treatment. Any development for detection or perdition this kind of cancer is important for a better healthy life. Many studies focus on a model with high accuracy in cancer prediction, but sometimes accuracy alone may not always be a reliable metric. This study implies an investigative approach to studying the performance of different machine learning algorithms based on boosting to predict breast cancer focusing on the recall metric. Boosting machine learning algorithms has been proven to be an effective tool for detecting medical diseases. The dataset of the University of California, Irvine (UCI) repository has been utilized to train and test the model classifier that contains their attributes. The main objective of this study is to use state-of-the-art boosting algorithms such as AdaBoost, XGBoost, CatBoost and LightGBM to predict and diagnose breast cancer and to find the most effective metric regarding recall, ROC-AUC, and confusion matrix. Furthermore, our study is the first to use these four boosting algorithms with Optuna, a library for hyperparameter optimization, and the SHAP method to improve the interpretability of our model, which can be used as a support to identify and predict breast cancer. We were able to improve AUC or recall for all the models and reduce the False Negative for AdaBoost and LigthGBM the final AUC were more than 99.41\% for all models.
- Abstract(参考訳): がんは世界で最も多くの女性を殺す病気の1つであり、乳がんは最も多くのがん患者を負い、結果として死亡する。
しかし、早期発見や早期治療によって予防することができる。
この種のがんの検出や摂食の発達は、健康な生活のために重要である。
多くの研究は、癌予測において高い精度のモデルに焦点を当てているが、精度だけでは必ずしも信頼できる計量ではないこともある。
本研究は,リコール基準に着目した乳がん予測のためのブースティングに基づく,異なる機械学習アルゴリズムの性能調査手法を提案する。
機械学習アルゴリズムの強化は、医療疾患の検出に有効なツールであることが証明されている。
カリフォルニア大学アーバイン校(UCI)リポジトリのデータセットを使用して、それらの属性を含むモデル分類器をトレーニングし、テストしている。
本研究の目的は,AdaBoost,XGBoost,CatBoost,LightGBMといった最先端のブースティングアルゴリズムを用いて乳癌の予測と診断を行い,リコール,ROC-AUC,混乱行列に関する最も効果的な測定値を求めることである。
さらに, この4つのブースティングアルゴリズムを, ハイパーパラメータ最適化のためのライブラリであるOptunaと, SHAP法を用いて, 乳がんの同定・予測支援として利用した。
AUCを改良したり、全てのモデルにリコールしたり、AdaBoost と LigthGBM の False Negative を削減できた。
関連論文リスト
- Improved Breast Cancer Diagnosis through Transfer Learning on
Hematoxylin and Eosin Stained Histology Images [3.7498611358320733]
本研究では,最新のBRACS染色画像を用いて乳癌腫瘍の分類を行った。
我々は、Xception、EfficientNet、ResNet50、InceptionResNetといった、ImageNet重みに基づいて事前訓練された様々なディープラーニングモデルを用いて実験を行った。
論文 参考訳(メタデータ) (2023-09-15T20:16:17Z) - Cancer-Net BCa-S: Breast Cancer Grade Prediction using Volumetric Deep
Radiomic Features from Synthetic Correlated Diffusion Imaging [82.74877848011798]
乳がんの流行は成長を続けており、2023年には米国で約30万人の女性に影響を及ぼした。
金標準のScarff-Bloom-Richardson(SBR)グレードは、化学療法に対する患者の反応を一貫して示すことが示されている。
本稿では,合成相関拡散(CDI$s$)画像を用いた乳がん鑑定における深層学習の有効性について検討する。
論文 参考訳(メタデータ) (2023-04-12T15:08:34Z) - Enhancing Clinical Support for Breast Cancer with Deep Learning Models
using Synthetic Correlated Diffusion Imaging [66.63200823918429]
深層学習モデルを用いた乳癌に対する臨床支援の強化について検討した。
我々は、体積畳み込みニューラルネットワークを利用して、前処理コホートから深い放射能特徴を学習する。
提案手法は, グレードと処理後応答予測の両方において, より良い性能を実現することができる。
論文 参考訳(メタデータ) (2022-11-10T03:02:12Z) - High-resolution synthesis of high-density breast mammograms: Application
to improved fairness in deep learning based mass detection [48.88813637974911]
深層学習に基づくコンピュータ支援検出システムは乳癌検出において優れた性能を示した。
高密度の乳房は、高密度の組織がマスを覆ったりシミュレートしたりできるため、検出性能が劣っている。
本研究は,高密度乳房における高密度フルフィールドデジタルマンモグラムを用いた質量検出性能の向上を目的とする。
論文 参考訳(メタデータ) (2022-09-20T15:57:12Z) - Classification of Breast Tumours Based on Histopathology Images Using
Deep Features and Ensemble of Gradient Boosting Methods [0.0]
提案するCADシステムの特徴抽出器の主案として,Deep Feature Transfer Learningが用いられている。
Inception-ResNet-v2は乳癌の病理組織像において最も優れた特徴抽出能を示した。
分類段階では,CatBoost,XGBoost,LightGBMのアンサンブルが最も平均精度が高い。
論文 参考訳(メタデータ) (2022-09-03T09:27:00Z) - Machine Learning Approaches to Predict Breast Cancer: Bangladesh
Perspective [0.0]
本研究は,乳がんをクラスで最大精度で予測できる最良のアルゴリズムの発見に焦点をあてる。
このモデルの実装後、この研究はRandom ForestとXGBoostで94%のモデル精度を達成した。
論文 参考訳(メタデータ) (2022-06-30T01:44:53Z) - Breast Cancer Classification using Deep Learned Features Boosted with
Handcrafted Features [0.0]
早期発見・分類・診断の枠組みを考えることは,研究コミュニティにとって最も重要である。
本稿では,マンモグラフィーを用いた乳癌の分類のための新しい枠組みを提案する。
提案するフレームワークは,新しい畳み込みニューラルネットワーク(CNN)機能から抽出したロバストな特徴と手作りの機能を組み合わせたものである。
論文 参考訳(メタデータ) (2022-06-26T07:54:09Z) - A Combined PCA-MLP Network for Early Breast Cancer Detection [0.0]
我々は、患者が乳がんに直面するかどうかを検出するために、異なる機械学習アルゴリズムを研究した。
われわれの4層PCAネットワークは、BCCDデータセットの平均90.48%で100%の精度を得た。
論文 参考訳(メタデータ) (2022-06-18T06:17:40Z) - EMT-NET: Efficient multitask network for computer-aided diagnosis of
breast cancer [58.720142291102135]
乳腺腫瘍の分類と分別を同時に行うための,効率的で軽量な学習アーキテクチャを提案する。
腫瘍分類ネットワークにセグメンテーションタスクを組み込むことにより,腫瘍領域に着目したバックボーンネットワークで表現を学習する。
腫瘍分類の精度、感度、特異性はそれぞれ88.6%、94.1%、85.3%である。
論文 参考訳(メタデータ) (2022-01-13T05:24:40Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - Robust Deep AUC Maximization: A New Surrogate Loss and Empirical Studies
on Medical Image Classification [63.44396343014749]
AUCスコアに対する新たなマージンベースサロゲート損失関数を提案する。
一般的に使用されるものよりも頑丈である。
大規模な最適化の観点からも同じ利点を享受しながら、正方損失。
私たちの知る限りでは、DAMが大規模医療画像データセットで成功するのはこれが初めてです。
論文 参考訳(メタデータ) (2020-12-06T03:41:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。