論文の概要: A Machine Learning Framework for Breast Cancer Treatment Classification Using a Novel Dataset
- arxiv url: http://arxiv.org/abs/2507.06243v1
- Date: Mon, 23 Jun 2025 18:33:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-13 12:05:57.553211
- Title: A Machine Learning Framework for Breast Cancer Treatment Classification Using a Novel Dataset
- Title(参考訳): 新しいデータセットを用いた乳癌治療分類のための機械学習フレームワーク
- Authors: Md Nahid Hasan, Md Monzur Murshed, Md Mahadi Hasan, Faysal A. Chowdhury,
- Abstract要約: 本研究は,癌ゲノムアトラス(TCGA)乳がん臨床データセットを用いて機械学習モデルを開発した。
モデルは5倍のクロスバリデーションを用いてトレーニングされ、精度、精度、リコール、特異性、感度、F1スコア、レシーバ動作特性曲線(AUROC)以下の領域を含むパフォーマンス指標によって評価される。
試験モデルのうち、GBM(Gradient Boosting Machine)は最高安定性能(精度0.7718、AUROC0.8252)を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Breast cancer (BC) remains a significant global health challenge, with personalized treatment selection complicated by the disease's molecular and clinical heterogeneity. BC treatment decisions rely on various patient-specific clinical factors, and machine learning (ML) offers a powerful approach to predicting treatment outcomes. This study utilizes The Cancer Genome Atlas (TCGA) breast cancer clinical dataset to develop ML models for predicting the likelihood of undergoing chemotherapy or hormonal therapy. The models are trained using five-fold cross-validation and evaluated through performance metrics, including accuracy, precision, recall, specificity, sensitivity, F1-score, and area under the receiver operating characteristic curve (AUROC). Model uncertainty is assessed using bootstrap techniques, while SHAP values enhance interpretability by identifying key predictors. Among the tested models, the Gradient Boosting Machine (GBM) achieves the highest stable performance (accuracy = 0.7718, AUROC = 0.8252), followed by Extreme Gradient Boosting (XGBoost) (accuracy = 0.7557, AUROC = 0.8044) and Adaptive Boosting (AdaBoost) (accuracy = 0.7552, AUROC = 0.8016). These findings underscore the potential of ML in supporting personalized breast cancer treatment decisions through data-driven insights.
- Abstract(参考訳): 乳がん(BC)は、この疾患の分子的および臨床的不均一性によって複雑化するパーソナライズされた治療の選択によって、重要な世界的な健康上の課題であり続けている。
BC治療の決定は様々な患者固有の臨床因子に依存しており、機械学習(ML)は治療結果を予測する強力なアプローチを提供する。
本研究は,癌ゲノムアトラス(TCGA)乳がん臨床データセットを用いて,化学療法やホルモン療法の可能性を予測するためのMLモデルを開発した。
モデルは5倍のクロスバリデーションを用いてトレーニングされ、精度、精度、リコール、特異性、感度、F1スコア、受信機動作特性曲線(AUROC)の下の領域などのパフォーマンス指標によって評価される。
モデルの不確実性はブートストラップ手法を用いて評価され、SHAP値はキー予測器を識別することで解釈可能性を高める。
テストされたモデルのうち、GBMは最高安定性能(精度: 0.7718, AUROC = 0.8252)、続いてExtreme Gradient Boosting (XGBoost) (正確: 0.7557, AUROC = 0.8044)、Adaptive Boosting (AdaBoost) (正確: 0.7552, AUROC = 0.8016)を達成している。
これらの知見は、データ駆動の洞察を通じて、パーソナライズされた乳癌治療決定を支援するMLの可能性を示している。
関連論文リスト
- Predicting Length of Stay in Neurological ICU Patients Using Classical Machine Learning and Neural Network Models: A Benchmark Study on MIMIC-IV [49.1574468325115]
本研究は、MIMIC-IVデータセットに基づく神経疾患患者を対象とした、ICUにおけるLOS予測のための複数のMLアプローチについて検討する。
評価されたモデルには、古典的MLアルゴリズム(K-Nearest Neighbors、Random Forest、XGBoost、CatBoost)とニューラルネットワーク(LSTM、BERT、テンポラルフュージョントランス)が含まれる。
論文 参考訳(メタデータ) (2025-05-23T14:06:42Z) - Machine Learning Meets Transparency in Osteoporosis Risk Assessment: A Comparative Study of ML and Explainability Analysis [0.0]
本研究は,機械学習(ML)による骨粗しょう症のリスク予測の難しさに対処するものである。
XGBoostは評価モデルの中で最大の精度(91%)で、他のモデルの精度(0.92)、リコール(0.91)、F1スコア(0.90)を上回った。
本研究は, 加齢が骨粗しょう症のリスク予測の主要な要因であり, ホルモン変動と家族歴が続くことを示唆している。
論文 参考訳(メタデータ) (2025-05-01T09:05:02Z) - Leveraging Machine Learning and Deep Learning Techniques for Improved Pathological Staging of Prostate Cancer [0.4660328753262075]
本研究は,PCaの病的ステージング予測を改善するために,機械学習と深層学習のアプローチと特徴選択と抽出手法を活用する。
ランダムフォレスト(RF)、ロジスティック回帰(LR)、エクストリームグラディエントブースティング(XGB)、サポートベクターマシン(SVM)などの高度なアルゴリズムを用いて486腫瘍の遺伝子発現プロファイルを解析した。
その結果、最も高いF1スコア(約83%)はランダムフォレストアルゴリズムによって達成されたことが明らかとなった。
論文 参考訳(メタデータ) (2025-02-13T14:53:09Z) - Optimizing Mortality Prediction for ICU Heart Failure Patients: Leveraging XGBoost and Advanced Machine Learning with the MIMIC-III Database [1.5186937600119894]
心臓不全は世界中の何百万人もの人々に影響を与え、生活の質を著しく低下させ、高い死亡率をもたらす。
広範な研究にもかかわらず、ICU患者の心不全と死亡率の関係は、完全には理解されていない。
本研究は、ICD-9コードを用いて、MIMIC-IIIデータベースから18歳以上の1,177人のデータを解析した。
論文 参考訳(メタデータ) (2024-09-03T07:57:08Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Improving Breast Cancer Grade Prediction with Multiparametric MRI Created Using Optimized Synthetic Correlated Diffusion Imaging [71.91773485443125]
乳がん治療計画において、グレーディングは重要な役割を担っている。
現在の腫瘍グレード法では、患者から組織を抽出し、ストレス、不快感、医療費の上昇につながる。
本稿では,CDI$s$の最適化による乳癌の診断精度の向上について検討する。
論文 参考訳(メタデータ) (2024-05-13T15:48:26Z) - Predictive Modeling for Breast Cancer Classification in the Context of Bangladeshi Patients: A Supervised Machine Learning Approach with Explainable AI [0.0]
5種類の機械学習手法の分類精度,精度,リコール,F-1スコアを評価し,比較した。
XGBoostは97%という最高のモデル精度を達成した。
論文 参考訳(メタデータ) (2024-04-06T17:23:21Z) - CIMIL-CRC: a clinically-informed multiple instance learning framework for patient-level colorectal cancer molecular subtypes classification from H\&E stained images [42.771819949806655]
CIMIL-CRCは、事前学習した特徴抽出モデルと主成分分析(PCA)を効率よく組み合わせ、全てのパッチから情報を集約することで、MSI/MSS MIL問題を解決するフレームワークである。
我々は,TCGA-CRC-DXコホートを用いたモデル開発のための5倍のクロスバリデーション実験装置を用いて,曲線下平均面積(AUC)を用いてCIMIL-CRC法の評価を行った。
論文 参考訳(メタデータ) (2024-01-29T12:56:11Z) - Cancer-Net BCa-S: Breast Cancer Grade Prediction using Volumetric Deep
Radiomic Features from Synthetic Correlated Diffusion Imaging [82.74877848011798]
乳がんの流行は成長を続けており、2023年には米国で約30万人の女性に影響を及ぼした。
金標準のScarff-Bloom-Richardson(SBR)グレードは、化学療法に対する患者の反応を一貫して示すことが示されている。
本稿では,合成相関拡散(CDI$s$)画像を用いた乳がん鑑定における深層学習の有効性について検討する。
論文 参考訳(メタデータ) (2023-04-12T15:08:34Z) - Interpretability methods of machine learning algorithms with
applications in breast cancer diagnosis [1.1470070927586016]
我々は,グローバルサロゲート(GS)法,個人期待(ICE)プロット,条件シェープ値(SV)などの解釈可能性技術を用いた。
乳がん診断における最良の成績は,提案したERN(精度96.6%,ROC曲線0.96)により得られた。
論文 参考訳(メタデータ) (2022-02-04T13:41:30Z) - Comparison of Machine Learning Classifiers to Predict Patient Survival
and Genetics of GBM: Towards a Standardized Model for Clinical Implementation [44.02622933605018]
放射線モデルは、グリオ芽腫(GBM)の結果予測のための臨床データを上回ることが示されています。
GBM患者の生存率(OS),IDH変異,O-6-メチルグアニン-DNA-メチルトランスフェラーゼ(MGMT)プロモーターメチル化,EGFR(EGFR)VII増幅,Ki-67発現の9種類の機械学習分類器を比較した。
xgb は os (74.5%), ab for idh 変異 (88%), mgmt メチル化 (71,7%), ki-67 発現 (86,6%), egfr増幅 (81。
論文 参考訳(メタデータ) (2021-02-10T15:10:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。