論文の概要: Survival Prediction of Children Undergoing Hematopoietic Stem Cell
Transplantation Using Different Machine Learning Classifiers by Performing
Chi-squared Test and Hyper-parameter Optimization: A Retrospective Analysis
- arxiv url: http://arxiv.org/abs/2201.08987v1
- Date: Sat, 22 Jan 2022 08:01:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-25 16:15:38.635755
- Title: Survival Prediction of Children Undergoing Hematopoietic Stem Cell
Transplantation Using Different Machine Learning Classifiers by Performing
Chi-squared Test and Hyper-parameter Optimization: A Retrospective Analysis
- Title(参考訳): chi-squared test と hyper-parameter optimization による異なる機械学習分類器を用いた造血幹細胞移植後の生存予測 : ふりかえり解析
- Authors: Ishrak Jahan Ratul, Ummay Habiba Wani, Mirza Muntasir Nishat, Abdullah
Al-Monsur, Abrar Mohammad Ar-Rafi, Fahim Faisal, and Mohammad Ridwan Kabir
- Abstract要約: 効率的な生存率分類モデルが包括的に提示される。
欠落した値を入力し、ダミー変数符号化を用いてデータを変換し、チ二乗特徴選択を用いて59個の特徴から11個の最も相関した特徴にデータセットを圧縮することにより、合成データセットを生成する。
この点に関しては、決定木(Decision Tree)、ランダムフォレスト(Random Forest)、ロジスティック回帰(Logistic Regression)、K-Nearest Neighbors(K-Nearest Neighbors)、グラディエントブースティング(Gradient Boosting)、Ada Boost(Ada Boost)、XG Boost(XG Boost)など、いくつかの教師付きML手法が訓練された。
- 参考スコア(独自算出の注目度): 4.067706269490143
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Bone Marrow Transplant, a gradational rescue for a wide range of disorders
emanating from the bone marrow, is an efficacious surgical treatment. Several
risk factors, such as post-transplant illnesses, new malignancies, and even
organ damage, can impair long-term survival. Therefore, technologies like
Machine Learning are deployed for investigating the survival prediction of BMT
receivers along with the influences that limit their resilience. In this study,
an efficient survival classification model is presented in a comprehensive
manner, incorporating the Chi-squared feature selection method to address the
dimensionality problem and Hyper Parameter Optimization (HPO) to increase
accuracy. A synthetic dataset is generated by imputing the missing values,
transforming the data using dummy variable encoding, and compressing the
dataset from 59 features to the 11 most correlated features using Chi-squared
feature selection. The dataset was split into train and test sets at a ratio of
80:20, and the hyperparameters were optimized using Grid Search
Cross-Validation. Several supervised ML methods were trained in this regard,
like Decision Tree, Random Forest, Logistic Regression, K-Nearest Neighbors,
Gradient Boosting Classifier, Ada Boost, and XG Boost. The simulations have
been performed for both the default and optimized hyperparameters by using the
original and reduced synthetic dataset. After ranking the features using the
Chi-squared test, it was observed that the top 11 features with HPO, resulted
in the same accuracy of prediction (94.73%) as the entire dataset with default
parameters. Moreover, this approach requires less time and resources for
predicting the survivability of children undergoing BMT. Hence, the proposed
approach may aid in the development of a computer-aided diagnostic system with
satisfactory accuracy and minimal computation time by utilizing medical data
records.
- Abstract(参考訳): 骨髄移植は、骨髄から発生する広範囲の障害に対する段階的救助であり、効果的な外科治療である。
移植後疾患、新しい悪性腫瘍、臓器損傷などいくつかの危険因子は、長期生存を損なう可能性がある。
したがって、機械学習のような技術は、BMT受信機の生存予測とレジリエンスを制限する影響を調査するためにデプロイされる。
本研究では,次元問題に対処するためのchi-squared特徴選択法と,精度を高めるためにhpo(hyper parameter optimization)を組み込んだ,効率的な生存分類モデルを提案する。
欠落した値を入力し、ダミー変数符号化を用いてデータを変換し、チ二乗特徴選択を用いて59個の特徴から11個の最も相関した特徴へデータセットを圧縮して合成データセットを生成する。
データセットは80:20の比率で列車とテストセットに分割され、ハイパーパラメータはグリッドサーチクロスバリデーションを使用して最適化された。
この点に関しては、Decision Tree、Random Forest、Logistic Regression、K-Nearest Neighbors、Gradient Boosting Classifier、Ada Boost、XG Boostなどの教師付きMLメソッドがトレーニングされた。
シミュレーションは、オリジナルの合成データセットと縮小された合成データセットを使用して、デフォルトと最適化されたハイパーパラメータの両方で実行される。
Chi-squaredテストを用いて機能をランク付けした後、HPOの上位11の機能はデフォルトパラメータを持つデータセット全体と同じ精度(94.73%)で予測された。
さらに,BMTを施行した子どもの生存率を予測するには,時間と資源の削減が必要である。
したがって,提案手法は,医療データを利用したコンピュータ支援診断システムの開発に有効であり,計算時間も最小限である。
関連論文リスト
- Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - A Bio-Medical Snake Optimizer System Driven by Logarithmic Surviving Global Search for Optimizing Feature Selection and its application for Disorder Recognition [1.3755153408022656]
人間の生命を守ることがいかに重要かを考えると、医療実践を強化することが最重要である。
機械学習技術を用いて患者の予測を自動化することで、医療療法を加速することができる。
この分野における重要な任務のために、いくつかの前処理戦略を採用する必要がある。
論文 参考訳(メタデータ) (2024-02-22T09:08:18Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Robust self-healing prediction model for high dimensional data [0.685316573653194]
本研究は、ロバスト自己治癒(RSH)ハイブリッド予測モデルを提案する。
それは、データを捨てるのではなく、エラーや不整合を取り除くことによって、データ全体を活用することによって機能する。
提案手法は,既存のハイパフォーマンスモデルと比較し,解析を行った。
論文 参考訳(メタデータ) (2022-10-04T17:55:50Z) - Detecting Chronic Kidney Disease(CKD) at the Initial Stage: A Novel
Hybrid Feature-selection Method and Robust Data Preparation Pipeline for
Different ML Techniques [0.0]
慢性腎臓病(CKD)は世界中で8億人近くに感染している。毎年約170万人が死亡している。
多くの研究者は、CKDを早期に検出するために異なる機械学習(ML)手法を適用しているが、詳細な研究はいまだに欠けている。
本稿では,医療データの複雑さを最適性能で扱うための構造的かつ徹底的な手法を提案する。
論文 参考訳(メタデータ) (2022-03-02T20:38:49Z) - Cervical Cytology Classification Using PCA & GWO Enhanced Deep Features
Selection [1.990876596716716]
子宮頸癌は世界でも最も致命的かつ一般的な疾患の1つである。
ディープラーニングと特徴選択を利用した完全自動化フレームワークを提案する。
このフレームワークは3つの公開ベンチマークデータセットで評価されている。
論文 参考訳(メタデータ) (2021-06-09T08:57:22Z) - Resource Planning for Hospitals Under Special Consideration of the
COVID-19 Pandemic: Optimization and Sensitivity Analysis [87.31348761201716]
新型コロナウイルス(covid-19)パンデミックのような危機は、医療機関にとって深刻な課題となる。
BaBSim.Hospitalは離散イベントシミュレーションに基づく容量計画ツールである。
BaBSim.Hospitalを改善するためにこれらのパラメータを調査し最適化することを目指しています。
論文 参考訳(メタデータ) (2021-05-16T12:38:35Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。