論文の概要: Detecting Chronic Kidney Disease(CKD) at the Initial Stage: A Novel
Hybrid Feature-selection Method and Robust Data Preparation Pipeline for
Different ML Techniques
- arxiv url: http://arxiv.org/abs/2203.01394v1
- Date: Wed, 2 Mar 2022 20:38:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-04 14:33:55.915848
- Title: Detecting Chronic Kidney Disease(CKD) at the Initial Stage: A Novel
Hybrid Feature-selection Method and Robust Data Preparation Pipeline for
Different ML Techniques
- Title(参考訳): 早期に慢性腎臓病(CKD)を検出する:新しいハイブリッド特徴選択法と異なるML技術のためのロバストデータ作成パイプライン
- Authors: Md. Taufiqul Haque Khan Tusar, Md. Touhidul Islam, Foyjul Islam Raju
- Abstract要約: 慢性腎臓病(CKD)は世界中で8億人近くに感染している。毎年約170万人が死亡している。
多くの研究者は、CKDを早期に検出するために異なる機械学習(ML)手法を適用しているが、詳細な研究はいまだに欠けている。
本稿では,医療データの複雑さを最適性能で扱うための構造的かつ徹底的な手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chronic Kidney Disease (CKD) has infected almost 800 million people around
the world. Around 1.7 million people die each year because of it. Detecting CKD
in the initial stage is essential for saving millions of lives. Many
researchers have applied distinct Machine Learning (ML) methods to detect CKD
at an early stage, but detailed studies are still missing. We present a
structured and thorough method for dealing with the complexities of medical
data with optimal performance. Besides, this study will assist researchers in
producing clear ideas on the medical data preparation pipeline. In this paper,
we applied KNN Imputation to impute missing values, Local Outlier Factor to
remove outliers, SMOTE to handle data imbalance, K-stratified K-fold
Cross-validation to validate the ML models, and a novel hybrid feature
selection method to remove redundant features. Applied algorithms in this study
are Support Vector Machine, Gaussian Naive Bayes, Decision Tree, Random Forest,
Logistic Regression, K-Nearest Neighbor, Gradient Boosting, Adaptive Boosting,
and Extreme Gradient Boosting. Finally, the Random Forest can detect CKD with
100% accuracy without any data leakage.
- Abstract(参考訳): 慢性腎臓病(CKD)は世界中で8億人近くに感染している。
毎年約170万人が死亡している。
CKDを早期に検出することは、数百万人の命を救うのに不可欠である。
多くの研究者がCKDを早期に検出するために異なる機械学習(ML)手法を適用しているが、詳細な研究はいまだに欠けている。
本稿では,医療データの複雑さを最適性能で扱うための構造的かつ徹底的な手法を提案する。
さらに,本研究は,医療データ作成パイプラインに関する明確なアイデアの創出を支援する。
本稿では,KNNインプットを欠落した値をインプットするために,ローカル・アウトリー・ファクター(Local Outlier Factor),データ不均衡を処理するSMOTE,MLモデルの検証を行うK-stratified K-fold Cross-validation,冗長な特徴を除去する新しいハイブリッド特徴選択法を提案する。
この研究に応用されたアルゴリズムは、Support Vector Machine、Gaussian Naive Bayes、Decision Tree、Random Forest、Logistic Regression、K-Nearest Neighbor、Gradient Boosting、Adaptive Boosting、Extreme Gradient Boostingである。
最後に、Random Forestはデータ漏洩なしにCKDを100%精度で検出できる。
関連論文リスト
- Two new feature selection methods based on learn-heuristic techniques for breast cancer prediction: A comprehensive analysis [6.796017024594715]
帝国主義競争アルゴリズム(ICA)とバットアルゴリズム(BA)に基づく2つの新しい特徴選択法を提案する。
本研究は, 診断モデルの効率を向上し, 臨床医師がこれまでよりもはるかに正確かつ信頼性の高い意思決定を行えるよう包括的分析を行うことを目的とする。
論文 参考訳(メタデータ) (2024-07-19T19:07:53Z) - Survival Prediction from Imbalance colorectal cancer dataset using
hybrid sampling methods and tree-based classifiers [0.0]
本稿では,大腸癌患者の1年,3年,5年生存率を予測するアルゴリズムの開発に焦点をあてる。
そこで本研究では,正の正の確率を高めるために,標準バランス手法のパイプラインを生成する手法を提案する。
本手法は大腸癌患者の死亡率予測を有意に改善する。
論文 参考訳(メタデータ) (2023-09-04T19:48:56Z) - An Improved Heart Disease Prediction Using Stacked Ensemble Method [0.9187159782788579]
機械学習を用いた心疾患予測システムを構築した。
心臓疾患のある人と正常な人とを簡単に区別することができる。
論文 参考訳(メタデータ) (2023-04-12T17:53:59Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Building Brains: Subvolume Recombination for Data Augmentation in Large
Vessel Occlusion Detection [56.67577446132946]
この戦略をデータから学ぶためには、標準的なディープラーニングベースのモデルに対して、大規模なトレーニングデータセットが必要である。
そこで本研究では, 異なる患者から血管木セグメントを組換えることで, 人工的なトレーニングサンプルを生成する方法を提案する。
拡張スキームに則って,タスク固有の入力を入力した3D-DenseNetを用いて,半球間の比較を行う。
論文 参考訳(メタデータ) (2022-05-05T10:31:57Z) - StRegA: Unsupervised Anomaly Detection in Brain MRIs using a Compact
Context-encoding Variational Autoencoder [48.2010192865749]
教師なし異常検出(UAD)は、健康な被験者の異常なデータセットからデータ分布を学習し、分布サンプルの抽出に応用することができる。
本研究では,コンテクストエンコーディング(context-encoding)VAE(ceVAE)モデルのコンパクトバージョンと,前処理と後処理のステップを組み合わせて,UADパイプライン(StRegA)を作成することを提案する。
提案したパイプラインは、BraTSデータセットのT2w画像と0.859$pm$0.112の腫瘍を検出しながら、Diceスコアが0.642$pm$0.101に達した。
論文 参考訳(メタデータ) (2022-01-31T14:27:35Z) - Survival Prediction of Children Undergoing Hematopoietic Stem Cell
Transplantation Using Different Machine Learning Classifiers by Performing
Chi-squared Test and Hyper-parameter Optimization: A Retrospective Analysis [4.067706269490143]
効率的な生存率分類モデルが包括的に提示される。
欠落した値を入力し、ダミー変数符号化を用いてデータを変換し、チ二乗特徴選択を用いて59個の特徴から11個の最も相関した特徴にデータセットを圧縮することにより、合成データセットを生成する。
この点に関しては、決定木(Decision Tree)、ランダムフォレスト(Random Forest)、ロジスティック回帰(Logistic Regression)、K-Nearest Neighbors(K-Nearest Neighbors)、グラディエントブースティング(Gradient Boosting)、Ada Boost(Ada Boost)、XG Boost(XG Boost)など、いくつかの教師付きML手法が訓練された。
論文 参考訳(メタデータ) (2022-01-22T08:01:22Z) - An Explainable Classification Model for Chronic Kidney Disease Patients [0.0]
慢性腎臓病(CKD)は、世界的に増加し、医療システムに高いコストがかかる。
データマイニングによるCKD指標の微妙なパターンの発見は、早期診断に寄与する。
本研究は、CKD患者の早期診断において、医療専門家を支援する分類器モデルを開発する。
論文 参考訳(メタデータ) (2021-05-21T14:09:43Z) - A random shuffle method to expand a narrow dataset and overcome the
associated challenges in a clinical study: a heart failure cohort example [50.591267188664666]
本研究の目的は、統計的に合法なHFデータセットのカーディナリティを高めるためにランダムシャッフル法を設計することであった。
提案されたランダムシャッフル法は、HFデータセットのカーディナリティを10回、およびランダムな繰り返し測定アプローチに続いて21回向上させることができた。
論文 参考訳(メタデータ) (2020-12-12T10:59:38Z) - An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。
半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。
本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-06T18:55:07Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。