論文の概要: Detecting Chronic Kidney Disease(CKD) at the Initial Stage: A Novel
Hybrid Feature-selection Method and Robust Data Preparation Pipeline for
Different ML Techniques
- arxiv url: http://arxiv.org/abs/2203.01394v1
- Date: Wed, 2 Mar 2022 20:38:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-04 14:33:55.915848
- Title: Detecting Chronic Kidney Disease(CKD) at the Initial Stage: A Novel
Hybrid Feature-selection Method and Robust Data Preparation Pipeline for
Different ML Techniques
- Title(参考訳): 早期に慢性腎臓病(CKD)を検出する:新しいハイブリッド特徴選択法と異なるML技術のためのロバストデータ作成パイプライン
- Authors: Md. Taufiqul Haque Khan Tusar, Md. Touhidul Islam, Foyjul Islam Raju
- Abstract要約: 慢性腎臓病(CKD)は世界中で8億人近くに感染している。毎年約170万人が死亡している。
多くの研究者は、CKDを早期に検出するために異なる機械学習(ML)手法を適用しているが、詳細な研究はいまだに欠けている。
本稿では,医療データの複雑さを最適性能で扱うための構造的かつ徹底的な手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chronic Kidney Disease (CKD) has infected almost 800 million people around
the world. Around 1.7 million people die each year because of it. Detecting CKD
in the initial stage is essential for saving millions of lives. Many
researchers have applied distinct Machine Learning (ML) methods to detect CKD
at an early stage, but detailed studies are still missing. We present a
structured and thorough method for dealing with the complexities of medical
data with optimal performance. Besides, this study will assist researchers in
producing clear ideas on the medical data preparation pipeline. In this paper,
we applied KNN Imputation to impute missing values, Local Outlier Factor to
remove outliers, SMOTE to handle data imbalance, K-stratified K-fold
Cross-validation to validate the ML models, and a novel hybrid feature
selection method to remove redundant features. Applied algorithms in this study
are Support Vector Machine, Gaussian Naive Bayes, Decision Tree, Random Forest,
Logistic Regression, K-Nearest Neighbor, Gradient Boosting, Adaptive Boosting,
and Extreme Gradient Boosting. Finally, the Random Forest can detect CKD with
100% accuracy without any data leakage.
- Abstract(参考訳): 慢性腎臓病(CKD)は世界中で8億人近くに感染している。
毎年約170万人が死亡している。
CKDを早期に検出することは、数百万人の命を救うのに不可欠である。
多くの研究者がCKDを早期に検出するために異なる機械学習(ML)手法を適用しているが、詳細な研究はいまだに欠けている。
本稿では,医療データの複雑さを最適性能で扱うための構造的かつ徹底的な手法を提案する。
さらに,本研究は,医療データ作成パイプラインに関する明確なアイデアの創出を支援する。
本稿では,KNNインプットを欠落した値をインプットするために,ローカル・アウトリー・ファクター(Local Outlier Factor),データ不均衡を処理するSMOTE,MLモデルの検証を行うK-stratified K-fold Cross-validation,冗長な特徴を除去する新しいハイブリッド特徴選択法を提案する。
この研究に応用されたアルゴリズムは、Support Vector Machine、Gaussian Naive Bayes、Decision Tree、Random Forest、Logistic Regression、K-Nearest Neighbor、Gradient Boosting、Adaptive Boosting、Extreme Gradient Boostingである。
最後に、Random Forestはデータ漏洩なしにCKDを100%精度で検出できる。
関連論文リスト
- Unified dimensionality reduction techniques in chronic liver disease detection [0.5242869847419834]
本研究では,多くの機械学習アルゴリズムについて検討した。
本研究の主な焦点は, 583名の患者の医療記録を含む, このデータセットである。
検索は、カスタマイズされた特徴抽出と次元削減方法の選択と使用に関する重要な新しい視点を提供する。
論文 参考訳(メタデータ) (2024-12-30T18:35:02Z) - Two new feature selection methods based on learn-heuristic techniques for breast cancer prediction: A comprehensive analysis [6.796017024594715]
帝国主義競争アルゴリズム(ICA)とバットアルゴリズム(BA)に基づく2つの新しい特徴選択法を提案する。
本研究は, 診断モデルの効率を向上し, 臨床医師がこれまでよりもはるかに正確かつ信頼性の高い意思決定を行えるよう包括的分析を行うことを目的とする。
論文 参考訳(メタデータ) (2024-07-19T19:07:53Z) - Lung-CADex: Fully automatic Zero-Shot Detection and Classification of Lung Nodules in Thoracic CT Images [45.29301790646322]
コンピュータ支援診断は早期の肺結節の検出に役立ち、その後の結節の特徴づけを促進する。
MedSAMと呼ばれるSegment Anything Modelの変種を用いて肺結節をゼロショットでセグメント化するためのCADeを提案する。
また、放射能特徴のギャラリーを作成し、コントラスト学習を通じて画像と画像のペアを整列させることにより、良性/良性としての結節的特徴付けを行うCADxを提案する。
論文 参考訳(メタデータ) (2024-07-02T19:30:25Z) - An Improved Heart Disease Prediction Using Stacked Ensemble Method [0.9187159782788579]
機械学習を用いた心疾患予測システムを構築した。
心臓疾患のある人と正常な人とを簡単に区別することができる。
論文 参考訳(メタデータ) (2023-04-12T17:53:59Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Building Brains: Subvolume Recombination for Data Augmentation in Large
Vessel Occlusion Detection [56.67577446132946]
この戦略をデータから学ぶためには、標準的なディープラーニングベースのモデルに対して、大規模なトレーニングデータセットが必要である。
そこで本研究では, 異なる患者から血管木セグメントを組換えることで, 人工的なトレーニングサンプルを生成する方法を提案する。
拡張スキームに則って,タスク固有の入力を入力した3D-DenseNetを用いて,半球間の比較を行う。
論文 参考訳(メタデータ) (2022-05-05T10:31:57Z) - StRegA: Unsupervised Anomaly Detection in Brain MRIs using a Compact
Context-encoding Variational Autoencoder [48.2010192865749]
教師なし異常検出(UAD)は、健康な被験者の異常なデータセットからデータ分布を学習し、分布サンプルの抽出に応用することができる。
本研究では,コンテクストエンコーディング(context-encoding)VAE(ceVAE)モデルのコンパクトバージョンと,前処理と後処理のステップを組み合わせて,UADパイプライン(StRegA)を作成することを提案する。
提案したパイプラインは、BraTSデータセットのT2w画像と0.859$pm$0.112の腫瘍を検出しながら、Diceスコアが0.642$pm$0.101に達した。
論文 参考訳(メタデータ) (2022-01-31T14:27:35Z) - Survival Prediction of Children Undergoing Hematopoietic Stem Cell
Transplantation Using Different Machine Learning Classifiers by Performing
Chi-squared Test and Hyper-parameter Optimization: A Retrospective Analysis [4.067706269490143]
効率的な生存率分類モデルが包括的に提示される。
欠落した値を入力し、ダミー変数符号化を用いてデータを変換し、チ二乗特徴選択を用いて59個の特徴から11個の最も相関した特徴にデータセットを圧縮することにより、合成データセットを生成する。
この点に関しては、決定木(Decision Tree)、ランダムフォレスト(Random Forest)、ロジスティック回帰(Logistic Regression)、K-Nearest Neighbors(K-Nearest Neighbors)、グラディエントブースティング(Gradient Boosting)、Ada Boost(Ada Boost)、XG Boost(XG Boost)など、いくつかの教師付きML手法が訓練された。
論文 参考訳(メタデータ) (2022-01-22T08:01:22Z) - An Explainable Classification Model for Chronic Kidney Disease Patients [0.0]
慢性腎臓病(CKD)は、世界的に増加し、医療システムに高いコストがかかる。
データマイニングによるCKD指標の微妙なパターンの発見は、早期診断に寄与する。
本研究は、CKD患者の早期診断において、医療専門家を支援する分類器モデルを開発する。
論文 参考訳(メタデータ) (2021-05-21T14:09:43Z) - An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。
半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。
本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-06T18:55:07Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。