論文の概要: Explainable Multi-class Classification of Medical Data
- arxiv url: http://arxiv.org/abs/2012.13796v1
- Date: Sat, 26 Dec 2020 18:56:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-25 01:36:41.979645
- Title: Explainable Multi-class Classification of Medical Data
- Title(参考訳): 説明可能な医療データの多クラス分類
- Authors: YuanZheng Hu, Marina Sokolova
- Abstract要約: 大規模医療データセットの多クラス分類について解説する。
この研究では、SVM(Support Vector Machine)、Na"ive Bayes、Gradient Boosting、Decision Trees、Random Forest、Logistic Regressionの6つのアルゴリズムが使用されている。
本研究では,23の薬物機能を用いて6つの応用学習アルゴリズムのうち5つのリコールを改善することを示した。
- 参考スコア(独自算出の注目度): 0.9137554315375922
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine Learning applications have brought new insights into a secondary
analysis of medical data. Machine Learning helps to develop new drugs, define
populations susceptible to certain illnesses, identify predictors of many
common diseases. At the same time, Machine Learning results depend on
convolution of many factors, including feature selection, class (im)balance,
algorithm preference, and performance metrics. In this paper, we present
explainable multi-class classification of a large medical data set. We in
details discuss knowledge-based feature engineering, data set balancing, best
model selection, and parameter tuning. Six algorithms are used in this study:
Support Vector Machine (SVM), Na\"ive Bayes, Gradient Boosting, Decision Trees,
Random Forest, and Logistic Regression. Our empirical evaluation is done on the
UCI Diabetes 130-US hospitals for years 1999-2008 dataset, with the task to
classify patient hospital re-admission stay into three classes: 0 days, <30
days, or > 30 days. Our results show that using 23 medication features in
learning experiments improves Recall of five out of the six applied learning
algorithms. This is a new result that expands the previous studies conducted on
the same data. Gradient Boosting and Random Forest outperformed other
algorithms in terms of the three-class classification Accuracy.
- Abstract(参考訳): 機械学習アプリケーションは、医療データの二次分析に新たな洞察をもたらした。
機械学習は、新しい薬物の開発を支援し、特定の病気に罹患する集団を定義し、多くの共通疾患の予測因子を特定する。
同時に、機械学習の結果は、特徴の選択、クラス(im)バランス、アルゴリズムの選好、パフォーマンスメトリクスなど、多くの要因の畳み込みに依存する。
本稿では,大規模医療データセットのマルチクラス分類について説明する。
本稿では,知識に基づく機能工学,データセットのバランス,最良のモデル選択,パラメータチューニングについて述べる。
この研究では、SVM(Support Vector Machine)、Na\"ive Bayes、Gradient Boosting、Decision Trees、Random Forest、Logistic Regressionの6つのアルゴリズムが使用されている。
UCI 糖尿病130-US 病院の1999-2008 年データセットにおける経験的評価を行い,患者病院の再入院期間を0日,<30日,>30日という3つのクラスに分類した。
その結果,23種類の薬品を学習実験で使用することにより,6種類の学習アルゴリズムのうち5つをリコールできることがわかった。
これは、同じデータで行った以前の研究を拡大する新しい結果である。
勾配ブースティングとランダムフォレストは他のアルゴリズムよりも3つの分類精度で優れていた。
関連論文リスト
- Predictive Modeling for Breast Cancer Classification in the Context of Bangladeshi Patients: A Supervised Machine Learning Approach with Explainable AI [0.0]
5種類の機械学習手法の分類精度,精度,リコール,F-1スコアを評価し,比較した。
XGBoostは97%という最高のモデル精度を達成した。
論文 参考訳(メタデータ) (2024-04-06T17:23:21Z) - Comparison of Machine Learning Classification Algorithms and Application
to the Framingham Heart Study [0.0]
医療における機械学習アルゴリズムの使用は、社会的不正と健康上の不平等を増幅することができる。
本研究は,機械学習分類アルゴリズムの開発と展開後における一般化可能性障害に関するものである。
論文 参考訳(メタデータ) (2024-02-22T22:49:35Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Does Deep Learning REALLY Outperform Non-deep Machine Learning for
Clinical Prediction on Physiological Time Series? [11.901347806586234]
EHRに基づく臨床予測タスクにおいて,機械学習モデルの性能を体系的に検討する。
3つのディープラーニングメソッドと7つの非深度学習メソッドを含む10のベースライン機械学習モデルを比較した。
その結果,深層学習は非深層学習よりも優れており,一定の条件下では優れていた。
論文 参考訳(メタデータ) (2022-11-11T07:09:49Z) - Analyzing Wearables Dataset to Predict ADLs and Falls: A Pilot Study [0.0]
本稿では,日常の生活と転倒の行動を認識するシステムの評価に使用できる,30のウェアラブルベースのデータセットを網羅的にレビューする。
5つの機械学習手法を用いたSisFallデータセットの比較分析をピソンで行う。
本研究から得られた結果は,KNNが他の機械学習手法よりも精度,精度,リコールの点で優れていることを証明している。
論文 参考訳(メタデータ) (2022-09-11T04:41:40Z) - Continual Learning with Bayesian Model based on a Fixed Pre-trained
Feature Extractor [55.9023096444383]
現在のディープラーニングモデルは、新しいクラスを学ぶ際に古い知識を破滅的に忘れることによって特徴づけられる。
人間の脳における新しい知識の学習プロセスに着想を得て,連続学習のためのベイズ生成モデルを提案する。
論文 参考訳(メタデータ) (2022-04-28T08:41:51Z) - LifeLonger: A Benchmark for Continual Disease Classification [59.13735398630546]
MedMNISTコレクションの連続的な疾患分類のためのベンチマークであるLifeLongerを紹介する。
タスクとクラスでの病気の漸進的な学習は、モデルをスクラッチから再トレーニングすることなく、新しいサンプルを分類する問題に対処する。
クロスドメインインクリメンタル学習は、これまで得られた知識を維持しながら、異なる機関から派生したデータセットを扱う問題に対処する。
論文 参考訳(メタデータ) (2022-04-12T12:25:05Z) - The Severity Prediction of The Binary And Multi-Class Cardiovascular
Disease -- A Machine Learning-Based Fusion Approach [0.0]
近年、CVD(心臓血管疾患)が世界中で死因となっている。
本研究はCVDの重症度とともに診断するためにいくつかの融合モデルを構築したものである。
マルチクラス分類の精度が最も高かったのは75%であり,2進法では95%であった。
論文 参考訳(メタデータ) (2022-03-09T18:06:24Z) - Relational Subsets Knowledge Distillation for Long-tailed Retinal
Diseases Recognition [65.77962788209103]
本研究では,長尾データを知識に基づいて複数のクラスサブセットに分割し,クラスサブセット学習を提案する。
モデルがサブセット固有の知識の学習に集中するように強制する。
提案手法は長期網膜疾患認識タスクに有効であることが判明した。
論文 参考訳(メタデータ) (2021-04-22T13:39:33Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。