論文の概要: Explainable Multi-class Classification of Medical Data
- arxiv url: http://arxiv.org/abs/2012.13796v1
- Date: Sat, 26 Dec 2020 18:56:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-25 01:36:41.979645
- Title: Explainable Multi-class Classification of Medical Data
- Title(参考訳): 説明可能な医療データの多クラス分類
- Authors: YuanZheng Hu, Marina Sokolova
- Abstract要約: 大規模医療データセットの多クラス分類について解説する。
この研究では、SVM(Support Vector Machine)、Na"ive Bayes、Gradient Boosting、Decision Trees、Random Forest、Logistic Regressionの6つのアルゴリズムが使用されている。
本研究では,23の薬物機能を用いて6つの応用学習アルゴリズムのうち5つのリコールを改善することを示した。
- 参考スコア(独自算出の注目度): 0.9137554315375922
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine Learning applications have brought new insights into a secondary
analysis of medical data. Machine Learning helps to develop new drugs, define
populations susceptible to certain illnesses, identify predictors of many
common diseases. At the same time, Machine Learning results depend on
convolution of many factors, including feature selection, class (im)balance,
algorithm preference, and performance metrics. In this paper, we present
explainable multi-class classification of a large medical data set. We in
details discuss knowledge-based feature engineering, data set balancing, best
model selection, and parameter tuning. Six algorithms are used in this study:
Support Vector Machine (SVM), Na\"ive Bayes, Gradient Boosting, Decision Trees,
Random Forest, and Logistic Regression. Our empirical evaluation is done on the
UCI Diabetes 130-US hospitals for years 1999-2008 dataset, with the task to
classify patient hospital re-admission stay into three classes: 0 days, <30
days, or > 30 days. Our results show that using 23 medication features in
learning experiments improves Recall of five out of the six applied learning
algorithms. This is a new result that expands the previous studies conducted on
the same data. Gradient Boosting and Random Forest outperformed other
algorithms in terms of the three-class classification Accuracy.
- Abstract(参考訳): 機械学習アプリケーションは、医療データの二次分析に新たな洞察をもたらした。
機械学習は、新しい薬物の開発を支援し、特定の病気に罹患する集団を定義し、多くの共通疾患の予測因子を特定する。
同時に、機械学習の結果は、特徴の選択、クラス(im)バランス、アルゴリズムの選好、パフォーマンスメトリクスなど、多くの要因の畳み込みに依存する。
本稿では,大規模医療データセットのマルチクラス分類について説明する。
本稿では,知識に基づく機能工学,データセットのバランス,最良のモデル選択,パラメータチューニングについて述べる。
この研究では、SVM(Support Vector Machine)、Na\"ive Bayes、Gradient Boosting、Decision Trees、Random Forest、Logistic Regressionの6つのアルゴリズムが使用されている。
UCI 糖尿病130-US 病院の1999-2008 年データセットにおける経験的評価を行い,患者病院の再入院期間を0日,<30日,>30日という3つのクラスに分類した。
その結果,23種類の薬品を学習実験で使用することにより,6種類の学習アルゴリズムのうち5つをリコールできることがわかった。
これは、同じデータで行った以前の研究を拡大する新しい結果である。
勾配ブースティングとランダムフォレストは他のアルゴリズムよりも3つの分類精度で優れていた。
関連論文リスト
- Continual Learning with Bayesian Model based on a Fixed Pre-trained
Feature Extractor [55.9023096444383]
現在のディープラーニングモデルは、新しいクラスを学ぶ際に古い知識を破滅的に忘れることによって特徴づけられる。
人間の脳における新しい知識の学習プロセスに着想を得て,連続学習のためのベイズ生成モデルを提案する。
論文 参考訳(メタデータ) (2022-04-28T08:41:51Z) - Neurochaos Feature Transformation and Classification for Imbalanced
Learning [0.0]
制限付きと不均衡なデータから学ぶことは、人工知能コミュニティでは難しい問題だ。
ヒト脳におけるカオス性神経細胞の発火に触発され、ニューロカオス学習(NL)と呼ばれる新しい学習アルゴリズムが最近提案された。
本稿では,ニューロカオスに基づく特徴変換と従来のMLアルゴリズムを用いた抽出のユニークな組み合わせを提案する。
論文 参考訳(メタデータ) (2022-04-20T16:11:45Z) - Application of Transfer Learning and Ensemble Learning in Image-level
Classification for Breast Histopathology [9.037868656840736]
CAD(Computer-Aided Diagnosis)では、従来の分類モデルでは、主に1つのネットワークを使って特徴を抽出する。
本稿では良性病変と悪性病変のバイナリ分類のための画像レベルラベルに基づく深層アンサンブルモデルを提案する。
結果: アンサンブルネットワークモデルにおいて、画像レベルのバイナリ分類は9,8.90%の精度を達成する。
論文 参考訳(メタデータ) (2022-04-18T13:31:53Z) - LifeLonger: A Benchmark for Continual Disease Classification [59.13735398630546]
MedMNISTコレクションの連続的な疾患分類のためのベンチマークであるLifeLongerを紹介する。
タスクとクラスでの病気の漸進的な学習は、モデルをスクラッチから再トレーニングすることなく、新しいサンプルを分類する問題に対処する。
クロスドメインインクリメンタル学習は、これまで得られた知識を維持しながら、異なる機関から派生したデータセットを扱う問題に対処する。
論文 参考訳(メタデータ) (2022-04-12T12:25:05Z) - The Severity Prediction of The Binary And Multi-Class Cardiovascular
Disease -- A Machine Learning-Based Fusion Approach [0.0]
近年、CVD(心臓血管疾患)が世界中で死因となっている。
本研究はCVDの重症度とともに診断するためにいくつかの融合モデルを構築したものである。
マルチクラス分類の精度が最も高かったのは75%であり,2進法では95%であった。
論文 参考訳(メタデータ) (2022-03-09T18:06:24Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Medulloblastoma Tumor Classification using Deep Transfer Learning with
Multi-Scale EfficientNets [63.62764375279861]
本稿では,エンド・ツー・エンドのMB腫瘍分類を提案し,様々な入力サイズとネットワーク次元の一致した移動学習を提案する。
161ケースのデータセットを用いて、より大規模な入力解像度を持つ事前学習されたEfficientNetが、大幅な性能改善をもたらすことを実証した。
論文 参考訳(メタデータ) (2021-09-10T13:07:11Z) - Explainable Multi-class Classification of the CAMH COVID-19 Mental
Health Data [0.9137554315375922]
本稿では,Covid-19のメンタルヘルスデータの多クラス分類について述べる。
機械学習研究では、コビッドウイルスのパンデミックにおいて、個人のメンタルヘルスに影響を与える潜在的な要因を見つけることを目的としている。
論文 参考訳(メタデータ) (2021-05-27T20:08:58Z) - Relational Subsets Knowledge Distillation for Long-tailed Retinal
Diseases Recognition [65.77962788209103]
本研究では,長尾データを知識に基づいて複数のクラスサブセットに分割し,クラスサブセット学習を提案する。
モデルがサブセット固有の知識の学習に集中するように強制する。
提案手法は長期網膜疾患認識タスクに有効であることが判明した。
論文 参考訳(メタデータ) (2021-04-22T13:39:33Z) - SSLM: Self-Supervised Learning for Medical Diagnosis from MR Video [19.5917119072985]
本稿では,磁気共鳴(MR)ビデオクリップから空間解剖学的表現を学習するための自己教師型学習手法を提案する。
提案する前文モデルは意味のある空間的文脈不変表現を学習する。
異なる実験は、プリテキストモデルによって学習された特徴が下流タスクで説明可能なパフォーマンスを提供することを示している。
論文 参考訳(メタデータ) (2021-04-21T12:01:49Z) - Active learning for medical code assignment [55.99831806138029]
臨床領域における多ラベルテキスト分類におけるアクティブラーニング(AL)の有効性を示す。
MIMIC-IIIデータセットにICD-9コードを自動的に割り当てるために、よく知られたALメソッドのセットを適用します。
その結果、有益なインスタンスの選択は、大幅に減少したトレーニングセットで満足のいく分類を提供する。
論文 参考訳(メタデータ) (2021-04-12T18:11:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。