論文の概要: Comparison of Machine Learning Classification Algorithms and Application
to the Framingham Heart Study
- arxiv url: http://arxiv.org/abs/2402.15005v1
- Date: Thu, 22 Feb 2024 22:49:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-26 16:07:33.243793
- Title: Comparison of Machine Learning Classification Algorithms and Application
to the Framingham Heart Study
- Title(参考訳): 機械学習分類アルゴリズムの比較とframingham heart studyへの応用
- Authors: Nabil Kahouadji
- Abstract要約: 医療における機械学習アルゴリズムの使用は、社会的不正と健康上の不平等を増幅することができる。
本研究は,機械学習分類アルゴリズムの開発と展開後における一般化可能性障害に関するものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The use of machine learning algorithms in healthcare can amplify social
injustices and health inequities. While the exacerbation of biases can occur
and compound during the problem selection, data collection, and outcome
definition, this research pertains to some generalizability impediments that
occur during the development and the post-deployment of machine learning
classification algorithms. Using the Framingham coronary heart disease data as
a case study, we show how to effectively select a probability cutoff to convert
a regression model for a dichotomous variable into a classifier. We then
compare the sampling distribution of the predictive performance of eight
machine learning classification algorithms under four training/testing
scenarios to test their generalizability and their potential to perpetuate
biases. We show that both the Extreme Gradient Boosting, and Support Vector
Machine are flawed when trained on an unbalanced dataset. We introduced and
show that the double discriminant scoring of type I is the most generalizable
as it consistently outperforms the other classification algorithms regardless
of the training/testing scenario. Finally, we introduce a methodology to
extract an optimal variable hierarchy for a classification algorithm, and
illustrate it on the overall, male and female Framingham coronary heart disease
data.
- Abstract(参考訳): 医療における機械学習アルゴリズムの使用は、社会的不正や健康不平等を増幅することができる。
偏見の悪化は、問題選択、データ収集、結果定義において起こりうるが、この研究は、開発中に発生する一般化可能性障害と、機械学習分類アルゴリズムのポストデプロイに関連するものである。
フレイミングハム冠状動脈疾患データを用いて, 確率遮断を効果的に選択し, ディコトクス変数の回帰モデルを分類器に変換する方法について検討した。
次に,4つのトレーニング/テストシナリオに基づく8つの機械学習分類アルゴリズムの予測性能のサンプリング分布を比較し,それらの一般化可能性とバイアスの持続可能性を検証する。
非バランスデータセットでトレーニングされた場合、極端な勾配ブースティングとサポートベクターマシンの両方に欠陥があることが分かる。
学習・テストシナリオによらず,他の分類アルゴリズムを常に上回っているため,タイプIの二重判別スコアが最も一般化可能であることを示す。
最後に, 分類アルゴリズムの最適変数階層を抽出し, 総, 男性, 女性, フレイミングハム冠状動脈疾患データに記述する手法を提案する。
関連論文リスト
- The Impact of Ontology on the Prediction of Cardiovascular Disease Compared to Machine Learning Algorithms [0.0]
本稿では,最も顕著な機械学習アルゴリズムと,オントロジーに基づく機械学習分類を比較し,レビューする。
これらの結果は, F-Measure, Accuracy, Recall, Precision などの混乱行列から生成された評価値を用いて評価した。
論文 参考訳(メタデータ) (2024-05-30T18:40:27Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - Anomaly Detection using Ensemble Classification and Evidence Theory [62.997667081978825]
本稿では,アンサンブル分類とエビデンス理論を用いた新しい検出手法を提案する。
固体アンサンブル分類器を構築するためのプール選択戦略が提示される。
我々は異常検出手法の不確実性を利用する。
論文 参考訳(メタデータ) (2022-12-23T00:50:41Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Machine Learning-Based Classification Algorithms for the Prediction of
Coronary Heart Diseases [0.0]
この研究は、いくつかの機械学習に基づく分類モデルを作成し、テストした。
その結果、ロジスティック回帰は、元のデータセット上で最高のパフォーマンススコアを生み出した。
結論として,順調に処理され,標準化されたデータセット上のLRが,他のアルゴリズムよりも精度の高い冠状心疾患を予測できることが示唆された。
論文 参考訳(メタデータ) (2021-12-02T18:52:56Z) - Does Your Dermatology Classifier Know What It Doesn't Know? Detecting
the Long-Tail of Unseen Conditions [18.351120611713586]
皮膚の状態を正確に分類できる深層学習システムを開発し,厳密に評価した。
このタスクは、アウトオブディストリビューション(OOD)検出問題としてフレーム化します。
我々の新しいアプローチである階層外乱検出(HOD)は、各トレーニングクラスに対して複数の禁制クラスを割り当て、インレーヤ対外乱の粗い分類を共同で行う。
論文 参考訳(メタデータ) (2021-04-08T15:15:22Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Analysing Risk of Coronary Heart Disease through Discriminative Neural
Networks [18.124078832445967]
診断のような重要なアプリケーションでは、このクラス不均衡は見過ごせない。
我々は、識別モデルと対照的な損失を用いて、ニューラルネットワークを介して、このクラス不均衡をどう扱えるかを説明する。
論文 参考訳(メタデータ) (2020-06-17T06:30:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。