論文の概要: Performance Evaluation of Regression Models in Predicting the Cost of
Medical Insurance
- arxiv url: http://arxiv.org/abs/2304.12605v1
- Date: Tue, 25 Apr 2023 06:33:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-26 21:39:15.080304
- Title: Performance Evaluation of Regression Models in Predicting the Cost of
Medical Insurance
- Title(参考訳): 医療保険コスト予測における回帰モデルの性能評価
- Authors: Jonelle Angelo S. Cenita, Paul Richie F. Asuncion, Jayson M.
Victoriano
- Abstract要約: 機械学習における3つの回帰モデル、すなわち線形回帰、グラディエントブースティング、サポートベクトルマシンが使用された。
性能はRMSE(Root Mean Square)、r2(R Square)、K-Fold Cross-validation(K-Fold Cross-validation)を用いて評価される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The study aimed to evaluate the regression models' performance in predicting
the cost of medical insurance. The Three (3) Regression Models in Machine
Learning namely Linear Regression, Gradient Boosting, and Support Vector
Machine were used. The performance will be evaluated using the metrics RMSE
(Root Mean Square), r2 (R Square), and K-Fold Cross-validation. The study also
sought to pinpoint the feature that would be most important in predicting the
cost of medical insurance.The study is anchored on the knowledge discovery in
databases (KDD) process. (KDD) process refers to the overall process of
discovering useful knowledge from data. It show the performance evaluation
results reveal that among the three (3) Regression models, Gradient boosting
received the highest r2 (R Square) 0.892 and the lowest RMSE (Root Mean Square)
1336.594. Furthermore, the 10-Fold Cross-validation weighted mean findings are
not significantly different from the r2 (R Square) results of the three (3)
regression models. In addition, Exploratory Data Analysis (EDA) using a box
plot of descriptive statistics observed that in the charges and smoker features
the median of one group lies outside of the box of the other group, so there is
a difference between the two groups. It concludes that Gradient boosting
appears to perform better among the three (3) regression models. K-Fold
Cross-Validation concluded that the three (3) regression models are good.
Moreover, Exploratory Data Analysis (EDA) using a box plot of descriptive
statistics ceases that the highest charges are due to the smoker feature.
- Abstract(参考訳): 本研究は,医療保険の費用予測における回帰モデルの性能評価を目的とした。
機械学習における3つの回帰モデル、すなわち線形回帰、グラディエントブースティング、サポートベクトルマシンが使用された。
性能はRMSE(Root Mean Square)、r2(R Square)、K-Fold Cross-validationを用いて評価される。
この研究はまた、医療保険のコストを予測する上で最も重要な特徴を指摘し、データベース(KDD)プロセスにおける知識発見に依存している。
(KDD)プロセスとは、データから有用な知識を発見するプロセス全般を指す。
その結果, 3つの回帰モデルのうち, 勾配ブースティングが最も高い r2 (r 平方) 0.892 と最低 rmse (根平均平方根) 1336.594 が得られた。
さらに,3つの回帰モデルのr2(R角)結果と10Foldクロスバリデーション重み付き平均値の有意差は認められなかった。
また、記述統計のボックスプロットを用いた探索データ解析(eda)では、電荷と喫煙者の特徴として、あるグループの中央値が他のグループのボックスの外側にあることが観察されているため、2つのグループの間には違いがある。
グラディエント・ブースティングは3つの回帰モデルでより良い性能を発揮すると結論付けている。
K-Fold Cross-Validation は、3つの回帰モデルが良いと結論付けた。
さらに、記述統計のボックスプロットを用いた探索データ分析(EDA)では、最も高い料金は喫煙者の特徴によるものであると断定する。
関連論文リスト
- Distribution Learning for Molecular Regression [10.96062816455682]
Distributional Mixture of Experts (DMoE) はモデルに依存しない、データに依存しない回帰法である。
分子特性予測データセットを用いたDMoEの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-30T00:21:51Z) - ZeroShape: Regression-based Zero-shot Shape Reconstruction [56.652766763775226]
単一画像ゼロショット3次元形状再構成の問題点について検討する。
最近の研究は、3Dアセットの生成的モデリングを通してゼロショット形状復元を学習している。
我々はZeroShapeが最先端の手法よりも優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2023-12-21T01:56:34Z) - Machine Learning For An Explainable Cost Prediction of Medical Insurance [0.0]
医療保険コストを予測するために3つの回帰ベースのアンサンブルMLモデルが導入された。
R-squared, Mean Absolute Error, Root Mean Squared Error, Mean Absolute Percentage Errorの4つの評価指標を用いて評価を行った。
論文 参考訳(メタデータ) (2023-11-23T18:13:34Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Reveal to Revise: An Explainable AI Life Cycle for Iterative Bias
Correction of Deep Models [11.879170124003252]
最先端の機械学習モデルは、トレーニングデータに埋め込まれた急激な相関を学習することが多い。
これにより、これらのモデルを高い意思決定のためにデプロイする際のリスクが生じる。
そこで我々はReveal to Revise (R2R)を提案する。
論文 参考訳(メタデータ) (2023-03-22T15:23:09Z) - Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。
AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。
誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文 参考訳(メタデータ) (2022-09-22T04:32:51Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Human Pose Regression with Residual Log-likelihood Estimation [48.30425850653223]
本稿では,Residual Log-likelihood Estimation (RLE) を用いた新たな回帰パラダイムを提案する。
RLEは、トレーニングプロセスを容易にするために、未参照の基盤となる分布ではなく、分布の変化を学習する。
従来の回帰パラダイムと比較して、RLEによる回帰はテスト時間オーバーヘッドを伴わずに、MSCOCOに12.4mAPの改善をもたらす。
論文 参考訳(メタデータ) (2021-07-23T15:06:31Z) - Semiparametric count data regression for self-reported mental health [0.3553493344868413]
データレグレッションをカウントするための半パラメトリック推定および推測フレームワークを設計する。
データ生成プロセスは、潜在ガウス回帰モデルであるSTARを同時に変換して定義される。
STARは、自己報告されたメンタルヘルスに関連する要因を研究するためにデプロイされ、既存のカウントデータ回帰モデルと比較して、適合性を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-16T20:38:13Z) - Enhanced Doubly Robust Learning for Debiasing Post-click Conversion Rate
Estimation [29.27760413892272]
クリック後の変換は、ユーザの好みを示す強いシグナルであり、レコメンデーションシステムを構築する上で有益である。
現在、ほとんどの既存の手法は、対実学習を利用してレコメンデーションシステムを破壊している。
本稿では,MRDR推定のための新しい二重学習手法を提案し,誤差計算を一般的なCVR推定に変換する。
論文 参考訳(メタデータ) (2021-05-28T06:59:49Z) - Regression Bugs Are In Your Model! Measuring, Reducing and Analyzing
Regressions In NLP Model Updates [68.09049111171862]
この研究は、NLPモデル更新における回帰エラーの定量化、低減、分析に重点を置いている。
回帰フリーモデル更新を制約付き最適化問題に定式化する。
モデルアンサンブルが回帰を減らす方法を実証的に分析します。
論文 参考訳(メタデータ) (2021-05-07T03:33:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。