論文の概要: Tree-Based Machine Learning Methods For Vehicle Insurance Claims Size
Prediction
- arxiv url: http://arxiv.org/abs/2302.10612v1
- Date: Tue, 21 Feb 2023 11:43:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-22 15:30:07.821666
- Title: Tree-Based Machine Learning Methods For Vehicle Insurance Claims Size
Prediction
- Title(参考訳): 自動車保険請求サイズ予測のための木ベース機械学習手法
- Authors: Edossa Merga Terefe
- Abstract要約: 自動車保険の請求額予測には、これらの請求を効率的に処理するための方法が必要である。
木に基づくアンサンブル学習アルゴリズムは、非常に効果的で広く使われている機械学習手法である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Vehicle insurance claims size prediction needs methods to efficiently handle
these claims. Machine learning (ML) is one of the methods that solve this
problem. Tree-based ensemble learning algorithms are highly effective and
widely used ML methods. This study considers how vehicle insurance providers
incorporate ML methods in their companies and explores how the models can be
applied to insurance big data. We utilize various tree-based ML methods, such
as bagging, random forest, and gradient boosting, to determine the relative
importance of predictors in predicting claims size and to explore the
relationships between claims size and predictors. Furthermore, we evaluate and
compare these models' performances. The results show that tree-based ensemble
methods are better than the classical least square method.
Keywords: claims size prediction; machine learning; tree-based ensemble
methods; vehicle insurance.
- Abstract(参考訳): 自動車保険の請求額予測には、これらの請求を効率的に扱う方法が必要である。
機械学習(ML)はこの問題を解決する方法の1つである。
木に基づくアンサンブル学習アルゴリズムは、非常に効果的で広く使われているML手法である。
本研究は、自動車保険業者が自社にml手法を組み込む方法を検討し、そのモデルを保険ビッグデータに適用する方法について検討するものである。
本研究では,バッジ,ランダム林,勾配増進などの木に基づくML手法を用いて,クレームサイズ予測における予測器の相対的重要性を推定し,クレームサイズと予測器の関係について検討する。
さらに,これらのモデルの性能を評価し,比較する。
その結果,木に基づくアンサンブル法は従来の最小二乗法よりも優れていることがわかった。
キーワード:クレームサイズ予測、機械学習、ツリーベースのアンサンブルメソッド、自動車保険。
関連論文リスト
- A Closer Look at Deep Learning on Tabular Data [52.50778536274327]
タブラルデータは、機械学習の様々な領域で広く使われている。
Deep Neural Network(DNN)ベースの手法は、ツリーベースに匹敵する有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-07-01T04:24:07Z) - Optimized Feature Generation for Tabular Data via LLMs with Decision Tree Reasoning [53.241569810013836]
本稿では,大規模言語モデル(LLM)を用いて,効率的な特徴生成ルールを同定するフレームワークを提案する。
我々は、自然言語で容易に表現できるため、この推論情報を伝達するために決定木を使用します。
OCTreeは様々なベンチマークで様々な予測モデルの性能を継続的に向上させる。
論文 参考訳(メタデータ) (2024-06-12T08:31:34Z) - Evaluating and Explaining Large Language Models for Code Using Syntactic
Structures [74.93762031957883]
本稿では,コード用大規模言語モデルに特有の説明可能性手法であるASTxplainerを紹介する。
その中核にあるASTxplainerは、トークン予測をASTノードに整合させる自動メソッドを提供する。
私たちは、最も人気のあるGitHubプロジェクトのキュレートデータセットを使用して、コード用の12の人気のあるLLMに対して、実証的な評価を行います。
論文 参考訳(メタデータ) (2023-08-07T18:50:57Z) - Predicted Embedding Power Regression for Large-Scale Out-of-Distribution
Detection [77.1596426383046]
本研究では,学習過程において学習したラベル分布に基づいて,予測されたクラスラベルの確率を計算する手法を開発した。
提案手法は,計算コストの最小化のみで,現在の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2023-03-07T18:28:39Z) - Heterogeneous Ensemble Learning for Enhanced Crash Forecasts -- A
Frequentest and Machine Learning based Stacking Framework [0.803552105641624]
本研究では,都市および郊外の5車線未分割セグメント(5T)の衝突頻度をモデル化するために,重要なHEM手法の1つ,スタックリングを適用した。
Stackingの予測性能は、パラメトリック統計モデル(Poissonと負二項法)と機械学習技術の3つの状態(決定木、ランダム森林、勾配上昇)と比較される。
論文 参考訳(メタデータ) (2022-07-21T19:15:53Z) - Prediction of motor insurance claims occurrence as an imbalanced machine
learning problem [0.0]
巨大なデータセットを持つ保険業界は、ビッグデータソリューションを使用する自然な場所です。
この研究の主な目的は、不均衡なデータセットを扱う様々な方法を提示し、適用することである。
また,自動車保険におけるクレーム発生予測の文脈において,これらの手法を用いて機械学習アルゴリズムの結果を比較した。
論文 参考訳(メタデータ) (2022-04-12T22:41:47Z) - Explaining random forest prediction through diverse rulesets [0.0]
Local Tree eXtractor (LTreeX)は、与えられたテストインスタンスのフォレスト予測を、いくつかの異なるルールで説明することができる。
提案手法は予測性能の点で他の説明可能な手法よりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2022-03-29T12:54:57Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z) - Robust Similarity and Distance Learning via Decision Forests [8.587164648430251]
距離学習のための新たな決定森林アルゴリズムを提案し,これをSimisity and Metric Random Forests(SMERF)と呼ぶ。
任意の距離を近似し、重要な特徴を識別する能力は、シミュレーションデータセット上で実証的に実証されている。
論文 参考訳(メタデータ) (2020-07-27T20:17:42Z) - MurTree: Optimal Classification Trees via Dynamic Programming and Search [61.817059565926336]
動的プログラミングと探索に基づいて最適な分類木を学習するための新しいアルゴリズムを提案する。
当社のアプローチでは,最先端技術が必要とする時間のごく一部しか使用せず,数万のインスタンスでデータセットを処理することが可能です。
論文 参考訳(メタデータ) (2020-07-24T17:06:55Z) - Does imputation matter? Benchmark for predictive models [5.802346990263708]
本稿では,予測モデルに対するデータ計算アルゴリズムの実証的効果を体系的に評価する。
主な貢献は,(1)実生活の分類タスクに基づく経験的ベンチマークのための一般的な手法の推薦である。
論文 参考訳(メタデータ) (2020-07-06T15:47:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。