論文の概要: Zero-Inflated Tweedie Boosted Trees with CatBoost for Insurance Loss Analytics
- arxiv url: http://arxiv.org/abs/2406.16206v1
- Date: Sun, 23 Jun 2024 20:03:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-25 18:34:57.463032
- Title: Zero-Inflated Tweedie Boosted Trees with CatBoost for Insurance Loss Analytics
- Title(参考訳): ゼロ膨らませたツイーディ、キャットブースで木を膨らませる-保険の損失分析
- Authors: Banghee So, Emiliano A. Valdez,
- Abstract要約: 我々はTweedie回帰モデルを変更し、自動車、健康、責任などの各種保険の総括請求をモデル化する際の限界に対処する。
我々の推奨するアプローチは、予測精度を高めるために反復的なプロセスを活用するのに役立つため、0-claimプロセスの洗練されたモデリングとブースティング手法の統合である。
モデル化の結果, モデル性能が著しく向上し, 保険請求分析に適した精度の予測を行う可能性が示された。
- 参考スコア(独自算出の注目度): 0.8287206589886881
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we explore advanced modifications to the Tweedie regression model in order to address its limitations in modeling aggregate claims for various types of insurance such as automobile, health, and liability. Traditional Tweedie models, while effective in capturing the probability and magnitude of claims, usually fall short in accurately representing the large incidence of zero claims. Our recommended approach involves a refined modeling of the zero-claim process, together with the integration of boosting methods in order to help leverage an iterative process to enhance predictive accuracy. Despite the inherent slowdown in learning algorithms due to this iteration, several efficient implementation techniques that also help precise tuning of parameter like XGBoost, LightGBM, and CatBoost have emerged. Nonetheless, we chose to utilize CatBoost, a efficient boosting approach that effectively handles categorical and other special types of data. The core contribution of our paper is the assembly of separate modeling for zero claims and the application of tree-based boosting ensemble methods within a CatBoost framework, assuming that the inflated probability of zero is a function of the mean parameter. The efficacy of our enhanced Tweedie model is demonstrated through the application of an insurance telematics dataset, which presents the additional complexity of compositional feature variables. Our modeling results reveal a marked improvement in model performance, showcasing its potential to deliver more accurate predictions suitable for insurance claim analytics.
- Abstract(参考訳): 本稿では,自動車,健康,責任などの各種保険の集合的請求をモデル化する際の限界に対処するため,Tweedie回帰モデルの改良について検討する。
伝統的なツイーディーモデルは、請求の確率と大きさを捉えるのに効果的であるが、通常、ゼロ請求の大量発生を正確に表すには不十分である。
我々の推奨するアプローチは、予測精度を高めるために反復的なプロセスを活用するのに役立つため、0-claimプロセスの洗練されたモデリングとブースティング手法の統合である。
この反復による学習アルゴリズムの本質的にの減速にもかかわらず、XGBoost、LightGBM、CatBoostといったパラメータの正確なチューニングを支援する効率的な実装技術がいくつか出現している。
それにもかかわらず、私たちはカテゴリやその他の特殊なデータを効果的に扱う効率的なブースティングアプローチであるCatBoostを使うことを選択しました。
本論文の中核的な貢献は、ゼロクレームに対する別個のモデリングと、ゼロの膨らみ確率が平均パラメータの関数であることを仮定して、CatBoostフレームワーク内でツリーベースのブースティングアンサンブル手法の適用である。
Tweedieモデルの有効性を保険テレマティクス・データセットの適用により実証し,構成的特徴変数のさらなる複雑さを示す。
モデル化の結果, モデル性能が著しく向上し, 保険請求分析に適した精度の予測を行う可能性が示された。
関連論文リスト
- Learn from the Past: A Proxy Guided Adversarial Defense Framework with
Self Distillation Regularization [53.04697800214848]
敵対的訓練(AT)は、ディープラーニングモデルの堅牢性を固める上で重要な要素である。
AT方式は、目標モデルの防御のために直接反復的な更新を頼りにしており、不安定な訓練や破滅的なオーバーフィッティングといった障害に頻繁に遭遇する。
汎用プロキシガイド型防衛フレームワークLAST(bf Pbf astから学ぶ)を提案する。
論文 参考訳(メタデータ) (2023-10-19T13:13:41Z) - Enhanced Gradient Boosting for Zero-Inflated Insurance Claims and Comparative Analysis of CatBoost, XGBoost, and LightGBM [0.0]
CatBoostは、予測性能に基づいた自動クレーム頻度モデルを開発するための最良のライブラリである。
そこで我々は, インフレ確率$p$と分布平均$mu$の関係を仮定した, ゼロ膨張ポアソン強化木モデルを提案する。
論文 参考訳(メタデータ) (2023-07-15T10:54:46Z) - Precision-Recall Divergence Optimization for Generative Modeling with
GANs and Normalizing Flows [54.050498411883495]
本研究では,ジェネレーティブ・アドバイサル・ネットワークや正規化フローなどの生成モデルのための新しいトレーニング手法を開発した。
指定された精度-リコールトレードオフを達成することは、textitPR-divergencesと呼ぶ家族からのユニークな$f$-divergenceを最小化することを意味する。
当社のアプローチは,ImageNetなどのデータセットでテストした場合の精度とリコールの両面で,BigGANのような既存の最先端モデルの性能を向上させる。
論文 参考訳(メタデータ) (2023-05-30T10:07:17Z) - Adaptive LASSO estimation for functional hidden dynamic geostatistical
model [69.10717733870575]
関数型隠れ統計モデル(f-HD)のためのペナル化極大推定器(PMLE)に基づく新しいモデル選択アルゴリズムを提案する。
このアルゴリズムは反復最適化に基づいており、適応最小限の収縮・セレクタ演算子(GMSOLAS)ペナルティ関数を用いており、これは不給付のf-HD最大線量推定器によって得られる。
論文 参考訳(メタデータ) (2022-08-10T19:17:45Z) - AdaCat: Adaptive Categorical Discretization for Autoregressive Models [84.85102013917606]
AdaCat(Adaptive Categorical Discretization)と呼ばれる,効率的で表現性の高いマルチモーダルパラメータ化を提案する。
AdaCatは自己回帰モデルの各次元を適応的に識別し、モデルが関心の細かい間隔に密度を割り当てることを可能にする。
論文 参考訳(メタデータ) (2022-08-03T17:53:46Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Explainable AI Integrated Feature Selection for Landslide Susceptibility
Mapping using TreeSHAP [0.0]
データ駆動型アプローチによる地すべり感受性の早期予測は時間の要求である。
地すべりの感受性予測には,XgBoost,LR,KNN,SVM,Adaboostといった最先端の機械学習アルゴリズムを用いた。
XgBoostの最適化バージョンと機能低下の40パーセントは、一般的な評価基準で他のすべての分類器よりも優れています。
論文 参考訳(メタデータ) (2022-01-10T09:17:21Z) - Accelerated Componentwise Gradient Boosting using Efficient Data
Representation and Momentum-based Optimization [1.3159777131162964]
コンポーネントワイズ強化(CWB)は、解釈可能性を保証するためのベースラーナーとして追加モデルを構築する。
CWBの欠点の1つは、メモリと実行時の計算複雑性である。
本稿では,CWBの特性を損なうことなく,これらの問題を克服する2つの手法を提案する。
論文 参考訳(メタデータ) (2021-10-07T14:49:52Z) - PSD2 Explainable AI Model for Credit Scoring [0.0]
本研究の目的は、信用リスクモデルの予測精度を向上させるための高度な分析手法の開発と試験である。
このプロジェクトは、銀行関連のデータベースに説明可能な機械学習モデルを適用することに焦点を当てている。
論文 参考訳(メタデータ) (2020-11-20T12:12:38Z) - Gaussian Process Boosting [6.85316573653194]
ガウス過程と混合効果モデルを組み合わせた新しい手法を提案する。
シミュレーションおよび実世界のデータセットに対する既存手法と比較して予測精度が向上する。
論文 参考訳(メタデータ) (2020-04-06T13:19:54Z) - CatBoostLSS -- An extension of CatBoost to probabilistic forecasting [91.3755431537592]
本稿では,不可変応答変数の条件分布全体を予測する新しいフレームワークを提案する。
CatBoostLSSは条件平均のみではなくパラメトリック分布のすべてのモーメントをモデル化する。
提案手法の利点を実証するシミュレーション研究と実世界の実例を共に提示する。
論文 参考訳(メタデータ) (2020-01-04T15:42:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。