Fugu-MT 論文翻訳(概要): Zero-Inflated Tweedie Boosted Trees with CatBoost for Insurance Loss Analytics

論文の概要: Zero-Inflated Tweedie Boosted Trees with CatBoost for Insurance Loss Analytics

arxiv url: http://arxiv.org/abs/2406.16206v1
Date: Sun, 23 Jun 2024 20:03:55 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-25 18:34:57.463032
Title: Zero-Inflated Tweedie Boosted Trees with CatBoost for Insurance Loss Analytics
Title（参考訳）: ゼロ膨らませたツイーディ、キャットブースで木を膨らませる-保険の損失分析
Authors: Banghee So, Emiliano A. Valdez,
Abstract要約: 我々はTweedie回帰モデルを変更し、自動車、健康、責任などの各種保険の総括請求をモデル化する際の限界に対処する。我々の推奨するアプローチは、予測精度を高めるために反復的なプロセスを活用するのに役立つため、0-claimプロセスの洗練されたモデリングとブースティング手法の統合である。モデル化の結果, モデル性能が著しく向上し, 保険請求分析に適した精度の予測を行う可能性が示された。
参考スコア（独自算出の注目度）: 0.8287206589886881
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper, we explore advanced modifications to the Tweedie regression model in order to address its limitations in modeling aggregate claims for various types of insurance such as automobile, health, and liability. Traditional Tweedie models, while effective in capturing the probability and magnitude of claims, usually fall short in accurately representing the large incidence of zero claims. Our recommended approach involves a refined modeling of the zero-claim process, together with the integration of boosting methods in order to help leverage an iterative process to enhance predictive accuracy. Despite the inherent slowdown in learning algorithms due to this iteration, several efficient implementation techniques that also help precise tuning of parameter like XGBoost, LightGBM, and CatBoost have emerged. Nonetheless, we chose to utilize CatBoost, a efficient boosting approach that effectively handles categorical and other special types of data. The core contribution of our paper is the assembly of separate modeling for zero claims and the application of tree-based boosting ensemble methods within a CatBoost framework, assuming that the inflated probability of zero is a function of the mean parameter. The efficacy of our enhanced Tweedie model is demonstrated through the application of an insurance telematics dataset, which presents the additional complexity of compositional feature variables. Our modeling results reveal a marked improvement in model performance, showcasing its potential to deliver more accurate predictions suitable for insurance claim analytics.
Abstract（参考訳）: 本稿では,自動車,健康,責任などの各種保険の集合的請求をモデル化する際の限界に対処するため,Tweedie回帰モデルの改良について検討する。伝統的なツイーディーモデルは、請求の確率と大きさを捉えるのに効果的であるが、通常、ゼロ請求の大量発生を正確に表すには不十分である。我々の推奨するアプローチは、予測精度を高めるために反復的なプロセスを活用するのに役立つため、0-claimプロセスの洗練されたモデリングとブースティング手法の統合である。この反復による学習アルゴリズムの本質的にの減速にもかかわらず、XGBoost、LightGBM、CatBoostといったパラメータの正確なチューニングを支援する効率的な実装技術がいくつか出現している。それにもかかわらず、私たちはカテゴリやその他の特殊なデータを効果的に扱う効率的なブースティングアプローチであるCatBoostを使うことを選択しました。本論文の中核的な貢献は、ゼロクレームに対する別個のモデリングと、ゼロの膨らみ確率が平均パラメータの関数であることを仮定して、CatBoostフレームワーク内でツリーベースのブースティングアンサンブル手法の適用である。 Tweedieモデルの有効性を保険テレマティクス・データセットの適用により実証し,構成的特徴変数のさらなる複雑さを示す。モデル化の結果, モデル性能が著しく向上し, 保険請求分析に適した精度の予測を行う可能性が示された。

関連論文リスト

Sure Convergence and Constructive Universal Approximation for Multi-Layer Neural Networks [0.0]
我々は、インジケータ活性化ニューロン上に構築された新しいニューラルネットワークモデル01Neuroを提案する。その強化された変種は2つの重要な統計的性質を持っている: 絶対収束と構成的普遍近似である。無限サンプル設定では、モデルは任意の可測関数の有限和を近似することができる。
論文参考訳（メタデータ） (2025-07-07T08:55:28Z)
Enhancing Training Data Attribution with Representational Optimization [57.61977909113113]
トレーニングデータ属性法は、トレーニングデータがモデルの予測にどのように影響するかを測定することを目的としている。本稿では,タスク固有表現とモデル整合表現をTDAで明示的に学習することで,このギャップを埋める表現ベースアプローチであるAirRepを提案する。 AirRepは、属性品質に合わせて調整されたトレーニング可能なエンコーダと、グループワイドの影響を正確に見積もるアテンションベースのプール機構の2つの重要なイノベーションを紹介している。
論文参考訳（メタデータ） (2025-05-24T05:17:53Z)
Self-Boost via Optimal Retraining: An Analysis via Approximate Message Passing [58.52119063742121]
独自の予測と潜在的にノイズの多いラベルを使ってモデルをトレーニングすることは、モデルパフォーマンスを改善するためのよく知られた戦略である。本稿では,モデルの予測と提供ラベルを最適に組み合わせる方法について論じる。我々の主な貢献は、現在のモデルの予測と与えられたラベルを組み合わせたベイズ最適集約関数の導出である。
論文参考訳（メタデータ） (2025-05-21T07:16:44Z)
From Point to probabilistic gradient boosting for claim frequency and severity prediction [1.3812010983144802]
我々は、決定木アルゴリズムの既存の点と確率的勾配を全て向上させる統一的な表記法と対照的に提示する。クレーム頻度と重大度を5つの公開データセットで比較した。モデル精度と予測精度の間にトレードオフがないことが分かりました。
論文参考訳（メタデータ） (2024-12-19T14:50:10Z)
FPBoost: Fully Parametric Gradient Boosting for Survival Analysis [4.09225917049674]
本稿では,個別のパラメトリックハザード・コントリビューションの重み付け和に基づくサバイバルモデル設計のための新しいパラダイムを提案する。提案手法はFPBoostと呼ばれ, 勾配上昇による生存確率を直接最適化する最初のアルゴリズムである。
論文参考訳（メタデータ） (2024-09-20T09:57:17Z)
Learn from the Past: A Proxy Guided Adversarial Defense Framework with Self Distillation Regularization [53.04697800214848]
敵対的訓練(AT)は、ディープラーニングモデルの堅牢性を固める上で重要な要素である。 AT方式は、目標モデルの防御のために直接反復的な更新を頼りにしており、不安定な訓練や破滅的なオーバーフィッティングといった障害に頻繁に遭遇する。汎用プロキシガイド型防衛フレームワークLAST(bf Pbf astから学ぶ)を提案する。
論文参考訳（メタデータ） (2023-10-19T13:13:41Z)
Enhanced Gradient Boosting for Zero-Inflated Insurance Claims and Comparative Analysis of CatBoost, XGBoost, and LightGBM [0.0]
CatBoostは、予測性能に基づいた自動クレーム頻度モデルを開発するための最良のライブラリである。そこで我々は, インフレ確率$p$と分布平均$mu$の関係を仮定した, ゼロ膨張ポアソン強化木モデルを提案する。
論文参考訳（メタデータ） (2023-07-15T10:54:46Z)
Precision-Recall Divergence Optimization for Generative Modeling with GANs and Normalizing Flows [54.050498411883495]
本研究では,ジェネレーティブ・アドバイサル・ネットワークや正規化フローなどの生成モデルのための新しいトレーニング手法を開発した。指定された精度-リコールトレードオフを達成することは、textitPR-divergencesと呼ぶ家族からのユニークな$f$-divergenceを最小化することを意味する。当社のアプローチは,ImageNetなどのデータセットでテストした場合の精度とリコールの両面で,BigGANのような既存の最先端モデルの性能を向上させる。
論文参考訳（メタデータ） (2023-05-30T10:07:17Z)
Adaptive LASSO estimation for functional hidden dynamic geostatistical model [69.10717733870575]
関数型隠れ統計モデル(f-HD)のためのペナル化極大推定器(PMLE)に基づく新しいモデル選択アルゴリズムを提案する。このアルゴリズムは反復最適化に基づいており、適応最小限の収縮・セレクタ演算子(GMSOLAS)ペナルティ関数を用いており、これは不給付のf-HD最大線量推定器によって得られる。
論文参考訳（メタデータ） (2022-08-10T19:17:45Z)
AdaCat: Adaptive Categorical Discretization for Autoregressive Models [84.85102013917606]
AdaCat(Adaptive Categorical Discretization)と呼ばれる,効率的で表現性の高いマルチモーダルパラメータ化を提案する。 AdaCatは自己回帰モデルの各次元を適応的に識別し、モデルが関心の細かい間隔に密度を割り当てることを可能にする。
論文参考訳（メタデータ） (2022-08-03T17:53:46Z)
HyperImpute: Generalized Iterative Imputation with Automatic Model Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文参考訳（メタデータ） (2022-06-15T19:10:35Z)
Explainable AI Integrated Feature Selection for Landslide Susceptibility Mapping using TreeSHAP [0.0]
データ駆動型アプローチによる地すべり感受性の早期予測は時間の要求である。地すべりの感受性予測には,XgBoost,LR,KNN,SVM,Adaboostといった最先端の機械学習アルゴリズムを用いた。 XgBoostの最適化バージョンと機能低下の40パーセントは、一般的な評価基準で他のすべての分類器よりも優れています。
論文参考訳（メタデータ） (2022-01-10T09:17:21Z)
Accelerated Componentwise Gradient Boosting using Efficient Data Representation and Momentum-based Optimization [1.3159777131162964]
コンポーネントワイズ強化(CWB)は、解釈可能性を保証するためのベースラーナーとして追加モデルを構築する。 CWBの欠点の1つは、メモリと実行時の計算複雑性である。本稿では,CWBの特性を損なうことなく,これらの問題を克服する2つの手法を提案する。
論文参考訳（メタデータ） (2021-10-07T14:49:52Z)
Gaussian Process Boosting [13.162429430481982]
ガウス過程と混合効果モデルを組み合わせた新しい手法を提案する。シミュレーションおよび実世界のデータセットに対する既存手法と比較して予測精度が向上する。
論文参考訳（メタデータ） (2020-04-06T13:19:54Z)
CatBoostLSS -- An extension of CatBoost to probabilistic forecasting [91.3755431537592]
本稿では,不可変応答変数の条件分布全体を予測する新しいフレームワークを提案する。 CatBoostLSSは条件平均のみではなくパラメトリック分布のすべてのモーメントをモデル化する。提案手法の利点を実証するシミュレーション研究と実世界の実例を共に提示する。
論文参考訳（メタデータ） (2020-01-04T15:42:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。