論文の概要: Machine Learning with High-Cardinality Categorical Features in Actuarial
Applications
- arxiv url: http://arxiv.org/abs/2301.12710v1
- Date: Mon, 30 Jan 2023 07:35:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 15:26:06.818490
- Title: Machine Learning with High-Cardinality Categorical Features in Actuarial
Applications
- Title(参考訳): アクチュアリ応用における高次カテゴリー特徴を用いた機械学習
- Authors: Benjamin Avanzi and Greg Taylor and Melantha Wang and Bernard Wong
- Abstract要約: 心電図では, 心電図のカテゴリー的特徴が広範囲に分布する。
ワンホット符号化のような標準的な分類的符号化法はこれらの設定では不十分である。
本稿では, 線形混合モデルニューラルネット_(GLMMNet)を用いて, 高次心性カテゴリーの特徴をモデル化する手法を提案する。
- 参考スコア(独自算出の注目度): 0.31133049660590606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-cardinality categorical features are pervasive in actuarial data (e.g.
occupation in commercial property insurance). Standard categorical encoding
methods like one-hot encoding are inadequate in these settings.
In this work, we present a novel _Generalised Linear Mixed Model Neural
Network_ ("GLMMNet") approach to the modelling of high-cardinality categorical
features. The GLMMNet integrates a generalised linear mixed model in a deep
learning framework, offering the predictive power of neural networks and the
transparency of random effects estimates, the latter of which cannot be
obtained from the entity embedding models. Further, its flexibility to deal
with any distribution in the exponential dispersion (ED) family makes it widely
applicable to many actuarial contexts and beyond.
We illustrate and compare the GLMMNet against existing approaches in a range
of simulation experiments as well as in a real-life insurance case study.
Notably, we find that the GLMMNet often outperforms or at least performs
comparably with an entity embedded neural network, while providing the
additional benefit of transparency, which is particularly valuable in practical
applications.
Importantly, while our model was motivated by actuarial applications, it can
have wider applicability. The GLMMNet would suit any applications that involve
high-cardinality categorical variables and where the response cannot be
sufficiently modelled by a Gaussian distribution.
- Abstract(参考訳): 高カード性カテゴリーの特徴は、時間データ(例えば、商業財産保険の職業)に浸透する。
ワンホット符号化のような標準的な分類法はこれらの設定では不十分である。
本稿では,高次心性カテゴリーの特徴をモデル化するための,新しい_ Generalized Linear Mixed Model Neural Network_(GLMMNet)アプローチを提案する。
GLMMNetは、ニューラルネットワークの予測能力とランダム効果推定の透明性を提供するディープラーニングフレームワークに一般化された線形混合モデルを統合する。
さらに、指数分散(ED)族における任意の分布に対処する柔軟性は、多くのアクチュアリな文脈に広く適用することができる。
GLMMNetをシミュレーション実験や実生活保険ケーススタディにおいて,既存手法との比較を行った。
特に、GLMMNetは、特に実用的なアプリケーションで価値のある透明性のメリットを提供しながら、エンティティ組み込みニューラルネットワークと相容れない性能を発揮することがよくあります。
重要なことは、我々のモデルはアクチュアリアルな応用によって動機付けられているが、より広い適用性を持つ。
GLMMNetは、高心性カテゴリ変数と応答がガウス分布によって十分にモデル化できないアプリケーションに適合する。
関連論文リスト
- A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。
オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文 参考訳(メタデータ) (2023-11-13T01:48:08Z) - Smoothness and monotonicity constraints for neural networks using ICEnet [0.0]
本稿では,深層ニューラルネットワークモデルにおける制約を強制する新しい手法を提案する。
これらのモデルがどのようにトレーニングされ、実世界のデータセットを使用したサンプルアプリケーションを提供するかを示す。
論文 参考訳(メタデータ) (2023-05-15T17:14:52Z) - MISNN: Multiple Imputation via Semi-parametric Neural Networks [9.594714330925703]
バイオメディカル・ソーシャル・エコノメトリー研究において、多重計算(Multiple Imputation, MI)は、欠落した価値問題に広く応用されている。
提案するMISNNは,MIの特徴選択を取り入れた,新規で効率的なアルゴリズムである。
論文 参考訳(メタデータ) (2023-05-02T21:45:36Z) - Bayesian community detection for networks with covariates [16.230648949593153]
科学界でもっとも注目されているのは「コミュニティ検出」である。
共依存型ランダムパーティションを持つブロックモデルを提案する。
本モデルでは, 後部推測により, コミュニティの数を知ることができる。
論文 参考訳(メタデータ) (2022-03-04T01:58:35Z) - Robustness Certificates for Implicit Neural Networks: A Mixed Monotone
Contractive Approach [60.67748036747221]
暗黙のニューラルネットワークは、競合性能とメモリ消費の削減を提供する。
入力逆流の摂動に関して、それらは不安定なままである。
本稿では,暗黙的ニューラルネットワークのロバスト性検証のための理論的および計算的枠組みを提案する。
論文 参考訳(メタデータ) (2021-12-10T03:08:55Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Cauchy-Schwarz Regularized Autoencoder [68.80569889599434]
変分オートエンコーダ(VAE)は、強力で広く使われている生成モデルのクラスである。
GMMに対して解析的に計算できるCauchy-Schwarz分散に基づく新しい制約対象を導入する。
本研究の目的は,密度推定,教師なしクラスタリング,半教師なし学習,顔分析における変分自動エンコーディングモデルの改善である。
論文 参考訳(メタデータ) (2021-01-06T17:36:26Z) - Efficient Construction of Nonlinear Models over Normalized Data [21.531781003420573]
混合モデルを構築するためにバイナリ結合とマルチウェイ結合の両方を系統的に分解する方法を示す。
本稿では,ネットワークの学習を因子的に行うアルゴリズムを提案し,性能上の優位性を提供する。
論文 参考訳(メタデータ) (2020-11-23T19:20:03Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z) - Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。
これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文 参考訳(メタデータ) (2019-10-12T22:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。