論文の概要: Combining Structural and Unstructured Data: A Topic-based Finite Mixture Model for Insurance Claim Prediction
- arxiv url: http://arxiv.org/abs/2410.04684v1
- Date: Mon, 7 Oct 2024 01:37:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-02 02:37:51.057043
- Title: Combining Structural and Unstructured Data: A Topic-based Finite Mixture Model for Insurance Claim Prediction
- Title(参考訳): 構造データと非構造データを組み合わせる:保険請求予測のためのトピックベース有限混合モデル
- Authors: Yanxi Hou, Xiaolan Xia, Guangyuan Gao,
- Abstract要約: 本稿では,クレーム記述とクレーム量を統合した混合モデルを提案する。
本手法は,テキスト記述と損失量との確率的リンクを確立し,クレームクラスタリングと予測の精度を高める。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modeling insurance claim amounts and classifying claims into different risk levels are critical yet challenging tasks. Traditional predictive models for insurance claims often overlook the valuable information embedded in claim descriptions. This paper introduces a novel approach by developing a joint mixture model that integrates both claim descriptions and claim amounts. Our method establishes a probabilistic link between textual descriptions and loss amounts, enhancing the accuracy of claims clustering and prediction. In our proposed model, the latent topic/component indicator serves as a proxy for both the thematic content of the claim description and the component of loss distributions. Specifically, conditioned on the topic/component indicator, the claim description follows a multinomial distribution, while the claim amount follows a component loss distribution. We propose two methods for model calibration: an EM algorithm for maximum a posteriori estimates, and an MH-within-Gibbs sampler algorithm for the posterior distribution. The empirical study demonstrates that the proposed methods work effectively, providing interpretable claims clustering and prediction.
- Abstract(参考訳): 保険請求額のモデリングと異なるリスクレベルへのクレームの分類は、非常に難しい作業である。
従来の保険請求の予測モデルは、クレーム記述に埋め込まれた貴重な情報を見落としていることが多い。
本稿では,クレーム記述とクレーム量を統合した混合モデルを提案する。
本手法は,テキスト記述と損失量との確率的リンクを確立し,クレームクラスタリングと予測の精度を高める。
提案したモデルでは,潜在トピック/コンポーネントインジケータは,クレーム記述のテーマ内容と損失分布の構成要素の両方のプロキシとして機能する。
具体的には、トピック/コンポーネントインジケータに条件付きで、クレーム記述は多項分布、クレーム量は成分損失分布に従う。
モデルキャリブレーションのための2つの手法として, 後方推定を最大化するEMアルゴリズムと, 後方分布に対するMH-within-Gibbs サンプリングアルゴリズムを提案する。
実証的研究は,提案手法が効果的に機能し,解釈可能なクレームのクラスタリングと予測を提供することを示した。
関連論文リスト
- Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - $μ$GUIDE: a framework for quantitative imaging via generalized uncertainty-driven inference using deep learning [0.0]
$mu$GUIDEは、任意の生体物理モデルやMRI信号の表現から組織微細構造パラメータの後方分布を推定する。
得られた後続分布は、モデル定義に存在する退化をハイライトし、推定されたパラメータの不確かさとあいまいさを定量化する。
論文 参考訳(メタデータ) (2023-12-28T13:59:43Z) - Calibration of Time-Series Forecasting: Detecting and Adapting Context-Driven Distribution Shift [28.73747033245012]
本稿では,コンテキスト駆動分布シフトの検出と適応のための普遍的キャリブレーション手法を提案する。
レジデンシャルベースCDS検出器(Residual-based CDS detector)またはリコンディショナー(Reconditionor)と呼ばれる新しいCDS検出器は、モデルの脆弱性をCDSに定量化する。
高いリコンディショナースコアは、重度の感受性を示し、したがってモデル適応を必要とする。
論文 参考訳(メタデータ) (2023-10-23T11:58:01Z) - Quantification of Predictive Uncertainty via Inference-Time Sampling [57.749601811982096]
本稿では,データあいまいさの予測不確実性を推定するためのポストホックサンプリング手法を提案する。
この方法は与えられた入力に対して異なる可算出力を生成することができ、予測分布のパラメトリック形式を仮定しない。
論文 参考訳(メタデータ) (2023-08-03T12:43:21Z) - Towards Better Certified Segmentation via Diffusion Models [62.21617614504225]
セグメンテーションモデルは敵の摂動に弱いため、医療や自動運転といった重要な意思決定システムでの使用を妨げます。
近年,理論的保証を得るためにガウス雑音を入力に加えることにより,セグメント化予測のランダム化が提案されている。
本稿では,ランダムな平滑化と拡散モデルを組み合わせたセグメンテーション予測の問題に対処する。
論文 参考訳(メタデータ) (2023-06-16T16:30:39Z) - Bayesian CART models for insurance claims frequency [0.0]
分類と回帰木(CART)とそのアンサンブルは、アクチュアリ文学で人気を博している。
本稿では,保険価格に関するベイジアンCARTモデルについて紹介する。
これらのモデルの適用可能性を説明するため、いくつかのシミュレーションと実際の保険データについて論じる。
論文 参考訳(メタデータ) (2023-03-03T13:48:35Z) - Bayesian Quantification with Black-Box Estimators [1.599072005190786]
調整された分類と数、ブラックボックスシフト推定器、不変比推定器などのアプローチでは、クラス分布を推定し、弱い仮定の下で保証を得る補助的(および潜在的に偏りのある)ブラックボックス分類器を用いる。
これら全てのアルゴリズムが特定のベイズ連鎖モデルにおける推論と密接に関連していることを示し、仮定された基底構造生成過程を近似する。
次に,導入モデルに対する効率的なマルコフ・モンテカルロサンプリング手法について検討し,大容量データ限界における一貫性の保証を示す。
論文 参考訳(メタデータ) (2023-02-17T22:10:04Z) - Evaluating Aleatoric Uncertainty via Conditional Generative Models [15.494774321257939]
本研究では,アレータティック不確実性推定のための条件生成モデルについて検討する。
本稿では,2つの条件分布間の差を測定するための2つの指標を提案する。
我々は,我々の測定値が条件分布の相違を正確に測定する方法を数値的に示す。
論文 参考訳(メタデータ) (2022-06-09T05:39:04Z) - BRIO: Bringing Order to Abstractive Summarization [107.97378285293507]
非決定論的分布を前提とした新しい学習パラダイムを提案する。
提案手法は, CNN/DailyMail (47.78 ROUGE-1) と XSum (49.07 ROUGE-1) のデータセット上で, 最新の結果が得られる。
論文 参考訳(メタデータ) (2022-03-31T05:19:38Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。