論文の概要: Prediction of motor insurance claims occurrence as an imbalanced machine
learning problem
- arxiv url: http://arxiv.org/abs/2204.06109v1
- Date: Tue, 12 Apr 2022 22:41:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-14 23:38:11.397585
- Title: Prediction of motor insurance claims occurrence as an imbalanced machine
learning problem
- Title(参考訳): 不均衡機械学習問題としての自動車保険請求発生予測
- Authors: Sebastian Baran, Przemys{\l}aw Rola
- Abstract要約: 巨大なデータセットを持つ保険業界は、ビッグデータソリューションを使用する自然な場所です。
この研究の主な目的は、不均衡なデータセットを扱う様々な方法を提示し、適用することである。
また,自動車保険におけるクレーム発生予測の文脈において,これらの手法を用いて機械学習アルゴリズムの結果を比較した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The insurance industry, with its large datasets, is a natural place to use
big data solutions. However it must be stressed, that significant number of
applications for machine learning in insurance industry, like fraud detection
or claim prediction, deals with the problem of machine learning on an
imbalanced data set. This is due to the fact that frauds or claims are rare
events when compared with the entire population of drivers. The problem of
imbalanced learning is often hard to overcome. Therefore, the main goal of this
work is to present and apply various methods of dealing with an imbalanced
dataset in the context of claim occurrence prediction in car insurance. In
addition, the above techniques are used to compare the results of machine
learning algorithms in the context of claim occurrence prediction in car
insurance. Our study covers the following techniques: logistic-regression,
decision tree, random forest, xgBoost, feed-forward network. The problem is the
classification one.
- Abstract(参考訳): 巨大なデータセットを持つ保険業界は、ビッグデータソリューションを使用する自然な場所です。
しかし、不正検出やクレーム予測など、保険業界における機械学習の多くの応用が、不均衡データセットにおける機械学習の問題に対処することを強調する必要がある。
これは、ドライバーの人口全体と比較して詐欺やクレームが稀な出来事であるという事実による。
不均衡学習の問題は克服が難しいことが多い。
したがって,本研究の主な目的は,自動車保険における債権発生予測の文脈において,不均衡データセットを扱う様々な手法を提示し,適用することである。
また、上記の手法は、自動車保険におけるクレーム発生予測の文脈における機械学習アルゴリズムの結果を比較するために用いられる。
本研究は,ロジスティック回帰,決定木,ランダム林,xgBoost,フィードフォワードネットワークなどの技術について述べる。
問題は分類です。
関連論文リスト
- Overcoming Imbalanced Safety Data Using Extended Accident Triangle [1.1249583407496222]
既存の安全分析研究は目覚ましい進歩を遂げているが、不均衡なデータセットに悩まされている。
我々は,事故の重大度,事故頻度,事故タイプといった特徴に基づいて,データサンプルの重要性を主張するために,事故三角形の理論を拡張した。
さまざまな機械学習アルゴリズムの間で、堅牢な改善が見られます。
論文 参考訳(メタデータ) (2024-08-12T00:36:17Z) - Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文 参考訳(メタデータ) (2024-06-16T03:10:16Z) - An engine to simulate insurance fraud network data [1.3812010983144802]
ネットワーク構造を持つ合成データを生成するシミュレーションマシンを開発した。
不正発生モデルにおいて、政策立案者及び当事者の総数、所望の不均衡レベル、および特徴(効果の大きさ)を特定できる。
シミュレーションエンジンは、研究者や実践者がいくつかの方法論的課題を検証し、保険詐欺検出モデルの(開発戦略)検証を可能にする。
論文 参考訳(メタデータ) (2023-08-21T13:14:00Z) - Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - Applying Machine Learning to Life Insurance: some knowledge sharing to
master it [0.0]
本稿では,従来の生存モデリング手法をレビューし,機械学習技術を用いて拡張する。
通常の機械学習モデルとの違いを指摘し、検閲されたデータに直面するための特定の実装の重要性を強調している。
さまざまなオープンソースの機械学習アルゴリズムが、生命保険データの特異性、すなわち検閲と切り離しに適応するように調整されている。
論文 参考訳(メタデータ) (2022-09-05T17:09:03Z) - Predicting Seriousness of Injury in a Traffic Accident: A New Imbalanced
Dataset and Benchmark [62.997667081978825]
本稿では,交通事故における傷害の重大性を予測するために,機械学習アルゴリズムの性能を評価する新しいデータセットを提案する。
データセットは、英国運輸省から公開されているデータセットを集約することで作成される。
論文 参考訳(メタデータ) (2022-05-20T21:15:26Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - A model for traffic incident prediction using emergency braking data [77.34726150561087]
道路交通事故予測におけるデータ不足の根本的な課題を、事故の代わりに緊急ブレーキイベントをトレーニングすることで解決します。
メルセデス・ベンツ車両の緊急ブレーキデータに基づくドイツにおける交通事故予測モデルを実装したプロトタイプを提案する。
論文 参考訳(メタデータ) (2021-02-12T18:17:12Z) - PrognoseNet: A Generative Probabilistic Framework for Multimodal
Position Prediction given Context Information [2.5302126831371226]
本稿では,予測問題を分類タスクとして再構成し,強力なツールを実現する手法を提案する。
潜在変数のスマートな選択は、分類問題と非常に単純化された回帰問題の組み合わせとして、ログ様関数の再構成を可能にする。
提案手法は文脈情報を容易に組み込むことができ、データの事前処理は不要である。
論文 参考訳(メタデータ) (2020-10-02T06:13:41Z) - Fairness Constraints in Semi-supervised Learning [56.48626493765908]
我々は,最適化問題として定式化された,公平な半教師付き学習のためのフレームワークを開発する。
偏り・分散・雑音分解による半教師あり学習における識別源を理論的に分析する。
本手法は, 公平な半教師付き学習を達成でき, 公正な教師付き学習よりも精度と公平性のトレードオフが良好である。
論文 参考訳(メタデータ) (2020-09-14T04:25:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。