論文の概要: An engine to simulate insurance fraud network data
- arxiv url: http://arxiv.org/abs/2308.11659v2
- Date: Sun, 06 Oct 2024 12:56:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-08 13:08:50.496632
- Title: An engine to simulate insurance fraud network data
- Title(参考訳): 保険詐欺ネットワークデータをシミュレートするエンジン
- Authors: Bavo D. C. Campo, Katrien Antonio,
- Abstract要約: ネットワーク構造を持つ合成データを生成するシミュレーションマシンを開発した。
不正発生モデルにおいて、政策立案者及び当事者の総数、所望の不均衡レベル、および特徴(効果の大きさ)を特定できる。
シミュレーションエンジンは、研究者や実践者がいくつかの方法論的課題を検証し、保険詐欺検出モデルの(開発戦略)検証を可能にする。
- 参考スコア(独自算出の注目度): 1.3812010983144802
- License:
- Abstract: Traditionally, the detection of fraudulent insurance claims relies on business rules and expert judgement which makes it a time-consuming and expensive process (\'Oskarsd\'ottir et al., 2022). Consequently, researchers have been examining ways to develop efficient and accurate analytic strategies to flag suspicious claims. Feeding learning methods with features engineered from the social network of parties involved in a claim is a particularly promising strategy (see for example Van Vlasselaer et al. (2016); Tumminello et al. (2023)). When developing a fraud detection model, however, we are confronted with several challenges. The uncommon nature of fraud, for example, creates a high class imbalance which complicates the development of well performing analytic classification models. In addition, only a small number of claims are investigated and get a label, which results in a large corpus of unlabeled data. Yet another challenge is the lack of publicly available data. This hinders not only the development of new methods, but also the validation of existing techniques. We therefore design a simulation machine that is engineered to create synthetic data with a network structure and available covariates similar to the real life insurance fraud data set analyzed in \'Oskarsd\'ottir et al. (2022). Further, the user has control over several data-generating mechanisms. We can specify the total number of policyholders and parties, the desired level of imbalance and the (effect size of the) features in the fraud generating model. As such, the simulation engine enables researchers and practitioners to examine several methodological challenges as well as to test their (development strategy of) insurance fraud detection models in a range of different settings. Moreover, large synthetic data sets can be generated to evaluate the predictive performance of (advanced) machine learning techniques.
- Abstract(参考訳): 伝統的に、不正保険請求の検出はビジネスルールと専門家による判断に依存しており、時間とコストのかかるプロセスとなっている(\'Oskarsd\'ottir et al , 2022)。
その結果、研究者は疑わしい主張にフラグを付けるための効率的で正確な分析戦略を開発する方法を模索している。
クレームに関わる関係者のソーシャルネットワークから構築された機能を使った学習手法は、特に有望な戦略である(Van Vlasselaer et al (2016), Tumminello et al (2023) など)。
しかし、不正検出モデルを開発する際には、いくつかの課題に直面している。
例えば、不正行為の一般的でない性質は、高いクラスの不均衡を生み出し、よく機能する分析分類モデルの開発を複雑にする。
さらに、少数のクレームのみが調査されラベルが取得され、その結果、ラベルなしデータの大量のコーパスが生成される。
しかし、もう1つの課題は、公開データの欠如だ。
これにより、新しいメソッドの開発だけでなく、既存のテクニックの検証も妨げられる。
そこで我々は,ネットワーク構造と利用可能な共変量を持つ合成データを作成するために設計されたシミュレーションマシンを,<Oskarsd\'ottir et al(2022)で解析された実生活保険詐欺データと類似した形で設計する。
さらに、ユーザは複数のデータ生成機構を制御できる。
不正発生モデルにおいて、政策立案者及び当事者の総数、所望の不均衡レベル、および特徴(効果の大きさ)を特定できる。
このように、シミュレーションエンジンは、研究者や実践者がいくつかの方法論的課題を検証し、異なる設定で保険詐欺検出モデルの(開発戦略を)検証することを可能にする。
さらに、(先進的な)機械学習技術の予測性能を評価するために、大規模な合成データセットを生成することもできる。
関連論文リスト
- Model Stealing Attack against Graph Classification with Authenticity, Uncertainty and Diversity [80.16488817177182]
GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。
異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文 参考訳(メタデータ) (2023-12-18T05:42:31Z) - Explainable Fraud Detection with Deep Symbolic Classification [4.1205832766381985]
分類問題に対するDeep Symbolic Regressionフレームワークの拡張であるDeep Classificationを提案する。
関数は閉形式で簡潔な数学的表現であるため、モデルは1つの分類決定のレベルとモデルの決定過程の両方において本質的に説明可能である。
PaySimデータセットの評価は、最先端のモデルと競合する予測性能を示しながら、説明可能性の観点からそれらを上回っている。
論文 参考訳(メタデータ) (2023-12-01T13:50:55Z) - Large Language Models are Few-Shot Training Example Generators: A Case Study in Fallacy Recognition [49.38757847011105]
計算誤認識は、さまざまなジャンル、ドメイン、データセットに見られる誤認識のタイプによって、課題に直面します。
我々は、追加の文脈を取り入れ、大規模な言語モデルを活用して合成データを生成することによって、誤認識のための既存のモデルを強化することを目指している。
評価結果は、誤検出タイプ、データセット、ジェネレータ間で一貫した改善を示す。
論文 参考訳(メタデータ) (2023-11-16T04:17:47Z) - A Discrepancy Aware Framework for Robust Anomaly Detection [51.710249807397695]
本稿では,DAF(Disdisrepancy Aware Framework)を提案する。
本手法は,デコーダの欠陥同定に外見に依存しないキューを利用して,その合成外観への依存を緩和する。
単純な合成戦略の下では,既存の手法を大きなマージンで上回り,また,最先端のローカライゼーション性能も達成している。
論文 参考訳(メタデータ) (2023-10-11T15:21:40Z) - Privacy-Preserving Financial Anomaly Detection via Federated Learning & Multi-Party Computation [17.314619091307343]
本稿では、金融機関が高精度な異常検出モデルを共同で訓練できるプライバシー保護フレームワークについて述べる。
当社のソリューションは,顧客データのプライバシを保ちながら,高精度な異常検出モデルをトレーニングすることを可能にする。
論文 参考訳(メタデータ) (2023-10-06T19:16:41Z) - Designing an attack-defense game: how to increase robustness of
financial transaction models via a competition [69.08339915577206]
金融セクターにおける悪意ある攻撃のエスカレートリスクを考えると、機械学習モデルの敵戦略と堅牢な防御メカニズムを理解することが重要である。
本研究の目的は、逐次的な財務データを入力として使用するニューラルネットワークモデルに対する敵攻撃と防御の現状とダイナミクスを調査することである。
我々は、現代の金融取引データにおける問題の現実的かつ詳細な調査を可能にする競争を設計した。
参加者は直接対決するので、実生活に近い環境で攻撃や防御が検討される。
論文 参考訳(メタデータ) (2023-08-22T12:53:09Z) - Transaction Fraud Detection via an Adaptive Graph Neural Network [64.9428588496749]
本稿では,アダプティブサンプリングとアグリゲーションに基づくグラフニューラルネットワーク(ASA-GNN)を提案する。
ノイズの多いノードをフィルタリングし、不正なノードを補うために、隣のサンプリング戦略を実行する。
3つのファイナンシャルデータセットの実験により,提案手法のASA-GNNは最先端のデータセットよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-07-11T07:48:39Z) - Fraud Dataset Benchmark and Applications [25.184342958800293]
Fraud dataset Benchmark(FDB)は、不正検出に特化した公開データセットのコンパイルである。
FDBには、不正なカード非表示トランザクションの識別、ボット攻撃の検出、悪意のあるURLの分類、コンテンツモデレーションに対するローンのデフォルトリスクの推定など、さまざまな不正関連タスクが含まれている。
FDB用のPythonベースのライブラリは、標準化されたトレーニングとテストの分割を伴うデータローディングのための一貫したAPIを提供する。
論文 参考訳(メタデータ) (2022-08-30T17:35:39Z) - Credit card fraud detection - Classifier selection strategy [0.0]
アノテーション付きトランザクションのサンプルを使用して、機械学習の分類アルゴリズムは不正を検出することを学習する。
不正データセットは多種多様で 矛盾した特徴を示します
特徴的不均衡な不正検出データセットに対するデータ駆動型分類器選択手法を提案する。
論文 参考訳(メタデータ) (2022-08-25T07:13:42Z) - Mechanisms that Incentivize Data Sharing in Federated Learning [90.74337749137432]
我々は、データ共有の利点が完全に損なわれているような、ナイーブなスキームが破滅的なフリーライディングのレベルにどのように結びつくかを示す。
次に,各エージェントが生成するデータ量を最大化する精度形成機構を導入する。
論文 参考訳(メタデータ) (2022-07-10T22:36:52Z) - Social network analytics for supervised fraud detection in insurance [1.911867365776962]
保険詐欺は、政策所有者が誇張された、または故意の損害に基づく主張を提出した場合に発生する。
このコントリビューションは,クレームのソーシャルネットワークから洞察力のある情報を抽出することにより,不正検出戦略を開発する。
論文 参考訳(メタデータ) (2020-09-15T21:40:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。