論文の概要: Explainable Fraud Detection with Deep Symbolic Classification
- arxiv url: http://arxiv.org/abs/2312.00586v1
- Date: Fri, 1 Dec 2023 13:50:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-04 14:32:21.654210
- Title: Explainable Fraud Detection with Deep Symbolic Classification
- Title(参考訳): ディープシンボリック分類による説明可能な不正検出
- Authors: Samantha Visbeek, Erman Acar, Floris den Hengst
- Abstract要約: 分類問題に対するDeep Symbolic Regressionフレームワークの拡張であるDeep Classificationを提案する。
関数は閉形式で簡潔な数学的表現であるため、モデルは1つの分類決定のレベルとモデルの決定過程の両方において本質的に説明可能である。
PaySimデータセットの評価は、最先端のモデルと競合する予測性能を示しながら、説明可能性の観点からそれらを上回っている。
- 参考スコア(独自算出の注目度): 4.1205832766381985
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There is a growing demand for explainable, transparent, and data-driven
models within the domain of fraud detection. Decisions made by fraud detection
models need to be explainable in the event of a customer dispute. Additionally,
the decision-making process in the model must be transparent to win the trust
of regulators and business stakeholders. At the same time, fraud detection
solutions can benefit from data due to the noisy, dynamic nature of fraud and
the availability of large historical data sets. Finally, fraud detection is
notorious for its class imbalance: there are typically several orders of
magnitude more legitimate transactions than fraudulent ones. In this paper, we
present Deep Symbolic Classification (DSC), an extension of the Deep Symbolic
Regression framework to classification problems. DSC casts classification as a
search problem in the space of all analytic functions composed of a vocabulary
of variables, constants, and operations and optimizes for an arbitrary
evaluation metric directly. The search is guided by a deep neural network
trained with reinforcement learning. Because the functions are mathematical
expressions that are in closed-form and concise, the model is inherently
explainable both at the level of a single classification decision and the
model's decision process. Furthermore, the class imbalance problem is
successfully addressed by optimizing for metrics that are robust to class
imbalance such as the F1 score. This eliminates the need for oversampling and
undersampling techniques that plague traditional approaches. Finally, the model
allows to explicitly balance between the prediction accuracy and the
explainability. An evaluation on the PaySim data set demonstrates competitive
predictive performance with state-of-the-art models, while surpassing them in
terms of explainability. This establishes DSC as a promising model for fraud
detection systems.
- Abstract(参考訳): 不正検出の領域では、説明可能な、透明で、データ駆動型のモデルに対する需要が増えている。
不正検出モデルによる決定は、顧客論争が発生した場合に説明する必要がある。
さらに、モデルにおける意思決定プロセスは、規制当局やビジネスステークホルダーの信頼を得るために透明でなければならない。
同時に、不正検出ソリューションは、不正の騒々しいダイナミックな性質と巨大な履歴データセットの可用性によって、データから恩恵を受けることができる。
最後に、不正検出はそのクラス不均衡によって悪名高い: 一般的に、不正なトランザクションよりも数桁多い正当なトランザクションが存在する。
本稿では,分類問題に対するDeep Symbolic Regressionフレームワークの拡張であるDeep Symbolic Classification (DSC)を提案する。
dscは変数、定数、演算の語彙からなるすべての解析関数の空間における探索問題として分類をキャストし、任意の評価メトリックを直接最適化する。
検索は強化学習で訓練されたディープニューラルネットワークによって導かれる。
関数は閉形式で簡潔な数学的表現であるため、モデルは1つの分類決定のレベルとモデルの決定過程の両方において本質的に説明可能である。
さらに、F1スコアのようなクラス不均衡に頑健なメトリクスを最適化することで、クラス不均衡問題に対処する。
これにより、従来のアプローチを悩ませるオーバーサンプリングやアンサンプのテクニックが不要になる。
最後に、モデルは予測精度と説明可能性との明確なバランスを可能にする。
PaySimデータセットの評価は、最先端モデルとの競合予測性能を示しながら、説明可能性の観点からそれらを上回っている。
これにより、DSCは不正検出システムの有望なモデルとして確立される。
関連論文リスト
- An Innovative Attention-based Ensemble System for Credit Card Fraud Detection [5.486205584465161]
本稿では,クレジットカード不正検出のためのユニークな注意に基づくアンサンブルモデルを提案する。
アンサンブルモデルの精度は 99.95% であり、曲線 (AUC) の下の面積は 1 である。
論文 参考訳(メタデータ) (2024-10-01T09:56:23Z) - Securing Transactions: A Hybrid Dependable Ensemble Machine Learning
Model using IHT-LR and Grid Search [2.4374097382908477]
本稿では,複数のアルゴリズムをインテリジェントに組み合わせて不正識別を強化する,最先端のハイブリッドアンサンブル(ENS)機械学習(ML)モデルを提案する。
実験は,284,807件の取引からなる公開クレジットカードデータセットを用いて実施した。
提案したモデルは、99.66%、99.73%、98.56%、99.79%の精度で、それぞれDT、RF、KNN、ENSモデルに完全100%の精度を実現している。
論文 参考訳(メタデータ) (2024-02-22T09:01:42Z) - Transaction Fraud Detection via an Adaptive Graph Neural Network [64.9428588496749]
本稿では,アダプティブサンプリングとアグリゲーションに基づくグラフニューラルネットワーク(ASA-GNN)を提案する。
ノイズの多いノードをフィルタリングし、不正なノードを補うために、隣のサンプリング戦略を実行する。
3つのファイナンシャルデータセットの実験により,提案手法のASA-GNNは最先端のデータセットよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-07-11T07:48:39Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - Explaining Cross-Domain Recognition with Interpretable Deep Classifier [100.63114424262234]
解釈可能なDeep(IDC)は、ターゲットサンプルの最も近いソースサンプルを、分類器が決定を下す証拠として学習する。
我々のIDCは、精度の劣化がほとんどなく、最適なリジェクションオプションの分類を効果的に調整する、より説明可能なモデルに導かれる。
論文 参考訳(メタデータ) (2022-11-15T15:58:56Z) - Scaling Laws Beyond Backpropagation [64.0476282000118]
因果デコーダのみの変換器を効率的に訓練するための直接フィードバックアライメントの有効性について検討した。
DFAはバックプロパゲーションよりも効率的なスケーリングを提供していないことが分かりました。
論文 参考訳(メタデータ) (2022-10-26T10:09:14Z) - Credit card fraud detection - Classifier selection strategy [0.0]
アノテーション付きトランザクションのサンプルを使用して、機械学習の分類アルゴリズムは不正を検出することを学習する。
不正データセットは多種多様で 矛盾した特徴を示します
特徴的不均衡な不正検出データセットに対するデータ駆動型分類器選択手法を提案する。
論文 参考訳(メタデータ) (2022-08-25T07:13:42Z) - Application of Deep Reinforcement Learning to Payment Fraud [0.0]
典型的な不正検出システムは、詐欺リコール率の最大化に重点を置く標準的な教師付き学習手法を用いる。
このような定式化は準最適解につながると我々は主張する。
我々は、報酬関数の形でモデル内に実用性を含めることで、不正検出を逐次決定問題として定式化する。
論文 参考訳(メタデータ) (2021-12-08T11:30:53Z) - Tradeoffs in Streaming Binary Classification under Limited Inspection
Resources [14.178224954581069]
イベントが順次到着し,疑わしいイベントの数が限られている,不均衡なバイナリ分類問題を考える。
マイノリティクラス検出率と検査能力のトレードオフを解析的に特徴付ける。
本研究では,実際の不正検出データセット上での選択手法を実装し,実験結果と解析的境界を比較検討する。
論文 参考訳(メタデータ) (2021-10-05T23:23:11Z) - Structural Causal Models Are (Solvable by) Credal Networks [70.45873402967297]
因果推論は、干潟網の更新のための標準的なアルゴリズムによって得ることができる。
この貢献は, 干潟ネットワークによる構造因果モデルを表現するための体系的なアプローチと見なされるべきである。
実験により, 実規模問題における因果推論には, クレーダルネットワークの近似アルゴリズムがすぐに利用できることがわかった。
論文 参考訳(メタデータ) (2020-08-02T11:19:36Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。