論文の概要: Cost-sensitive Semi-supervised Classification for Fraud Applications
- arxiv url: http://arxiv.org/abs/2012.11743v1
- Date: Mon, 21 Dec 2020 23:22:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 07:23:43.022454
- Title: Cost-sensitive Semi-supervised Classification for Fraud Applications
- Title(参考訳): 不正アプリケーションに対するコストに敏感な半教師付き分類
- Authors: Sulaf Elshaar, Samira Sadaoui
- Abstract要約: 本研究では、不正検出領域におけるコスト感受性学習(CSL)を探索し、不正クラスの誤った予測を減らし、その精度を高める。
我々は、ラベル付き不正データの希少性に対処するために、SSC(Semi-supvised Classification)フレームワーク内のCSLを調査します。
本論文は,詐欺検出のためのSCとSCを統合する最初の試みである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This research explores Cost-Sensitive Learning (CSL) in the fraud detection
domain to decrease the fraud class's incorrect predictions and increase its
accuracy. Notably, we concentrate on shill bidding fraud that is challenging to
detect because the behavior of shill and legitimate bidders are similar. We
investigate CSL within the Semi-Supervised Classification (SSC) framework to
address the scarcity of labeled fraud data. Our paper is the first attempt to
integrate CSL with SSC for fraud detection. We adopt a meta-CSL approach to
manage the costs of misclassification errors, while SSC algorithms are trained
with imbalanced data. Using an actual shill bidding dataset, we assess the
performance of several hybrid models of CSL and SSC and then compare their
misclassification error and accuracy rates statistically. The most efficient
CSL+SSC model was able to detect 99% of fraudsters and with the lowest total
cost.
- Abstract(参考訳): 本研究では,不正検出領域におけるコスト・センシティブ・ラーニング(CSL)について検討し,不正クラスの誤予測を低減し,その精度を向上させる。
特に,シロと合法入札者の行動が類似していることから,検出が難しいシロ入札詐欺に注目する。
本稿では,ラベル付き不正データの不足に対処するため,SSC(Semi-Supervised Classification)フレームワーク内のCSLについて検討する。
本論文は,詐欺検出のためのSCとSCを統合する最初の試みである。
誤分類エラーのコストを管理するためにメタCSLアプローチを採用し、SSCアルゴリズムは不均衡なデータで訓練する。
実際のシレル入札データセットを用いて、CSLとSSCのハイブリッドモデルの性能を評価し、それらの誤分類誤差と精度を統計的に比較する。
最も効率的なCSL+SSCモデルは、詐欺師の99%を検出でき、総コストは最低であった。
関連論文リスト
- Adaptive Hierarchical Certification for Segmentation using Randomized Smoothing [87.48628403354351]
機械学習の認証は、特定の条件下では、敵対的なサンプルが特定の範囲内でモデルを回避できないことを証明している。
セグメンテーションの一般的な認証方法は、平らな粒度のクラスを使い、モデルの不確実性による高い断続率をもたらす。
本稿では,複数レベルの階層内で画素を認証し,不安定なコンポーネントに対して粗いレベルに適応的に認証を緩和する,新しい,より実用的な設定を提案する。
論文 参考訳(メタデータ) (2024-02-13T11:59:43Z) - Credit Card Fraud Detection with Subspace Learning-based One-Class
Classification [18.094622095967328]
1クラス分類(OCC)アルゴリズムは、不均衡なデータ分散を扱うのに優れている。
これらのアルゴリズムは、部分空間学習をデータ記述に統合する。
これらのアルゴリズムは、OCCに最適化された低次元の部分空間にデータを変換する。
論文 参考訳(メタデータ) (2023-09-26T12:26:28Z) - Fraud Detection Using Optimized Machine Learning Tools Under Imbalance
Classes [0.304585143845864]
機械学習(ML)ツールのスマートバージョンによる不正検出は、安全性を保証するために不可欠である。
本稿では,4つの最先端ML手法,すなわちロジスティック回帰,決定木,ランダム森林,極端な勾配上昇について検討する。
フィッシングサイトURLとクレジットカード不正取引データセットは、元のデータに基づいてトレーニングされた極端な勾配が、信頼できるパフォーマンスを示していることを示している。
論文 参考訳(メタデータ) (2022-09-04T15:30:23Z) - Empirical study of Machine Learning Classifier Evaluation Metrics
behavior in Massively Imbalanced and Noisy data [0.0]
我々は、実世界の不正検出データセットに典型的な人間のアノテーションエラーと極端な不均衡をモデル化するための理論的基盤を開発する。
我々は、F1スコアとg平均の組み合わせが、典型的な不均衡不正検出モデル分類における最良の評価指標であることを実証した。
論文 参考訳(メタデータ) (2022-08-25T07:30:31Z) - Semi-Leak: Membership Inference Attacks Against Semi-supervised Learning [42.089020844936805]
半教師付き学習(SSL)はラベル付きデータとラベルなしデータの両方を活用して機械学習(ML)モデルをトレーニングする。
SSLでトレーニングされたMLモデルに対して,データ拡張に基づく最初のメンバシップ推論攻撃を提案する。
評価の結果,提案攻撃は既存のメンバシップ推論攻撃よりも一貫して優れていることがわかった。
論文 参考訳(メタデータ) (2022-07-25T21:17:24Z) - On Higher Adversarial Susceptibility of Contrastive Self-Supervised
Learning [104.00264962878956]
コントラスト型自己教師学習(CSL)は,画像と映像の分類において,教師あり学習のパフォーマンスに適合するか上回っている。
2つの学習パラダイムによって誘導される表現の性質が似ているかどうかは、いまだに不明である。
我々は,CSL表現空間における単位超球面上のデータ表現の均一分布を,この現象の鍵となる要因として同定する。
CSLトレーニングでモデルロバスト性を改善するのにシンプルだが有効である戦略を考案する。
論文 参考訳(メタデータ) (2022-07-22T03:49:50Z) - Collaborative Intelligence Orchestration: Inconsistency-Based Fusion of
Semi-Supervised Learning and Active Learning [60.26659373318915]
アクティブラーニング(AL)と半教師付きラーニング(SSL)は2つの効果があるが、しばしば孤立している。
本稿では、SSL-ALの潜在的な優位性をさらに調査するために、革新的な一貫性に基づく仮想aDvErialアルゴリズムを提案する。
2つの実世界のケーススタディは、提案したデータサンプリングアルゴリズムの適用と展開の実践的な産業価値を可視化する。
論文 参考訳(メタデータ) (2022-06-07T13:28:43Z) - Using Representation Expressiveness and Learnability to Evaluate
Self-Supervised Learning Methods [61.49061000562676]
本稿では,学習可能性を評価するためにCluster Learnability (CL)を導入する。
CLは、K-meansで表現をクラスタリングすることによって得られたラベルを予測するために訓練されたKNNのパフォーマンスで測定される。
CLは、他の競合する評価手法よりも分布内モデルの性能と相関することがわかった。
論文 参考訳(メタデータ) (2022-06-02T19:05:13Z) - Robust Deep Semi-Supervised Learning: A Brief Introduction [63.09703308309176]
半教師付き学習(SSL)は、ラベルが不十分なときにラベル付きデータを活用することにより、学習性能を向上させることを目的としている。
ディープモデルによるSSLは、標準ベンチマークタスクで成功したことが証明されている。
しかし、それらは現実世界のアプリケーションにおける様々な堅牢性に対する脅威に対して依然として脆弱である。
論文 参考訳(メタデータ) (2022-02-12T04:16:41Z) - Semi-Supervised Learning of Classifiers from a Statistical Perspective:
A Brief Review [1.6752182911522517]
ここでは、分類器を形成する統計的SSLアプローチについてレビューする。
本研究では, 部分的に分類されたサンプルから生成した分類器が, サンプルが完全に分類された場合よりも, 予測誤差率が小さいことに着目した。
論文 参考訳(メタデータ) (2021-04-08T20:41:57Z) - Distribution Aligning Refinery of Pseudo-label for Imbalanced
Semi-supervised Learning [126.31716228319902]
Pseudo-label (DARP) アルゴリズムの分散アライメント・リファナリーを開発する。
DARPは最先端のSSLスキームと有効かつ効率的に互換性があることを示す。
論文 参考訳(メタデータ) (2020-07-17T09:16:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。