論文の概要: A Customer Level Fraudulent Activity Detection Benchmark for Enhancing Machine Learning Model Research and Evaluation
- arxiv url: http://arxiv.org/abs/2404.14746v1
- Date: Tue, 23 Apr 2024 04:57:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-24 15:10:30.557340
- Title: A Customer Level Fraudulent Activity Detection Benchmark for Enhancing Machine Learning Model Research and Evaluation
- Title(参考訳): 機械学習モデル研究と評価の強化のための顧客レベルのフラデュレントアクティビティ検出ベンチマーク
- Authors: Phoebe Jing, Yijing Gao, Xianlong Zeng,
- Abstract要約: 本研究では,顧客レベルの不正検出に特化して設計された構造化データセットを含むベンチマークを提案する。
このベンチマークは、ユーザの機密性を確保するために厳格なプライバシーガイドラインに準拠しているだけでなく、顧客中心の機能をカプセル化することによって、豊富な情報ソースを提供する。
- 参考スコア(独自算出の注目度): 0.4681661603096334
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the field of fraud detection, the availability of comprehensive and privacy-compliant datasets is crucial for advancing machine learning research and developing effective anti-fraud systems. Traditional datasets often focus on transaction-level information, which, while useful, overlooks the broader context of customer behavior patterns that are essential for detecting sophisticated fraud schemes. The scarcity of such data, primarily due to privacy concerns, significantly hampers the development and testing of predictive models that can operate effectively at the customer level. Addressing this gap, our study introduces a benchmark that contains structured datasets specifically designed for customer-level fraud detection. The benchmark not only adheres to strict privacy guidelines to ensure user confidentiality but also provides a rich source of information by encapsulating customer-centric features. We have developed the benchmark that allows for the comprehensive evaluation of various machine learning models, facilitating a deeper understanding of their strengths and weaknesses in predicting fraudulent activities. Through this work, we seek to bridge the existing gap in data availability, offering researchers and practitioners a valuable resource that empowers the development of next-generation fraud detection techniques.
- Abstract(参考訳): 不正検出の分野では、機械学習の研究を進め、効果的なアンチ詐欺システムを開発するために、包括的でプライバシに準拠したデータセットが利用できることが不可欠である。
従来のデータセットは、トランザクションレベルの情報に重点を置いていることが多い。
こうしたデータの不足は、主にプライバシー上の懸念によるものであり、顧客レベルで効果的に動作可能な予測モデルの開発とテストを大きく妨げている。
このギャップに対処するため,顧客レベルの不正検出に特化した構造化データセットを含むベンチマークを導入した。
このベンチマークは、ユーザの機密性を確保するために厳格なプライバシーガイドラインに準拠しているだけでなく、顧客中心の機能をカプセル化することによって、豊富な情報ソースを提供する。
我々は、さまざまな機械学習モデルの総合的な評価を可能にするベンチマークを開発し、不正行為を予測する際のその強みと弱点をより深く理解することを可能にした。
この研究を通じて、我々は、データ可用性の既存のギャップを埋め、研究者や実践者が次世代の不正検出技術を開発するための貴重なリソースを提供しようとしている。
関連論文リスト
- Collaborative Knowledge Infusion for Low-resource Stance Detection [83.88515573352795]
姿勢検出モデルを支援するために、ターゲット関連の知識がしばしば必要である。
低リソース姿勢検出タスクに対する協調的知識注入手法を提案する。
論文 参考訳(メタデータ) (2024-03-28T08:32:14Z) - On the Potential of Network-Based Features for Fraud Detection [3.0846824529023382]
本稿では、パーソナライズされたPageRank(PPR)アルゴリズムを用いて、詐欺の社会的ダイナミクスを捉える。
主な目的は、従来の特徴と不正検出モデルにおけるPPRの追加を比較することである。
その結果,PPRの統合はモデルの予測能力を向上し,ベースラインモデルを上回ることが示唆された。
論文 参考訳(メタデータ) (2024-02-14T13:20:09Z) - Privacy-Preserving Financial Anomaly Detection via Federated Learning & Multi-Party Computation [17.314619091307343]
本稿では、金融機関が高精度な異常検出モデルを共同で訓練できるプライバシー保護フレームワークについて述べる。
当社のソリューションは,顧客データのプライバシを保ちながら,高精度な異常検出モデルをトレーニングすることを可能にする。
論文 参考訳(メタデータ) (2023-10-06T19:16:41Z) - Re-thinking Data Availablity Attacks Against Deep Neural Networks [53.64624167867274]
本稿では、未学習例の概念を再検討し、既存のロバストな誤り最小化ノイズが不正確な最適化目標であることを示す。
本稿では,計算時間要件の低減による保護性能の向上を図った新しい最適化パラダイムを提案する。
論文 参考訳(メタデータ) (2023-05-18T04:03:51Z) - Auditing and Generating Synthetic Data with Controllable Trust Trade-offs [54.262044436203965]
合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。
バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。
多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-21T09:03:18Z) - Data AUDIT: Identifying Attribute Utility- and Detectability-Induced
Bias in Task Models [8.420252576694583]
医用画像データセットの厳密で定量的なスクリーニングのための第1の手法を提案する。
提案手法は,データセット属性に関連するリスクを,検出性と実用性の観点から分解する。
本手法を用いて, ほぼ知覚不能なバイアス誘発アーティファクトを確実に同定するスクリーニング手法を提案する。
論文 参考訳(メタデータ) (2023-04-06T16:50:15Z) - Understanding Information Disclosure from Secure Computation Output: A Study of Average Salary Computation [58.74407460023331]
関数結果の観察からプライベート入力に関する情報開示を定量化することが,本研究の課題である。
ボストン市における男女賃金格差の研究に動機づけられたこの研究は、給与の平均計算に焦点を当てる。
論文 参考訳(メタデータ) (2022-09-21T15:59:48Z) - Towards a Data Privacy-Predictive Performance Trade-off [2.580765958706854]
分類タスクにおけるデータプライバシと予測性能のトレードオフの存在を評価する。
従来の文献とは異なり、プライバシーのレベルが高ければ高いほど、予測性能が向上することを確認した。
論文 参考訳(メタデータ) (2022-01-13T21:48:51Z) - Leaking Sensitive Financial Accounting Data in Plain Sight using Deep
Autoencoder Neural Networks [1.9659095632676094]
センシティブな会計データを漏洩させる「実世界の脅威モデル」を提案する。
3つのニューラルネットワークで構成された深層ステガノグラフィープロセスは、そのデータを日々の目立たないイメージに隠すように訓練できる。
論文 参考訳(メタデータ) (2020-12-13T17:29:53Z) - PCAL: A Privacy-preserving Intelligent Credit Risk Modeling Framework
Based on Adversarial Learning [111.19576084222345]
本稿では,PCAL(Adversarial Learning)に基づくプライバシ保護型信用リスクモデリングの枠組みを提案する。
PCALは、ターゲット予測タスクのパフォーマンスの重要なユーティリティ情報を維持しながら、元のデータセット内のプライベート情報を隠蔽することを目的としている。
結果は,PCALがユーザデータから効果的なプライバシフリー表現を学習し,信用リスク分析のためのプライバシ保存機械学習の基盤となることを示唆している。
論文 参考訳(メタデータ) (2020-10-06T07:04:59Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。