論文の概要: A Customer Level Fraudulent Activity Detection Benchmark for Enhancing Machine Learning Model Research and Evaluation
- arxiv url: http://arxiv.org/abs/2404.14746v1
- Date: Tue, 23 Apr 2024 04:57:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-24 15:10:30.557340
- Title: A Customer Level Fraudulent Activity Detection Benchmark for Enhancing Machine Learning Model Research and Evaluation
- Title(参考訳): 機械学習モデル研究と評価の強化のための顧客レベルのフラデュレントアクティビティ検出ベンチマーク
- Authors: Phoebe Jing, Yijing Gao, Xianlong Zeng,
- Abstract要約: 本研究では,顧客レベルの不正検出に特化して設計された構造化データセットを含むベンチマークを提案する。
このベンチマークは、ユーザの機密性を確保するために厳格なプライバシーガイドラインに準拠しているだけでなく、顧客中心の機能をカプセル化することによって、豊富な情報ソースを提供する。
- 参考スコア(独自算出の注目度): 0.4681661603096334
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the field of fraud detection, the availability of comprehensive and privacy-compliant datasets is crucial for advancing machine learning research and developing effective anti-fraud systems. Traditional datasets often focus on transaction-level information, which, while useful, overlooks the broader context of customer behavior patterns that are essential for detecting sophisticated fraud schemes. The scarcity of such data, primarily due to privacy concerns, significantly hampers the development and testing of predictive models that can operate effectively at the customer level. Addressing this gap, our study introduces a benchmark that contains structured datasets specifically designed for customer-level fraud detection. The benchmark not only adheres to strict privacy guidelines to ensure user confidentiality but also provides a rich source of information by encapsulating customer-centric features. We have developed the benchmark that allows for the comprehensive evaluation of various machine learning models, facilitating a deeper understanding of their strengths and weaknesses in predicting fraudulent activities. Through this work, we seek to bridge the existing gap in data availability, offering researchers and practitioners a valuable resource that empowers the development of next-generation fraud detection techniques.
- Abstract(参考訳): 不正検出の分野では、機械学習の研究を進め、効果的なアンチ詐欺システムを開発するために、包括的でプライバシに準拠したデータセットが利用できることが不可欠である。
従来のデータセットは、トランザクションレベルの情報に重点を置いていることが多い。
こうしたデータの不足は、主にプライバシー上の懸念によるものであり、顧客レベルで効果的に動作可能な予測モデルの開発とテストを大きく妨げている。
このギャップに対処するため,顧客レベルの不正検出に特化した構造化データセットを含むベンチマークを導入した。
このベンチマークは、ユーザの機密性を確保するために厳格なプライバシーガイドラインに準拠しているだけでなく、顧客中心の機能をカプセル化することによって、豊富な情報ソースを提供する。
我々は、さまざまな機械学習モデルの総合的な評価を可能にするベンチマークを開発し、不正行為を予測する際のその強みと弱点をより深く理解することを可能にした。
この研究を通じて、我々は、データ可用性の既存のギャップを埋め、研究者や実践者が次世代の不正検出技術を開発するための貴重なリソースを提供しようとしている。
関連論文リスト
- On the Potential of Network-Based Features for Fraud Detection [3.0846824529023382]
本稿では、パーソナライズされたPageRank(PPR)アルゴリズムを用いて、詐欺の社会的ダイナミクスを捉える。
主な目的は、従来の特徴と不正検出モデルにおけるPPRの追加を比較することである。
その結果,PPRの統合はモデルの予測能力を向上し,ベースラインモデルを上回ることが示唆された。
論文 参考訳(メタデータ) (2024-02-14T13:20:09Z) - Re-thinking Data Availablity Attacks Against Deep Neural Networks [53.64624167867274]
本稿では、未学習例の概念を再検討し、既存のロバストな誤り最小化ノイズが不正確な最適化目標であることを示す。
本稿では,計算時間要件の低減による保護性能の向上を図った新しい最適化パラダイムを提案する。
論文 参考訳(メタデータ) (2023-05-18T04:03:51Z) - Federated Learning with Uncertainty-Based Client Clustering for
Fleet-Wide Fault Diagnosis [5.684489493030555]
フェデレートラーニングは、複数のオペレータのデータセットを活用して分散化されたアセット障害診断モデルをトレーニングする、有望なソリューションとして登場した。
本稿では、データセットの類似性に基づいて、クライアントをフェデレーション用にクラスタリングする新しいクラスタリングベースのFLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-26T04:23:59Z) - Auditing and Generating Synthetic Data with Controllable Trust
Trade-offs [54.262044436203965]
合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。
バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。
多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-21T09:03:18Z) - Data AUDIT: Identifying Attribute Utility- and Detectability-Induced
Bias in Task Models [8.420252576694583]
医用画像データセットの厳密で定量的なスクリーニングのための第1の手法を提案する。
提案手法は,データセット属性に関連するリスクを,検出性と実用性の観点から分解する。
本手法を用いて, ほぼ知覚不能なバイアス誘発アーティファクトを確実に同定するスクリーニング手法を提案する。
論文 参考訳(メタデータ) (2023-04-06T16:50:15Z) - Towards a Data Privacy-Predictive Performance Trade-off [2.580765958706854]
分類タスクにおけるデータプライバシと予測性能のトレードオフの存在を評価する。
従来の文献とは異なり、プライバシーのレベルが高ければ高いほど、予測性能が向上することを確認した。
論文 参考訳(メタデータ) (2022-01-13T21:48:51Z) - Leaking Sensitive Financial Accounting Data in Plain Sight using Deep
Autoencoder Neural Networks [1.9659095632676094]
センシティブな会計データを漏洩させる「実世界の脅威モデル」を提案する。
3つのニューラルネットワークで構成された深層ステガノグラフィープロセスは、そのデータを日々の目立たないイメージに隠すように訓練できる。
論文 参考訳(メタデータ) (2020-12-13T17:29:53Z) - PCAL: A Privacy-preserving Intelligent Credit Risk Modeling Framework
Based on Adversarial Learning [111.19576084222345]
本稿では,PCAL(Adversarial Learning)に基づくプライバシ保護型信用リスクモデリングの枠組みを提案する。
PCALは、ターゲット予測タスクのパフォーマンスの重要なユーティリティ情報を維持しながら、元のデータセット内のプライベート情報を隠蔽することを目的としている。
結果は,PCALがユーザデータから効果的なプライバシフリー表現を学習し,信用リスク分析のためのプライバシ保存機械学習の基盤となることを示唆している。
論文 参考訳(メタデータ) (2020-10-06T07:04:59Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z) - Differentially Private and Fair Deep Learning: A Lagrangian Dual
Approach [54.32266555843765]
本稿では,個人の機密情報のプライバシを保護するとともに,非差別的予測器の学習を可能にするモデルについて検討する。
この方法は、微分プライバシーの概念と、公正性制約を満たすニューラルネットワークの設計にラグランジアン双対性(Lagrangian duality)を用いることに依存している。
論文 参考訳(メタデータ) (2020-09-26T10:50:33Z) - AutoOD: Automated Outlier Detection via Curiosity-guided Search and
Self-imitation Learning [72.99415402575886]
外乱検出は重要なデータマイニングの課題であり、多くの実用的応用がある。
本稿では,最適なニューラルネットワークモデルを探すことを目的とした自動外乱検出フレームワークであるAutoODを提案する。
さまざまな実世界のベンチマークデータセットに対する実験結果から、AutoODが特定したディープモデルが最高のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2020-06-19T18:57:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。