論文の概要: SAGE: Scalable Automatic Gating Ensemble for Confident Negative Harvesting in Fraud Detection
- arxiv url: http://arxiv.org/abs/2605.20157v1
- Date: Tue, 19 May 2026 17:46:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.564201
- Title: SAGE: Scalable Automatic Gating Ensemble for Confident Negative Harvesting in Fraud Detection
- Title(参考訳): SAGE: フラッド検出における信頼的負のハーベスティングのためのスケーラブルな自動ゲーティングアンサンブル
- Authors: Sudheer Tubati, Amit Goyal,
- Abstract要約: 音楽ストリーミング詐欺は、ストリーミングサービスや合法的なコンテンツクリエイターに重大な脅威をもたらす。
従来の詐欺検出アプローチは、スーパーファンや睡眠音楽セッションを含む多くの正当なエッジケースが、協調された詐欺行為を忠実に模倣する活動パターンを示すという、重大な課題に苦しむ。
SAGEは,SimHashをベースとした階層化サンプリングとモジュール型ゲーティングアンサンブルを組み合わせることで,ラベルなしデータからの確実な負の識別を実現する。
- 参考スコア(独自算出の注目度): 0.30693357740321775
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Music streaming fraud, where bad actors artificially inflate stream counts to manipulate chart rankings and royalty payments, poses a significant threat to streaming services and legitimate content creators. Traditional fraud detection approaches struggle with a critical challenge: many legitimate edge cases, including super-fans and sleep-music sessions, exhibit activity patterns that closely mimic those of coordinated fraud. We present SAGE, a novel counterfactual-aware negative harvesting approach that combines SimHash-based stratified sampling with a modular gating ensemble for confident negative identification from unlabeled data. Our ensemble architecture employs pluggable statistical gates (currently instantiated with Mahalanobis distance and k-NN density) with configurable voting thresholds enabling adaptive precision-recall trade-offs. This addresses the representation bias problem in Positive-Unlabeled learning by ensuring comprehensive coverage of rare behavioral cohorts through floor-constrained sampling. Evaluation demonstrates strong precision and recall on held-out data. The approach generalizes across fraud detection domains, achieving strong performance on both customer-level and artist-level fraud without modification to the core methodology.
- Abstract(参考訳): 音楽ストリーミング詐欺は、悪役がランキングやロイヤリティ支払いを操作するためにストリーム数を人工的に増加させ、ストリーミングサービスや合法的なコンテンツクリエーターに重大な脅威をもたらす。
従来の詐欺検出アプローチは、スーパーファンや睡眠音楽セッションを含む多くの正当なエッジケースが、協調された詐欺行為を忠実に模倣する活動パターンを示すという、重大な課題に苦しむ。
SAGEは,SimHashをベースとした階層化サンプリングとモジュール型ゲーティングアンサンブルを組み合わせることで,ラベルなしデータからの確実な負の識別を実現する。
我々のアンサンブルアーキテクチャでは、プラガブルな統計ゲート(現在はマハラノビス距離とk-NN密度でインスタンス化されている)と、適応的精度-リコールトレードオフを実現するための設定可能な投票しきい値を採用している。
このことは、フロア制約サンプリングを通して稀な行動コホートを包括的にカバーすることを保証することで、ポジティブ・アンラベル学習における表現バイアス問題に対処する。
評価は、ホールドアウトデータに対して強い精度とリコールを示す。
このアプローチは不正検出領域をまたいで一般化し、コア方法論を変更することなく、顧客レベルの詐欺とアーティストレベルの詐欺の両方で強力なパフォーマンスを達成する。
関連論文リスト
- Semi-Supervised Bayesian GANs with Log-Signatures for Uncertainty-Aware Credit Card Fraud Detection [0.0]
本稿では、時系列分類タスクとして定式化されたクレジットカード不正検出のための、新たな生成半教師付きフレームワークを提案する。
我々は、ターゲットデータ拡張のための条件付き生成的適応ネットワーク(GAN)を拡張し、ベイズ推論を統合して予測分布を取得し、不確実性を定量化する。
本手法は,クレジットカード取引データ用シミュレータである BankSim を用いて,ラベル付きサンプルの比率の異なるモデルを用いて評価した。
論文 参考訳(メタデータ) (2025-08-31T16:57:02Z) - A Label-Free Heterophily-Guided Approach for Unsupervised Graph Fraud Detection [60.09453163562244]
本稿では,非教師付きGFDのための非教師付きグラフ不正検出手法(HUGE)を提案する。
推定モジュールでは、GFD の臨界グラフ特性をキャプチャする HALO と呼ばれる新しいラベルフリーなヘテロフィリー計量を設計する。
アライメントに基づく不正検出モジュールにおいて、ランキング損失と非対称アライメント損失を有する合同GNNアーキテクチャを開発する。
論文 参考訳(メタデータ) (2025-02-18T22:07:36Z) - Securing Transactions: A Hybrid Dependable Ensemble Machine Learning
Model using IHT-LR and Grid Search [2.4374097382908477]
本稿では,複数のアルゴリズムをインテリジェントに組み合わせて不正識別を強化する,最先端のハイブリッドアンサンブル(ENS)機械学習(ML)モデルを提案する。
実験は,284,807件の取引からなる公開クレジットカードデータセットを用いて実施した。
提案したモデルは、99.66%、99.73%、98.56%、99.79%の精度で、それぞれDT、RF、KNN、ENSモデルに完全100%の精度を実現している。
論文 参考訳(メタデータ) (2024-02-22T09:01:42Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Explainable Fraud Detection with Deep Symbolic Classification [4.1205832766381985]
分類問題に対するDeep Symbolic Regressionフレームワークの拡張であるDeep Classificationを提案する。
関数は閉形式で簡潔な数学的表現であるため、モデルは1つの分類決定のレベルとモデルの決定過程の両方において本質的に説明可能である。
PaySimデータセットの評価は、最先端のモデルと競合する予測性能を示しながら、説明可能性の観点からそれらを上回っている。
論文 参考訳(メタデータ) (2023-12-01T13:50:55Z) - Transaction Fraud Detection via an Adaptive Graph Neural Network [64.9428588496749]
本稿では,アダプティブサンプリングとアグリゲーションに基づくグラフニューラルネットワーク(ASA-GNN)を提案する。
ノイズの多いノードをフィルタリングし、不正なノードを補うために、隣のサンプリング戦略を実行する。
3つのファイナンシャルデータセットの実験により,提案手法のASA-GNNは最先端のデータセットよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-07-11T07:48:39Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。