論文の概要: ROSFD: Robust Online Streaming Fraud Detection with Resilience to Concept Drift in Data Streams
- arxiv url: http://arxiv.org/abs/2504.10229v1
- Date: Mon, 14 Apr 2025 13:50:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:50:23.292723
- Title: ROSFD: Robust Online Streaming Fraud Detection with Resilience to Concept Drift in Data Streams
- Title(参考訳): ROSFD: データストリームにおけるコンセプトドリフトに対する抵抗性を備えたロバストオンラインストリーミングフラッド検出
- Authors: Vivek Yelleti,
- Abstract要約: ストリーミングデータの連続生成は、タイムリーな不正検出を必要とする。
伝統的なバッチ処理手法は、しばしば急速に進化する不正行為のパターンを捉えるのに苦労する。
本稿では,効果的な不正検出のためのストリーミングデータ処理の重要性を強調した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Continuous generation of streaming data from diverse sources, such as online transactions and digital interactions, necessitates timely fraud detection. Traditional batch processing methods often struggle to capture the rapidly evolving patterns of fraudulent activities. This paper highlights the critical importance of processing streaming data for effective fraud detection. To address the inherent challenges of latency, scalability, and concept drift in streaming environments, we propose a robust online streaming fraud detection (ROSFD) framework. Our proposed framework comprises two key stages: (i) Stage One: Offline Model Initialization. In this initial stage, a model is built in offline settings using incremental learning principles to overcome the "cold-start" problem. (ii) Stage Two: Real-time Model Adaptation. In this dynamic stage, drift detection algorithms (viz.,, DDM, EDDM, and ADWIN) are employed to identify concept drift in the incoming data stream and incrementally train the model accordingly. This "train-only-when-required" strategy drastically reduces the number of retrains needed without significantly impacting the area under the receiver operating characteristic curve (AUC). Overall, ROSFD utilizing ADWIN as the drift detection method demonstrated the best performance among the employed methods. In terms of model efficacy, Adaptive Random Forest consistently outperformed other models, achieving the highest AUC in four out of five datasets.
- Abstract(参考訳): オンライントランザクションやデジタルインタラクションなど、さまざまなソースからのストリーミングデータの連続生成は、タイムリーな不正検出を必要とする。
伝統的なバッチ処理手法は、しばしば急速に進化する不正行為のパターンを捉えるのに苦労する。
本稿では,効果的な不正検出のためのストリーミングデータ処理の重要性を強調した。
ストリーミング環境におけるレイテンシ,スケーラビリティ,コンセプトドリフトといった課題に対処するため,ロバストなオンラインストリーミング不正検出(ROSFD)フレームワークを提案する。
提案するフレームワークには,2つの重要な段階がある。
(i)ステージ1:オフラインモデル初期化。
この初期段階では、モデルをオフラインで構築し、漸進的な学習原則を使って"コールドスタート"問題を克服します。
(II)ステージ2:リアルタイムモデル適応。
この動的段階では、ドリフト検出アルゴリズム(viz, DDM, EDDM, ADWIN)を用いて、入ってくるデータストリームにおける概念ドリフトを特定し、それに従ってモデルを漸進的に訓練する。
この「列車のみ要求」戦略は、受信機動作特性曲線 (AUC) の下の領域に大きな影響を及ぼすことなく、必要な再列車の数を劇的に削減する。
全体として,ADWINをドリフト検出法として用いたROSFDが最も優れた性能を示した。
モデルの有効性に関しては、アダプティブランダムフォレストは他のモデルよりも一貫して優れており、5つのデータセットのうち4つで最も高いAUCを達成している。
関連論文リスト
- Online Drift Detection with Maximum Concept Discrepancy [13.48123472458282]
最大概念差に基づく新しい概念ドリフト検出手法であるMDD-DDを提案する。
本手法は,概念埋め込みのコントラスト学習により,様々な形態のコンセプトドリフトを適応的に同定することができる。
論文 参考訳(メタデータ) (2024-07-07T13:57:50Z) - Liquid Neural Network-based Adaptive Learning vs. Incremental Learning for Link Load Prediction amid Concept Drift due to Network Failures [37.66676003679306]
概念の漂流に適応することは、機械学習において難しい課題である。
通信ネットワークでは、障害イベントの後に交通予報を行う際にこのような問題が生じる。
本稿では,適応学習アルゴリズム,すなわち,データパターンの急激な変化を,再学習を必要とせずに自己適応できる手法を提案する。
論文 参考訳(メタデータ) (2024-04-08T08:47:46Z) - Addressing Concept Shift in Online Time Series Forecasting: Detect-then-Adapt [37.98336090671441]
概念 textbfDrift textbfDetection antextbfD textbfAdaptation (D3A)
まずドリフトの概念を検知し、次に急激な適応の検出の後、現在のモデルをドリフトされた概念に積極的に適応する。
これは、トレイン-テストのパフォーマンスの不整合に寄与する重要な要因であるデータ分散ギャップを軽減するのに役立ちます。
論文 参考訳(メタデータ) (2024-03-22T04:44:43Z) - METER: A Dynamic Concept Adaptation Framework for Online Anomaly
Detection [25.022228143354123]
リアルタイム分析と意思決定は、データストリームのドリフトを効率的かつ効果的に処理するために、オンラインの異常検出を必要とする。
既存のアプローチは、検出能力の制限と、進化するデータストリームへの適応の遅さによって制約されることが多い。
我々は,OADの新しいパラダイムを導入した新しい動的概念適応フレームワークであるMETERを紹介する。
論文 参考訳(メタデータ) (2023-12-28T05:09:31Z) - Cross-modal Prompts: Adapting Large Pre-trained Models for Audio-Visual
Downstream Tasks [55.36987468073152]
本稿では,DG-SCT(Dual-Guided Space-Channel-Temporal)アテンション機構を提案する。
DG-SCTモジュールはトレーニング可能なクロスモーダル・インタラクション・レイヤを事前トレーニングされたオーディオ・ビジュアル・エンコーダに組み込む。
提案手法は, AVE, AVVP, AVS, AVQA, AVQAを含む複数のダウンストリームタスクにまたがる最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2023-11-09T05:24:20Z) - PREM: A Simple Yet Effective Approach for Node-Level Graph Anomaly
Detection [65.24854366973794]
ノードレベルのグラフ異常検出(GAD)は、医学、ソーシャルネットワーク、eコマースなどの分野におけるグラフ構造化データから異常ノードを特定する上で重要な役割を果たす。
本稿では,GADの効率を向上させるために,PREM (preprocessing and Matching) という簡単な手法を提案する。
我々のアプローチは、強力な異常検出機能を維持しながら、GADを合理化し、時間とメモリ消費を削減します。
論文 参考訳(メタデータ) (2023-10-18T02:59:57Z) - Uncovering Drift in Textual Data: An Unsupervised Method for Detecting
and Mitigating Drift in Machine Learning Models [9.035254826664273]
機械学習におけるドリフト(drift)とは、モデルが動作しているデータやコンテキストの統計的性質が時間とともに変化し、性能が低下する現象を指す。
提案手法では, 目標分布として生産データのサンプルを符号化し, モデルトレーニングデータを基準分布として符号化する。
また,ドリフトの根本原因である生産データのサブセットも同定する。
これらの高ドリフトサンプルを用いて再トレーニングしたモデルでは、オンライン顧客エクスペリエンスの品質指標のパフォーマンスが改善された。
論文 参考訳(メタデータ) (2023-09-07T16:45:42Z) - Confidence Attention and Generalization Enhanced Distillation for
Continuous Video Domain Adaptation [62.458968086881555]
連続ビデオドメイン適応(CVDA、Continuous Video Domain Adaptation)は、ソースモデルが個々の変更対象ドメインに適応する必要があるシナリオである。
CVDAの課題に対処するため,遺伝子組み換え型自己知識解離(CART)を用いた信頼性保証ネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-18T16:40:10Z) - StreamYOLO: Real-time Object Detection for Streaming Perception [84.2559631820007]
将来を予測する能力を備えたモデルを提供し、ストリーミング知覚の結果を大幅に改善する。
本稿では,複数の速度を駆動するシーンについて考察し,VasAP(Velocity-Awared streaming AP)を提案する。
本手法は,Argoverse-HDデータセットの最先端性能を実現し,SAPとVsAPをそれぞれ4.7%,VsAPを8.2%改善する。
論文 参考訳(メタデータ) (2022-07-21T12:03:02Z) - Real-time Object Detection for Streaming Perception [84.2559631820007]
ストリーミング知覚は,ビデオオンライン知覚の1つの指標として,レイテンシと精度を共同評価するために提案される。
ストリーミング知覚のためのシンプルで効果的なフレームワークを構築します。
提案手法はArgoverse-HDデータセット上での競合性能を実現し,強力なベースラインに比べてAPを4.9%向上させる。
論文 参考訳(メタデータ) (2022-03-23T11:33:27Z) - Self-Supervised Multi-Frame Monocular Scene Flow [61.588808225321735]
自己監督学習に基づくマルチフレーム一眼的シーンフローネットワークを導入。
自己監督学習に基づく単眼的シーンフロー法における最新の精度を観察する。
論文 参考訳(メタデータ) (2021-05-05T17:49:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。