論文の概要: Evaluating Supervised Learning Models for Fraud Detection: A Comparative Study of Classical and Deep Architectures on Imbalanced Transaction Data
- arxiv url: http://arxiv.org/abs/2505.22521v1
- Date: Wed, 28 May 2025 16:08:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.717541
- Title: Evaluating Supervised Learning Models for Fraud Detection: A Comparative Study of Classical and Deep Architectures on Imbalanced Transaction Data
- Title(参考訳): フラッド検出のための教師付き学習モデルの評価:不均衡取引データにおける古典的および深いアーキテクチャの比較
- Authors: Chao Wang, Chuanhao Nie, Yunbo Liu,
- Abstract要約: 不正検出は金融や電子商取引といった高額な分野において依然として重要な課題である。
大規模かつ高度に不均衡なオンライントランザクションデータセット上で、4つの教師付き学習モデルの性能を体系的に比較する。
- 参考スコア(独自算出の注目度): 2.5670390559986442
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fraud detection remains a critical task in high-stakes domains such as finance and e-commerce, where undetected fraudulent transactions can lead to significant economic losses. In this study, we systematically compare the performance of four supervised learning models - Logistic Regression, Random Forest, Light Gradient Boosting Machine (LightGBM), and a Gated Recurrent Unit (GRU) network - on a large-scale, highly imbalanced online transaction dataset. While ensemble methods such as Random Forest and LightGBM demonstrated superior performance in both overall and class-specific metrics, Logistic Regression offered a reliable and interpretable baseline. The GRU model showed strong recall for the minority fraud class, though at the cost of precision, highlighting a trade-off relevant for real-world deployment. Our evaluation emphasizes not only weighted averages but also per-class precision, recall, and F1-scores, providing a nuanced view of each model's effectiveness in detecting rare but consequential fraudulent activity. The findings underscore the importance of choosing models based on the specific risk tolerance and operational needs of fraud detection systems.
- Abstract(参考訳): 不正検出は金融や電子商取引などの高額な領域において依然として重要な課題であり、不正取引の未発見が経済的損失に繋がる可能性がある。
本研究では,大規模かつ不均衡なオンライントランザクションデータセット上で,ロジスティック回帰,ランダムフォレスト,ライトグラディエントブースティングマシン(LightGBM),GRU(Gated Recurrent Unit)ネットワークの4つの教師付き学習モデルの性能を体系的に比較した。
Random Forest や LightGBM のようなアンサンブル手法は、全体的なメトリクスとクラス固有のメトリクスの両方において優れた性能を示したが、ロジスティック回帰は信頼性と解釈可能なベースラインを提供した。
GRUモデルは少数派の詐欺集団に対して強いリコールを見せたが、精度は高く、現実世界の展開に関連するトレードオフを浮き彫りにした。
評価では,重み付き平均だけでなく,クラスごとの精度,リコール,F1スコアも強調し,各モデルが稀だが連続的な不正行為を検出する上での有効性を示す。
この結果から,不正検出システムの特定のリスク耐性と運用上のニーズに基づいて,モデルを選択することの重要性が示唆された。
関連論文リスト
- Explainable AI for Fraud Detection: An Attention-Based Ensemble of CNNs, GNNs, and A Confidence-Driven Gating Mechanism [5.486205584465161]
本研究は,通常の分類プロセスに2つの余分な層を追加することにより,CCF検出のための新たな積み重ねに基づくアプローチを提案する。
注意層では、畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)のソフトアウトプットを、依存重み付け平均化(DOWA)演算子を用いて組み合わせる。
信頼層では,どのアグリゲーション(DOWAまたはIOWA)でも,メタラーナーへのフィードの不確実性が低いかを選択する。
3つのデータセットに対する実験により,提案手法は高精度かつ堅牢な一般化を実現し,CCF検出に有効であることが示された。
論文 参考訳(メタデータ) (2024-10-01T09:56:23Z) - Thinking Racial Bias in Fair Forgery Detection: Models, Datasets and Evaluations [63.52709761339949]
最初に、Fair Forgery Detection(FairFD)データセットと呼ばれる専用のデータセットをコントリビュートし、SOTA(Public State-of-the-art)メソッドの人種的偏見を証明する。
我々は、偽りの結果を避けることができる平均的メトリクスと実用正規化メトリクスを含む新しいメトリクスを設計する。
また,有効で堅牢な後処理技術であるBias Pruning with Fair Activations (BPFA)も提案する。
論文 参考訳(メタデータ) (2024-07-19T14:53:18Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - Explainable Fraud Detection with Deep Symbolic Classification [4.1205832766381985]
分類問題に対するDeep Symbolic Regressionフレームワークの拡張であるDeep Classificationを提案する。
関数は閉形式で簡潔な数学的表現であるため、モデルは1つの分類決定のレベルとモデルの決定過程の両方において本質的に説明可能である。
PaySimデータセットの評価は、最先端のモデルと競合する予測性能を示しながら、説明可能性の観点からそれらを上回っている。
論文 参考訳(メタデータ) (2023-12-01T13:50:55Z) - Fast Model Debias with Machine Unlearning [54.32026474971696]
ディープニューラルネットワークは多くの現実世界のシナリオでバイアスのある振る舞いをする。
既存のデバイアス法は、バイアスラベルやモデル再トレーニングのコストが高い。
バイアスを特定し,評価し,除去するための効率的なアプローチを提供する高速モデル脱バイアスフレームワーク(FMD)を提案する。
論文 参考訳(メタデータ) (2023-10-19T08:10:57Z) - A Generative Framework for Low-Cost Result Validation of Machine Learning-as-a-Service Inference [4.478182379059458]
FidesはML-as-a-Service(ML)推論のリアルタイム整合性検証のための新しいフレームワークである。
Fidesは、統計的分析とばらつき測定を使用して、サービスモデルが攻撃を受けている場合、高い確率で識別するクライアント側攻撃検出モデルを備えている。
攻撃検出と再分類モデルの訓練のための生成的逆ネットワークフレームワークを考案した。
論文 参考訳(メタデータ) (2023-03-31T19:17:30Z) - Fraud Detection Using Optimized Machine Learning Tools Under Imbalance
Classes [0.304585143845864]
機械学習(ML)ツールのスマートバージョンによる不正検出は、安全性を保証するために不可欠である。
本稿では,4つの最先端ML手法,すなわちロジスティック回帰,決定木,ランダム森林,極端な勾配上昇について検討する。
フィッシングサイトURLとクレジットカード不正取引データセットは、元のデータに基づいてトレーニングされた極端な勾配が、信頼できるパフォーマンスを示していることを示している。
論文 参考訳(メタデータ) (2022-09-04T15:30:23Z) - Empirical study of Machine Learning Classifier Evaluation Metrics
behavior in Massively Imbalanced and Noisy data [0.0]
我々は、実世界の不正検出データセットに典型的な人間のアノテーションエラーと極端な不均衡をモデル化するための理論的基盤を開発する。
我々は、F1スコアとg平均の組み合わせが、典型的な不均衡不正検出モデル分類における最良の評価指標であることを実証した。
論文 参考訳(メタデータ) (2022-08-25T07:30:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。