論文の概要: Challenges and Complexities in Machine Learning based Credit Card Fraud
Detection
- arxiv url: http://arxiv.org/abs/2208.10943v1
- Date: Sat, 20 Aug 2022 07:53:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-24 14:01:04.884530
- Title: Challenges and Complexities in Machine Learning based Credit Card Fraud
Detection
- Title(参考訳): 機械学習によるクレジットカード詐欺検出の課題と複雑さ
- Authors: Gayan K. Kulatilleke
- Abstract要約: 取引量、詐欺の独自性、詐欺師の巧妙さは詐欺を検知する上で大きな課題である。
機械学習、人工知能、ビッグデータの出現は、詐欺と戦うための新しいツールを公開した。
しかし,不正検出アルゴリズムの開発は,不正データの極めて不均衡な性質のため,困難で遅かった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Credit cards play an exploding role in modern economies. Its popularity and
ubiquity have created a fertile ground for fraud, assisted by the cross boarder
reach and instantaneous confirmation. While transactions are growing, the fraud
percentages are also on the rise as well as the true cost of a dollar fraud.
Volume of transactions, uniqueness of frauds and ingenuity of the fraudster are
main challenges in detecting frauds. The advent of machine learning, artificial
intelligence and big data has opened up new tools in the fight against frauds.
Given past transactions, a machine learning algorithm has the ability to
'learn' infinitely complex characteristics in order to identify frauds in
real-time, surpassing the best human investigators. However, the developments
in fraud detection algorithms has been challenging and slow due the massively
unbalanced nature of fraud data, absence of benchmarks and standard evaluation
metrics to identify better performing classifiers, lack of sharing and
disclosure of research findings and the difficulties in getting access to
confidential transaction data for research. This work investigates the
properties of typical massively imbalanced fraud data sets, their availability,
suitability for research use while exploring the widely varying nature of fraud
distributions. Furthermore, we show how human annotation errors compound with
machine classification errors. We also carry out experiments to determine the
effect of PCA obfuscation (as a means of disseminating sensitive transaction
data for research and machine learning) on algorithmic performance of
classifiers and show that while PCA does not significantly degrade performance,
care should be taken to use the appropriate principle component size
(dimensions) to avoid overfitting.
- Abstract(参考訳): クレジットカードは近代経済において爆発的な役割を担っている。
その人気と普遍性は、クロスボーダーのリーチと即時の確認によって支援され、詐欺の豊かな基盤を生み出した。
取引が増えている一方で、詐欺率は上昇し、ドル詐欺の真のコストも上昇している。
取引量、詐欺の独自性、詐欺師の巧妙さは詐欺を検知する上で大きな課題である。
機械学習、人工知能、ビッグデータの出現により、詐欺と戦うための新しいツールが開かれた。
過去のトランザクションを考慮に入れれば、機械学習アルゴリズムは、最高の人間研究者を上回る、リアルタイムで不正を識別するために、無限に複雑な特性を'学習'する能力を持つ。
しかし,不正検出アルゴリズムの開発は,不正データの非バランス性,ベンチマークや標準評価指標の欠如による優れた分類器の同定,研究結果の共有と開示の欠如,研究用秘密取引データへのアクセスの難しさなど,困難かつ遅かった。
本研究は, 典型的に不均衡な不正データ集合の特性, 利用可能性, 研究用途に適した性質について検討し, 詐欺分布の多様性について検討した。
さらに,人間のアノテーションエラーが機械分類エラーとどのように結合するかを示す。
また,分類器のアルゴリズム性能に対するPCA難読化(研究用および機械学習用機密トランザクションデータを拡散する手段として)の効果を判定する実験を行い,PCAは性能を著しく低下させるものではないが,過度な適合を避けるために適切な原理成分サイズ(次元)を使用する必要があることを示した。
関連論文リスト
- Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - Credit Card Fraud Detection with Subspace Learning-based One-Class
Classification [18.094622095967328]
1クラス分類(OCC)アルゴリズムは、不均衡なデータ分散を扱うのに優れている。
これらのアルゴリズムは、部分空間学習をデータ記述に統合する。
これらのアルゴリズムは、OCCに最適化された低次元の部分空間にデータを変換する。
論文 参考訳(メタデータ) (2023-09-26T12:26:28Z) - How adversarial attacks can disrupt seemingly stable accurate
classifiers [80.2657717174889]
敵攻撃は、入力データに不連続な修正を加えることで、非正確な学習システムの出力を劇的に変化させる。
ここでは,これは高次元入力データを扱う分類器の基本的特徴であると考えられる。
実用システムで観測される重要な振る舞いを高い確率で発生させる、単純で汎用的なフレームワークを導入する。
論文 参考訳(メタデータ) (2023-09-07T12:02:00Z) - Transaction Fraud Detection via an Adaptive Graph Neural Network [64.9428588496749]
本稿では,アダプティブサンプリングとアグリゲーションに基づくグラフニューラルネットワーク(ASA-GNN)を提案する。
ノイズの多いノードをフィルタリングし、不正なノードを補うために、隣のサンプリング戦略を実行する。
3つのファイナンシャルデータセットの実験により,提案手法のASA-GNNは最先端のデータセットよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-07-11T07:48:39Z) - Credit Card Fraud Detection Using Enhanced Random Forest Classifier for
Imbalanced Data [0.8223798883838329]
本稿では,この問題を解決するためにランダムフォレスト(RF)アルゴリズムを実装した。
本研究ではクレジットカード取引のデータセットを用いた。
論文 参考訳(メタデータ) (2023-03-11T22:59:37Z) - Empirical study of Machine Learning Classifier Evaluation Metrics
behavior in Massively Imbalanced and Noisy data [0.0]
我々は、実世界の不正検出データセットに典型的な人間のアノテーションエラーと極端な不均衡をモデル化するための理論的基盤を開発する。
我々は、F1スコアとg平均の組み合わせが、典型的な不均衡不正検出モデル分類における最良の評価指標であることを実証した。
論文 参考訳(メタデータ) (2022-08-25T07:30:31Z) - Credit card fraud detection - Classifier selection strategy [0.0]
アノテーション付きトランザクションのサンプルを使用して、機械学習の分類アルゴリズムは不正を検出することを学習する。
不正データセットは多種多様で 矛盾した特徴を示します
特徴的不均衡な不正検出データセットに対するデータ駆動型分類器選択手法を提案する。
論文 参考訳(メタデータ) (2022-08-25T07:13:42Z) - Relational Graph Neural Networks for Fraud Detection in a Super-App
environment [53.561797148529664]
スーパーアプリケーションの金融サービスにおける不正行為防止のための関係グラフ畳み込みネットワーク手法の枠組みを提案する。
我々は,グラフニューラルネットワークの解釈可能性アルゴリズムを用いて,ユーザの分類タスクに対する最も重要な関係を判定する。
以上の結果から,Super-Appの代替データと高接続性で得られるインタラクションを利用するモデルには,付加価値があることが示唆された。
論文 参考訳(メタデータ) (2021-07-29T00:02:06Z) - Deep Learning Methods for Credit Card Fraud Detection [3.069837038535869]
本稿では,クレジットカード詐欺検出問題の深層学習手法について検討する。
パフォーマンスを3つの金融データセット上のさまざまな機械学習アルゴリズムと比較する。
実験の結果,従来の機械学習モデルに対する深層学習手法の性能が向上した。
論文 参考訳(メタデータ) (2020-12-07T14:48:58Z) - DFraud3- Multi-Component Fraud Detection freeof Cold-start [50.779498955162644]
コールドスタート(Cold-start)は、新しいユーザの認証に検出システムが失敗したことを指す重要な問題である。
本稿では,各コンポーネントに固有の表現を可能にする異種情報ネットワーク (HIN) としてレビューシステムをモデル化する。
HINとグラフ誘導はカモフラージュ問題(本物のレビュー付き詐欺師)に対処するのに役立ち、これはコールドスタートと組み合わされた場合、すなわち真に最初のレビューを持つ新しい詐欺師がより深刻であることが示されている。
論文 参考訳(メタデータ) (2020-06-10T08:20:13Z) - Bias in Multimodal AI: Testbed for Fair Automatic Recruitment [73.85525896663371]
異種情報ソースに基づく現在のマルチモーダルアルゴリズムは、データ中の機密要素や内部バイアスによってどのように影響を受けるかを検討する。
我々は、性別や人種の偏りを意識的に評価したマルチモーダルな合成プロファイルを用いて、自動求人アルゴリズムを訓練する。
我々の方法論と結果は、一般により公平なAIベースのツール、特により公平な自動採用システムを生成する方法を示している。
論文 参考訳(メタデータ) (2020-04-15T15:58:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。