論文の概要: Graph Feature Preprocessor: Real-time Subgraph-based Feature Extraction for Financial Crime Detection
- arxiv url: http://arxiv.org/abs/2402.08593v2
- Date: Thu, 03 Oct 2024 09:38:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-04 23:30:52.441780
- Title: Graph Feature Preprocessor: Real-time Subgraph-based Feature Extraction for Financial Crime Detection
- Title(参考訳): グラフ特徴前処理:金融犯罪検出のためのリアルタイムサブグラフに基づく特徴抽出
- Authors: Jovan Blanuša, Maximo Cravero Baraja, Andreea Anghel, Luc von Niederhäusern, Erik Altman, Haris Pozidis, Kubilay Atasu,
- Abstract要約: グラフ特徴前処理(Graph Feature Preprocessor)は、金融取引グラフの典型的なマネーロンダリングパターンをリアルタイムで検出するソフトウェアライブラリである。
よりリッチなトランザクション機能により、勾配ブースティングに基づく機械学習モデルの予測精度が劇的に向上することを示す。
我々のソリューションは、アンチマネーロンダリングやフィッシングデータセットにおける標準グラフニューラルネットワークよりも、マイノリティクラスのF1スコアの高い不正トランザクションを検出することができる。
- 参考スコア(独自算出の注目度): 2.1140460101878107
- License:
- Abstract: In this paper, we present "Graph Feature Preprocessor", a software library for detecting typical money laundering patterns in financial transaction graphs in real time. These patterns are used to produce a rich set of transaction features for downstream machine learning training and inference tasks such as detection of fraudulent financial transactions. We show that our enriched transaction features dramatically improve the prediction accuracy of gradient-boosting-based machine learning models. Our library exploits multicore parallelism, maintains a dynamic in-memory graph, and efficiently mines subgraph patterns in the incoming transaction stream, which enables it to be operated in a streaming manner. Our solution, which combines our Graph Feature Preprocessor and gradient-boosting-based machine learning models, can detect illicit transactions with higher minority-class F1 scores than standard graph neural networks in anti-money laundering and phishing datasets. In addition, the end-to-end throughput rate of our solution executed on a multicore CPU outperforms the graph neural network baselines executed on a powerful V100 GPU. Overall, the combination of high accuracy, a high throughput rate, and low latency of our solution demonstrates the practical value of our library in real-world applications.
- Abstract(参考訳): 本稿では,金融取引グラフにおける典型的なマネーロンダリングパターンをリアルタイムに検出するソフトウェアライブラリであるGraph Feature Preprocessorを提案する。
これらのパターンは、下流の機械学習トレーニングと不正な金融取引の検出などの推論タスクのための豊富なトランザクション機能を生成するために使用される。
よりリッチなトランザクション機能により、勾配ブースティングに基づく機械学習モデルの予測精度が劇的に向上することを示す。
ライブラリはマルチコア並列性を活用し,動的インメモリグラフを維持し,受信したトランザクションストリームのサブグラフパターンを効率的にマイニングすることで,ストリーミング方式で操作することができる。
我々のソリューションはグラフ特徴前処理と勾配ブースティングに基づく機械学習モデルを組み合わせることで、アンチマネーロンダリングやフィッシングデータセットの標準グラフニューラルネットワークよりも、マイノリティクラスのF1スコアの高い不正トランザクションを検出することができます。
さらに、マルチコアCPU上で実行されるソリューションのエンドツーエンドスループット速度は、強力なV100 GPU上で実行されるグラフニューラルネットワークベースラインよりも優れています。
全体として、高い精度、高いスループット率、低レイテンシの組み合わせは、現実のアプリケーションにおける我々のライブラリの実用的価値を示しています。
関連論文リスト
- CleanGraph: Human-in-the-loop Knowledge Graph Refinement and Completion [8.358365661172025]
CleanGraphは知識グラフの洗練と完成を容易にするために設計されたWebベースのツールである。
知識グラフは、高品質でエラーのない事実に基礎を置いている。
論文 参考訳(メタデータ) (2024-05-07T01:40:23Z) - The Shape of Money Laundering: Subgraph Representation Learning on the Blockchain with the Elliptic2 Dataset [6.209290101460395]
サブグラフ表現学習(Subgraph representation learning)は、複雑なネットワーク内の局所構造(または形状)を分析する技術である。
Bitcoinクラスタの122Kラベルのサブグラフを含むグラフデータセットであるElliptic2を紹介する。
このアプローチの即時的な実用価値と、暗号通貨における反マネーロンダリングと法医学的分析における新しい標準の可能性を見出す。
論文 参考訳(メタデータ) (2024-04-29T21:19:41Z) - Novel Representation Learning Technique using Graphs for Performance
Analytics [0.0]
本稿では,グラフニューラルネットワーク(GNN)技術の進歩を活用するために,パフォーマンスデータをグラフに変換する新しいアイデアを提案する。
ソーシャルネットワークのような他の機械学習アプリケーションドメインとは対照的に、グラフは提供されない。
我々は,GNNから生成された埋め込みの有効性を,単純なフィードフォワードニューラルネットワークによる回帰処理の性能評価に基づいて評価した。
論文 参考訳(メタデータ) (2024-01-19T16:34:37Z) - Graph Transformers for Large Graphs [57.19338459218758]
この研究は、モデルの特徴と重要な設計制約を識別することに焦点を当てた、単一の大規模グラフでの表現学習を前進させる。
この研究の重要な革新は、局所的な注意機構と組み合わされた高速な近傍サンプリング技術の作成である。
ogbn-products と snap-patents の3倍の高速化と16.8%の性能向上を報告し、ogbn-100M で LargeGT を5.9% の性能改善で拡張した。
論文 参考訳(メタデータ) (2023-12-18T11:19:23Z) - SimTeG: A Frustratingly Simple Approach Improves Textual Graph Learning [131.04781590452308]
テキストグラフ学習におけるフラストレーションに富んだアプローチであるSimTeGを提案する。
まず、下流タスクで予め訓練されたLM上で、教師付きパラメータ効率の微調整(PEFT)を行う。
次に、微調整されたLMの最後の隠れ状態を用いてノード埋め込みを生成する。
論文 参考訳(メタデータ) (2023-08-03T07:00:04Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Graph Kernel Neural Networks [53.91024360329517]
本稿では、グラフ上の内部積を計算するカーネル関数であるグラフカーネルを用いて、標準畳み込み演算子をグラフ領域に拡張することを提案する。
これにより、入力グラフの埋め込みを計算する必要のない完全に構造的なモデルを定義することができる。
私たちのアーキテクチャでは,任意の種類のグラフカーネルをプラグインすることが可能です。
論文 参考訳(メタデータ) (2021-12-14T14:48:08Z) - Node Feature Extraction by Self-Supervised Multi-scale Neighborhood
Prediction [123.20238648121445]
我々は、新しい自己教師型学習フレームワーク、グラフ情報支援ノード機能exTraction (GIANT)を提案する。
GIANT は eXtreme Multi-label Classification (XMC) 形式を利用しており、これはグラフ情報に基づいた言語モデルの微調整に不可欠である。
我々は,Open Graph Benchmarkデータセット上での標準GNNパイプラインよりもGIANTの方が優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-29T19:55:12Z) - Scalable Graph Embedding LearningOn A Single GPU [18.142879223260785]
本稿では,大規模グラフの埋め込み学習の課題に対処する,ハイブリッドCPU-GPUフレームワークを提案する。
我々のシステムは、単一のマシンの総メモリ容量より桁違いに大きいデータセットにトレーニングをスケールできることを示します。
論文 参考訳(メタデータ) (2021-10-13T19:09:33Z) - Temporal Graph Network Embedding with Causal Anonymous Walks
Representations [54.05212871508062]
本稿では,時間グラフネットワークに基づく動的ネットワーク表現学習のための新しいアプローチを提案する。
評価のために、時間的ネットワーク埋め込みの評価のためのベンチマークパイプラインを提供する。
欧州の大手銀行が提供した実世界のダウンストリームグラフ機械学習タスクにおいて、我々のモデルの適用性と優れた性能を示す。
論文 参考訳(メタデータ) (2021-08-19T15:39:52Z) - Not Half Bad: Exploring Half-Precision in Graph Convolutional Neural
Networks [8.460826851547294]
現代の機械学習を用いた効率的なグラフ解析は、ますます注目を集めている。
ディープラーニングアプローチは、隣接行列全体にわたって運用されることが多い。
実行時間とメモリ要求の両方を削減するための効率的な対策を特定することが望ましい。
論文 参考訳(メタデータ) (2020-10-23T19:47:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。