論文の概要: Graph Feature Preprocessor: Real-time Extraction of Subgraph-based
Features from Transaction Graphs
- arxiv url: http://arxiv.org/abs/2402.08593v1
- Date: Tue, 13 Feb 2024 16:53:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 14:27:41.303919
- Title: Graph Feature Preprocessor: Real-time Extraction of Subgraph-based
Features from Transaction Graphs
- Title(参考訳): グラフ特徴前処理:トランザクショングラフからのグラフベース特徴のリアルタイム抽出
- Authors: Jovan Blanu\v{s}a, Maximo Cravero Baraja, Andreea Anghel, Luc von
Niederh\"ausern, Erik Altman, Haris Pozidis and Kubilay Atasu
- Abstract要約: グラフ特徴前処理(Graph Feature Preprocessor)は、金融取引グラフにおける典型的なマネーロンダリングと不正パターンをリアルタイムで検出するソフトウェアライブラリである。
よりリッチなトランザクション機能により、勾配ブースティングに基づく機械学習モデルの予測精度が劇的に向上することを示す。
我々のソリューションは、標準的なグラフニューラルネットワークよりも、マイノリティークラスのF1スコアの高い不正なトランザクションを検出することができる。
- 参考スコア(独自算出の注目度): 2.2200563708464736
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present "Graph Feature Preprocessor", a software library
for detecting typical money laundering and fraud patterns in financial
transaction graphs in real time. These patterns are used to produce a rich set
of transaction features for downstream machine learning training and inference
tasks such as money laundering detection. We show that our enriched transaction
features dramatically improve the prediction accuracy of
gradient-boosting-based machine learning models. Our library exploits multicore
parallelism, maintains a dynamic in-memory graph, and efficiently mines
subgraph patterns in the incoming transaction stream, which enables it to be
operated in a streaming manner. We evaluate our library using highly-imbalanced
synthetic anti-money laundering (AML) and real-life Ethereum phishing datasets.
In these datasets, the proportion of illicit transactions is very small, which
makes the learning process challenging. Our solution, which combines our Graph
Feature Preprocessor and gradient-boosting-based machine learning models, is
able to detect these illicit transactions with higher minority-class F1 scores
than standard graph neural networks. In addition, the end-to-end throughput
rate of our solution executed on a multicore CPU outperforms the graph neural
network baselines executed on a powerful V100 GPU. Overall, the combination of
high accuracy, a high throughput rate, and low latency of our solution
demonstrates the practical value of our library in real-world applications.
Graph Feature Preprocessor has been integrated into IBM mainframe software
products, namely "IBM Cloud Pak for Data on Z" and "AI Toolkit for IBM Z and
LinuxONE".
- Abstract(参考訳): 本稿では,金融取引グラフにおける典型的なマネーロンダリングと不正行為パターンをリアルタイムに検出するソフトウェアライブラリであるGraph Feature Preprocessorを提案する。
これらのパターンは、下流の機械学習トレーニングとマネーロンダリング検出などの推論タスクのための豊富なトランザクション機能を生成するために使用される。
強化されたトランザクション機能は、勾配ブースティングベースの機械学習モデルの予測精度を劇的に向上させる。
ライブラリはマルチコア並列性を活用し,動的インメモリグラフを維持し,受信したトランザクションストリームのサブグラフパターンを効率的にマイニングすることで,ストリーミング操作を実現する。
我々は,高度不均衡な合成アンチマネーロンダリング(AML)と実生活Ethereumフィッシングデータセットを用いて図書館の評価を行った。
これらのデータセットでは、不正なトランザクションの割合が非常に小さく、学習プロセスが困難になる。
我々のソリューションはグラフ特徴前処理と勾配ブースティングに基づく機械学習モデルを組み合わせることで、これらの不正なトランザクションを標準グラフニューラルネットワークよりも高いマイノリティクラスF1スコアで検出することができる。
さらに、マルチコアCPU上で実行されるソリューションのエンドツーエンドスループット速度は、強力なV100 GPU上で実行されるグラフニューラルネットワークベースラインよりも優れています。
全体として、高い精度、高いスループット率、低レイテンシの組み合わせは、現実のアプリケーションにおける我々のライブラリの実用的価値を示しています。
Graph Feature PreprocessorはIBMのメインフレームソフトウェア製品、すなわち"IBM Cloud Pak for Data on Z"と"AI Toolkit for IBM Z and LinuxONE"に統合されている。
関連論文リスト
- Identifying Money Laundering Subgraphs on the Blockchain [5.377744640870357]
反マネーロンダリングには、金融活動におけるマネーロンダリング犯罪の特定が含まれる。
最近の研究では、グラフベースの機械学習のレンズを通してAMLが進歩している。
RevTrackはグラフベースのフレームワークで、低コストで高精度な大規模AML分析を可能にする。
論文 参考訳(メタデータ) (2024-10-10T22:01:14Z) - The Shape of Money Laundering: Subgraph Representation Learning on the Blockchain with the Elliptic2 Dataset [6.209290101460395]
サブグラフ表現学習(Subgraph representation learning)は、複雑なネットワーク内の局所構造(または形状)を分析する技術である。
Bitcoinクラスタの122Kラベルのサブグラフを含むグラフデータセットであるElliptic2を紹介する。
このアプローチの即時的な実用価値と、暗号通貨における反マネーロンダリングと法医学的分析における新しい標準の可能性を見出す。
論文 参考訳(メタデータ) (2024-04-29T21:19:41Z) - Towards a Foundation Purchasing Model: Pretrained Generative
Autoregression on Transaction Sequences [0.0]
本稿では,金融取引の文脈的埋め込みを得るための生成事前学習手法を提案する。
さらに,510億の取引を含む180の発行銀行のデータコーパスを用いて,埋め込みモデルの大規模事前学習を行う。
論文 参考訳(メタデータ) (2024-01-03T09:32:48Z) - SimTeG: A Frustratingly Simple Approach Improves Textual Graph Learning [131.04781590452308]
テキストグラフ学習におけるフラストレーションに富んだアプローチであるSimTeGを提案する。
まず、下流タスクで予め訓練されたLM上で、教師付きパラメータ効率の微調整(PEFT)を行う。
次に、微調整されたLMの最後の隠れ状態を用いてノード埋め込みを生成する。
論文 参考訳(メタデータ) (2023-08-03T07:00:04Z) - MultiScale MeshGraphNets [65.26373813797409]
我々はMeshGraphNetsからフレームワークを改善するための2つの補完的なアプローチを提案する。
まず、より粗いメッシュ上で高解像度システムの正確なサロゲートダイナミクスを学習できることを実証する。
次に、2つの異なる解像度でメッセージを渡す階層的アプローチ(MultiScale MeshGraphNets)を導入する。
論文 参考訳(メタデータ) (2022-10-02T20:16:20Z) - Learning Graph Structure from Convolutional Mixtures [119.45320143101381]
本稿では、観測されたグラフと潜伏グラフのグラフ畳み込み関係を提案し、グラフ学習タスクをネットワーク逆(デコンボリューション)問題として定式化する。
固有分解に基づくスペクトル法の代わりに、近似勾配反復をアンロール・トランケートして、グラフデコンボリューションネットワーク(GDN)と呼ばれるパラメータ化ニューラルネットワークアーキテクチャに到達させる。
GDNは、教師付き方式でグラフの分布を学習し、損失関数を適応させることでリンク予測やエッジウェイト回帰タスクを実行し、本質的に帰納的である。
論文 参考訳(メタデータ) (2022-05-19T14:08:15Z) - Graph Kernel Neural Networks [53.91024360329517]
本稿では、グラフ上の内部積を計算するカーネル関数であるグラフカーネルを用いて、標準畳み込み演算子をグラフ領域に拡張することを提案する。
これにより、入力グラフの埋め込みを計算する必要のない完全に構造的なモデルを定義することができる。
私たちのアーキテクチャでは,任意の種類のグラフカーネルをプラグインすることが可能です。
論文 参考訳(メタデータ) (2021-12-14T14:48:08Z) - Temporal Graph Network Embedding with Causal Anonymous Walks
Representations [54.05212871508062]
本稿では,時間グラフネットワークに基づく動的ネットワーク表現学習のための新しいアプローチを提案する。
評価のために、時間的ネットワーク埋め込みの評価のためのベンチマークパイプラインを提供する。
欧州の大手銀行が提供した実世界のダウンストリームグラフ機械学習タスクにおいて、我々のモデルの適用性と優れた性能を示す。
論文 参考訳(メタデータ) (2021-08-19T15:39:52Z) - Binary Graph Neural Networks [69.51765073772226]
グラフニューラルネットワーク(gnns)は、不規則データに対する表現学習のための強力で柔軟なフレームワークとして登場した。
本稿では,グラフニューラルネットワークのバイナライゼーションのための異なる戦略を提示し,評価する。
モデルの慎重な設計とトレーニングプロセスの制御によって、バイナリグラフニューラルネットワークは、挑戦的なベンチマークの精度において、適度なコストでトレーニングできることを示しています。
論文 参考訳(メタデータ) (2020-12-31T18:48:58Z) - Not Half Bad: Exploring Half-Precision in Graph Convolutional Neural
Networks [8.460826851547294]
現代の機械学習を用いた効率的なグラフ解析は、ますます注目を集めている。
ディープラーニングアプローチは、隣接行列全体にわたって運用されることが多い。
実行時間とメモリ要求の両方を削減するための効率的な対策を特定することが望ましい。
論文 参考訳(メタデータ) (2020-10-23T19:47:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。