論文の概要: Graph Feature Preprocessor: Real-time Extraction of Subgraph-based
Features from Transaction Graphs
- arxiv url: http://arxiv.org/abs/2402.08593v1
- Date: Tue, 13 Feb 2024 16:53:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 14:27:41.303919
- Title: Graph Feature Preprocessor: Real-time Extraction of Subgraph-based
Features from Transaction Graphs
- Title(参考訳): グラフ特徴前処理:トランザクショングラフからのグラフベース特徴のリアルタイム抽出
- Authors: Jovan Blanu\v{s}a, Maximo Cravero Baraja, Andreea Anghel, Luc von
Niederh\"ausern, Erik Altman, Haris Pozidis and Kubilay Atasu
- Abstract要約: グラフ特徴前処理(Graph Feature Preprocessor)は、金融取引グラフにおける典型的なマネーロンダリングと不正パターンをリアルタイムで検出するソフトウェアライブラリである。
よりリッチなトランザクション機能により、勾配ブースティングに基づく機械学習モデルの予測精度が劇的に向上することを示す。
我々のソリューションは、標準的なグラフニューラルネットワークよりも、マイノリティークラスのF1スコアの高い不正なトランザクションを検出することができる。
- 参考スコア(独自算出の注目度): 2.2200563708464736
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present "Graph Feature Preprocessor", a software library
for detecting typical money laundering and fraud patterns in financial
transaction graphs in real time. These patterns are used to produce a rich set
of transaction features for downstream machine learning training and inference
tasks such as money laundering detection. We show that our enriched transaction
features dramatically improve the prediction accuracy of
gradient-boosting-based machine learning models. Our library exploits multicore
parallelism, maintains a dynamic in-memory graph, and efficiently mines
subgraph patterns in the incoming transaction stream, which enables it to be
operated in a streaming manner. We evaluate our library using highly-imbalanced
synthetic anti-money laundering (AML) and real-life Ethereum phishing datasets.
In these datasets, the proportion of illicit transactions is very small, which
makes the learning process challenging. Our solution, which combines our Graph
Feature Preprocessor and gradient-boosting-based machine learning models, is
able to detect these illicit transactions with higher minority-class F1 scores
than standard graph neural networks. In addition, the end-to-end throughput
rate of our solution executed on a multicore CPU outperforms the graph neural
network baselines executed on a powerful V100 GPU. Overall, the combination of
high accuracy, a high throughput rate, and low latency of our solution
demonstrates the practical value of our library in real-world applications.
Graph Feature Preprocessor has been integrated into IBM mainframe software
products, namely "IBM Cloud Pak for Data on Z" and "AI Toolkit for IBM Z and
LinuxONE".
- Abstract(参考訳): 本稿では,金融取引グラフにおける典型的なマネーロンダリングと不正行為パターンをリアルタイムに検出するソフトウェアライブラリであるGraph Feature Preprocessorを提案する。
これらのパターンは、下流の機械学習トレーニングとマネーロンダリング検出などの推論タスクのための豊富なトランザクション機能を生成するために使用される。
強化されたトランザクション機能は、勾配ブースティングベースの機械学習モデルの予測精度を劇的に向上させる。
ライブラリはマルチコア並列性を活用し,動的インメモリグラフを維持し,受信したトランザクションストリームのサブグラフパターンを効率的にマイニングすることで,ストリーミング操作を実現する。
我々は,高度不均衡な合成アンチマネーロンダリング(AML)と実生活Ethereumフィッシングデータセットを用いて図書館の評価を行った。
これらのデータセットでは、不正なトランザクションの割合が非常に小さく、学習プロセスが困難になる。
我々のソリューションはグラフ特徴前処理と勾配ブースティングに基づく機械学習モデルを組み合わせることで、これらの不正なトランザクションを標準グラフニューラルネットワークよりも高いマイノリティクラスF1スコアで検出することができる。
さらに、マルチコアCPU上で実行されるソリューションのエンドツーエンドスループット速度は、強力なV100 GPU上で実行されるグラフニューラルネットワークベースラインよりも優れています。
全体として、高い精度、高いスループット率、低レイテンシの組み合わせは、現実のアプリケーションにおける我々のライブラリの実用的価値を示しています。
Graph Feature PreprocessorはIBMのメインフレームソフトウェア製品、すなわち"IBM Cloud Pak for Data on Z"と"AI Toolkit for IBM Z and LinuxONE"に統合されている。
関連論文リスト
- CleanGraph: Human-in-the-loop Knowledge Graph Refinement and Completion [8.358365661172025]
CleanGraphは知識グラフの洗練と完成を容易にするために設計されたWebベースのツールである。
知識グラフは、高品質でエラーのない事実に基礎を置いている。
論文 参考訳(メタデータ) (2024-05-07T01:40:23Z) - The Shape of Money Laundering: Subgraph Representation Learning on the Blockchain with the Elliptic2 Dataset [6.209290101460395]
サブグラフ表現学習(Subgraph representation learning)は、複雑なネットワーク内の局所構造(または形状)を分析する技術である。
Bitcoinクラスタの122Kラベルのサブグラフを含むグラフデータセットであるElliptic2を紹介する。
このアプローチの即時的な実用価値と、暗号通貨における反マネーロンダリングと法医学的分析における新しい標準の可能性を見出す。
論文 参考訳(メタデータ) (2024-04-29T21:19:41Z) - Novel Representation Learning Technique using Graphs for Performance
Analytics [0.0]
本稿では,グラフニューラルネットワーク(GNN)技術の進歩を活用するために,パフォーマンスデータをグラフに変換する新しいアイデアを提案する。
ソーシャルネットワークのような他の機械学習アプリケーションドメインとは対照的に、グラフは提供されない。
我々は,GNNから生成された埋め込みの有効性を,単純なフィードフォワードニューラルネットワークによる回帰処理の性能評価に基づいて評価した。
論文 参考訳(メタデータ) (2024-01-19T16:34:37Z) - Graph Transformers for Large Graphs [57.19338459218758]
この研究は、モデルの特徴と重要な設計制約を識別することに焦点を当てた、単一の大規模グラフでの表現学習を前進させる。
この研究の重要な革新は、局所的な注意機構と組み合わされた高速な近傍サンプリング技術の作成である。
ogbn-products と snap-patents の3倍の高速化と16.8%の性能向上を報告し、ogbn-100M で LargeGT を5.9% の性能改善で拡張した。
論文 参考訳(メタデータ) (2023-12-18T11:19:23Z) - SimTeG: A Frustratingly Simple Approach Improves Textual Graph Learning [131.04781590452308]
テキストグラフ学習におけるフラストレーションに富んだアプローチであるSimTeGを提案する。
まず、下流タスクで予め訓練されたLM上で、教師付きパラメータ効率の微調整(PEFT)を行う。
次に、微調整されたLMの最後の隠れ状態を用いてノード埋め込みを生成する。
論文 参考訳(メタデータ) (2023-08-03T07:00:04Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Node Feature Extraction by Self-Supervised Multi-scale Neighborhood
Prediction [123.20238648121445]
我々は、新しい自己教師型学習フレームワーク、グラフ情報支援ノード機能exTraction (GIANT)を提案する。
GIANT は eXtreme Multi-label Classification (XMC) 形式を利用しており、これはグラフ情報に基づいた言語モデルの微調整に不可欠である。
我々は,Open Graph Benchmarkデータセット上での標準GNNパイプラインよりもGIANTの方が優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-29T19:55:12Z) - Scalable Graph Embedding LearningOn A Single GPU [18.142879223260785]
本稿では,大規模グラフの埋め込み学習の課題に対処する,ハイブリッドCPU-GPUフレームワークを提案する。
我々のシステムは、単一のマシンの総メモリ容量より桁違いに大きいデータセットにトレーニングをスケールできることを示します。
論文 参考訳(メタデータ) (2021-10-13T19:09:33Z) - Temporal Graph Network Embedding with Causal Anonymous Walks
Representations [54.05212871508062]
本稿では,時間グラフネットワークに基づく動的ネットワーク表現学習のための新しいアプローチを提案する。
評価のために、時間的ネットワーク埋め込みの評価のためのベンチマークパイプラインを提供する。
欧州の大手銀行が提供した実世界のダウンストリームグラフ機械学習タスクにおいて、我々のモデルの適用性と優れた性能を示す。
論文 参考訳(メタデータ) (2021-08-19T15:39:52Z) - GraphMI: Extracting Private Graph Data from Graph Neural Networks [59.05178231559796]
GNNを反転させてトレーニンググラフのプライベートグラフデータを抽出することを目的とした textbfGraph textbfModel textbfInversion attack (GraphMI) を提案する。
具体的には,グラフ特徴の空間性と滑らかさを保ちながら,グラフエッジの離散性に対処する勾配モジュールを提案する。
エッジ推論のためのグラフトポロジ、ノード属性、ターゲットモデルパラメータを効率的に活用するグラフ自動エンコーダモジュールを設計する。
論文 参考訳(メタデータ) (2021-06-05T07:07:52Z) - Not Half Bad: Exploring Half-Precision in Graph Convolutional Neural
Networks [8.460826851547294]
現代の機械学習を用いた効率的なグラフ解析は、ますます注目を集めている。
ディープラーニングアプローチは、隣接行列全体にわたって運用されることが多い。
実行時間とメモリ要求の両方を削減するための効率的な対策を特定することが望ましい。
論文 参考訳(メタデータ) (2020-10-23T19:47:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。