論文の概要: KGBERT4Eth: A Feature-Complete Transformer Powered by Knowledge Graph for Multi-Task Ethereum Fraud Detection
- arxiv url: http://arxiv.org/abs/2509.03860v1
- Date: Thu, 04 Sep 2025 03:38:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:10.041814
- Title: KGBERT4Eth: A Feature-Complete Transformer Powered by Knowledge Graph for Multi-Task Ethereum Fraud Detection
- Title(参考訳): KGBERT4Eth:マルチタスクEthereumフラッド検出のための知識グラフによる特徴補完変換器
- Authors: Yifan Jia, Ye Tian, Liguo Zhang, Yanbin Wang, Jianguo Sun, Liangliang Song,
- Abstract要約: KGBERT4Ethは、トランザクションセマンティックスとトランザクション知識グラフを組み合わせた、機能の完全な事前トレーニングエンコーダである。
両コンポーネントの事前学習目標を最適化して,これらの補完機能を融合し,機能完備な埋め込みを生成する。
KGBERT4Ethは、フィッシングアカウントの検出と匿名化タスクの両方において、最先端のベースラインを大幅に上回る。
- 参考スコア(独自算出の注目度): 14.186303004456205
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ethereum's rapid ecosystem expansion and transaction anonymity have triggered a surge in malicious activity. Detection mechanisms currently bifurcate into three technical strands: expert-defined features, graph embeddings, and sequential transaction patterns, collectively spanning the complete feature sets of Ethereum's native data layer. Yet the absence of cross-paradigm integration mechanisms forces practitioners to choose between sacrificing sequential context awareness, structured fund-flow patterns, or human-curated feature insights in their solutions. To bridge this gap, we propose KGBERT4Eth, a feature-complete pre-training encoder that synergistically combines two key components: (1) a Transaction Semantic Extractor, where we train an enhanced Transaction Language Model (TLM) to learn contextual semantic representations from conceptualized transaction records, and (2) a Transaction Knowledge Graph (TKG) that incorporates expert-curated domain knowledge into graph node embeddings to capture fund flow patterns and human-curated feature insights. We jointly optimize pre-training objectives for both components to fuse these complementary features, generating feature-complete embeddings. To emphasize rare anomalous transactions, we design a biased masking prediction task for TLM to focus on statistical outliers, while the Transaction TKG employs link prediction to learn latent transaction relationships and aggregate knowledge. Furthermore, we propose a mask-invariant attention coordination module to ensure stable dynamic information exchange between TLM and TKG during pre-training. KGBERT4Eth significantly outperforms state-of-the-art baselines in both phishing account detection and de-anonymization tasks, achieving absolute F1-score improvements of 8-16% on three phishing detection benchmarks and 6-26% on four de-anonymization datasets.
- Abstract(参考訳): Ethereumの急激なエコシステム拡大とトランザクション匿名性は、悪意ある活動の急増を引き起こしている。
現在、検出メカニズムは、専門家定義機能、グラフ埋め込み、シーケンシャルトランザクションパターンの3つの技術的ストランドに分岐し、Ethereumのネイティブデータ層の完全な機能セットを集約している。
しかし、パラダイム間の統合メカニズムがないため、実践者は、シーケンシャルなコンテキスト認識、構造化された資金フローパターン、あるいはソリューションにおける人為的な特徴洞察を犠牲にするかを選択せざるを得ない。
このギャップを埋めるために、我々は、(1)トランザクションセマンティックエクストラクタを訓練し、概念化されたトランザクションレコードからコンテキスト意味表現を学習する拡張トランザクション言語モデル(TLM)、(2)専門家が作成したドメイン知識をグラフノード埋め込みに組み込んだトランザクション知識グラフ(TKG)という、2つの重要なコンポーネントを相乗的に組み合わせた機能完全事前学習エンコーダKGBERT4Ethを提案する。
両コンポーネントの事前学習目標を共同で最適化して,これらの補完機能を融合し,機能完備な埋め込みを生成する。
稀な異常なトランザクションを強調するために、トランザクションTKGは遅延トランザクション関係と集約知識を学習するためにリンク予測を採用する一方、TLMは統計的外れ値にフォーカスするためにバイアス付きマスキング予測タスクを設計する。
さらに,事前学習中にTLMとTKGの動的情報交換を安定的に行うために,マスク不変のアテンション調整モジュールを提案する。
KGBERT4Ethは、フィッシングアカウントの検出と匿名化タスクの両方で最先端のベースラインを著しく上回り、3つのフィッシング検出ベンチマークで8-16%、匿名化データセットで6-26%の絶対的なF1スコアの改善を達成した。
関連論文リスト
- LMAE4Eth: Generalizable and Robust Ethereum Fraud Detection by Exploring Transaction Semantics and Masked Graph Embedding [10.923718297125754]
LMAE4Ethは、トランザクションセマンティクス、マスキンググラフの埋め込み、専門家の知識を融合する多視点学習フレームワークである。
まず、文脈に依存しない数値トランザクションレコードを結合型言語表現に変換するトランザクション型コントラスト言語モデル(TxCLM)を提案する。
次に、生成自己教師付き学習を用いたマスク付きアカウントグラフオートエンコーダ(MAGAE)を提案する。
論文 参考訳(メタデータ) (2025-09-04T06:56:32Z) - Dynamic Feature Fusion: Combining Global Graph Structures and Local Semantics for Blockchain Fraud Detection [0.7510165488300369]
本稿では,グラフに基づく表現学習と意味的特徴抽出を組み合わせた動的特徴融合モデルを提案する。
我々は,グラフ構築,時間的特徴強調,テキスト前処理を含む包括的データ処理パイプラインを開発する。
大規模な実世界のブロックチェーンデータセットの実験結果は、我々の手法が既存のベンチマークを精度、F1スコア、リコールメトリクスで上回っていることを示している。
論文 参考訳(メタデータ) (2025-01-03T09:04:43Z) - Ethereum Fraud Detection via Joint Transaction Language Model and Graph Representation Learning [6.378807038086552]
現在の不正検出方法は、トランザクション内の意味情報や類似性パターンを考慮できない。
本稿では,トランザクション言語モデルとグラフベースの手法を組み合わせたTLMG4Ethを提案する。
論文 参考訳(メタデータ) (2024-09-09T07:13:44Z) - Facilitating Feature and Topology Lightweighting: An Ethereum Transaction Graph Compression Method for Malicious Account Detection [3.877894934465948]
Bitcoinは暗号通貨の主要なグローバルプラットフォームの一つとなり、金融エコシステムの多様化を促進する上で重要な役割を果たしている。
従来の規制手法は通常、機能エンジニアリングや大規模トランザクショングラフマイニングを通じて悪意のあるアカウントを検出する。
本稿では,TGC4Ethというトランザクショングラフ圧縮手法を提案する。
論文 参考訳(メタデータ) (2024-05-14T02:21:20Z) - UGMAE: A Unified Framework for Graph Masked Autoencoders [67.75493040186859]
グラフマスク付きオートエンコーダのための統一フレームワークであるUGMAEを提案する。
まず,ノードの特異性を考慮した適応型特徴マスク生成器を開発した。
次に,階層型構造再構成と特徴再構成を併用し,総合的なグラフ情報を取得する。
論文 参考訳(メタデータ) (2024-02-12T19:39:26Z) - Cross-modal Orthogonal High-rank Augmentation for RGB-Event
Transformer-trackers [58.802352477207094]
本研究では,2つのモード間の分布ギャップを埋めるために,事前学習された視覚変換器(ViT)の潜在可能性を探る。
本研究では,いくつかのトークンの特定のモダリティをランダムにマスキングし,異なるモダリティのトークン間の相互作用を積極的に行うマスクモデリング戦略を提案する。
実験により,我々のプラグアンドプレイトレーニング強化技術は,追跡精度と成功率の両方の観点から,最先端のワンストリームと2つのトラッカーストリームを大幅に向上させることができることが示された。
論文 参考訳(メタデータ) (2023-07-09T08:58:47Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。