論文の概要: BABD: A Bitcoin Address Behavior Dataset for Address Behavior Pattern
Analysis
- arxiv url: http://arxiv.org/abs/2204.05746v1
- Date: Sun, 10 Apr 2022 06:46:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-13 14:36:19.917336
- Title: BABD: A Bitcoin Address Behavior Dataset for Address Behavior Pattern
Analysis
- Title(参考訳): BABD: アドレス行動パターン分析のためのBitcoinアドレス行動データセット
- Authors: Yuexin Xiang, Wei Ren, Hang Gao, Ding Bao, Yuchen Lei, Tiantian Li,
Qingqing Yang, Wenmao Liu, Tianqing Zhu, and Kim-Kwang Raymond Choo
- Abstract要約: 私たちは、2019年7月12日から2021年5月26日までにBitcoin取引からなるデータセットを構築しました。
このデータセットには、13種類のBitcoinアドレス、148の機能を提供する5つのカテゴリ、ラベル付きデータ544,462が含まれている。
提案したデータセットは、k-nearest neighborsアルゴリズム、決定木、ランダムフォレスト、多層パーセプトロン、XGBoostといった一般的な機械学習モデルに基づく。
- 参考スコア(独自算出の注目度): 36.42552617883664
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cryptocurrencies are no longer just the preferred option for cybercriminal
activities on darknets, due to the increasing adoption in mainstream
applications. This is partly due to the transparency associated with the
underpinning ledgers, where any individual can access the record of a
transaction record on the public ledger. In this paper, we build a dataset
comprising Bitcoin transactions between 12 July 2019 and 26 May 2021. This
dataset (hereafter referred to as BABD-13) contains 13 types of Bitcoin
addresses, 5 categories of indicators with 148 features, and 544,462 labeled
data. We then use our proposed dataset on common machine learning models,
namely: k-nearest neighbors algorithm, decision tree, random forest, multilayer
perceptron, and XGBoost. The results show that the accuracy rates of these
machine learning models on our proposed dataset are between 93.24% and 96.71%.
We also analyze the proposed features and their relationships from the
experiments, and propose a k-hop subgraph generation algorithm to extract a
k-hop subgraph from the entire Bitcoin transaction graph constructed by the
directed heterogeneous multigraph starting from a specific Bitcoin address node
(e.g., a known transaction associated with a criminal investigation).
- Abstract(参考訳): 暗号通貨はもはやダークネット上でのサイバー犯罪活動に好まれる選択肢ではない。
これは部分的には、公開台帳上のトランザクションレコードの記録にアクセス可能な、基盤となる台帳に関連する透明性によるものだ。
本稿では,2019年7月12日から2021年5月26日までにBitcoin取引からなるデータセットを構築した。
このデータセット(以下babd-13と呼ぶ)は、13種類のbitcoinアドレス、148の機能を持つ5つの指標、544,462のラベル付きデータを含んでいる。
次に、提案するデータセットを一般的な機械学習モデル、すなわちk-nearest neighborsアルゴリズム、決定木、ランダムフォレスト、多層パーセプトロン、xgboost上で使用する。
その結果,提案するデータセットにおける機械学習モデルの精度は93.24%から96.71%であった。
また、提案した特徴とそれらの関係を実験から分析し、特定のBitcoinアドレスノード(刑事捜査に関連する既知のトランザクションなど)から始まる有向不均一なマルチグラフによって構築されたBitcoinトランザクショングラフ全体からk-hopサブグラフを抽出するk-hopサブグラフ生成アルゴリズムを提案する。
関連論文リスト
- Bitcoin Research with a Transaction Graph Dataset [19.66391887460672]
本稿では,Bitcoinユーザ間の取引を表すトランザクショングラフとして,大規模なデータセットを提案する。
グラフには2億2200万のノードと7億8500万のエッジが含まれており、約13年間のトランザクションと6億7000万トランザクションのタイムスパンをカバーしている。
ノードラベルを予測するために、さまざまなグラフニューラルネットワークモデルをトレーニングし、将来の研究のベースラインを確立する。
論文 参考訳(メタデータ) (2024-11-15T16:28:03Z) - ORBITAAL: A Temporal Graph Dataset of Bitcoin Entity-Entity Transactions [0.0]
ORBITAALは、時間グラフ形式に基づく最初の包括的なデータセットである。
このデータセットは2009年1月から2021年1月までの全Bitcoin取引をカバーしている。
このデータセットは、グローバルなBTCバランスや関連するパブリックアドレスなどのエンティティの詳細も提供する。
論文 参考訳(メタデータ) (2024-08-26T09:48:45Z) - Transaction Fraud Detection via an Adaptive Graph Neural Network [64.9428588496749]
本稿では,アダプティブサンプリングとアグリゲーションに基づくグラフニューラルネットワーク(ASA-GNN)を提案する。
ノイズの多いノードをフィルタリングし、不正なノードを補うために、隣のサンプリング戦略を実行する。
3つのファイナンシャルデータセットの実験により,提案手法のASA-GNNは最先端のデータセットよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-07-11T07:48:39Z) - Demystifying Fraudulent Transactions and Illicit Nodes in the Bitcoin
Network for Financial Forensics [8.97719386315469]
本稿では,Bitcoinネットワークにおける不正検出に対する総合的な応用データサイエンス手法を提案する。
まず、Elliptic++データセットをコントリビュートし、Ellipticトランザクションデータセットを拡張して、822万のBitcoinウォレットアドレス(ノード)を含むようにします。
第2に、多様な機械学習アルゴリズムを用いて、4つのグラフすべてに対して不正検出タスクを実行する。
論文 参考訳(メタデータ) (2023-05-25T18:36:54Z) - Chainlet Orbits: Topological Address Embedding for the Bitcoin
Blockchain [15.099255988459602]
匿名性のある取引を可能にするBitcoinのような暗号通貨の台頭は、さまざまな不正行為の急増につながっている。
トランザクションにおけるそのトポロジ的特性を活用して,Bitcoinアドレスを埋め込む,Chainlet Orbitsという効果的なソリューションを導入する。
当社のアプローチでは,Bitcoinトランザクションネットワーク上で,解釈可能かつ説明可能なマシンラーニングモデルを,ほとんどの日において15分以内で使用することが可能です。
論文 参考訳(メタデータ) (2023-05-18T21:16:59Z) - Blockchain Large Language Models [65.7726590159576]
本稿では,異常なブロックチェーントランザクションを検出するための動的,リアルタイムなアプローチを提案する。
提案するツールであるBlockGPTは、ブロックチェーンアクティビティのトレース表現を生成し、大規模な言語モデルをスクラッチからトレーニングして、リアルタイム侵入検出システムとして機能させる。
論文 参考訳(メタデータ) (2023-04-25T11:56:18Z) - Demystifying Bitcoin Address Behavior via Graph Neural Networks [20.002509270755443]
BAClassifierは、行動に基づいて自動的にbitcoinアドレスを分類するツールである。
私たちは200万以上の現実世界のbitcoinアドレスからなる大規模な注釈付きデータセットを構築し、リリースします。
論文 参考訳(メタデータ) (2022-11-26T14:55:50Z) - Node Feature Extraction by Self-Supervised Multi-scale Neighborhood
Prediction [123.20238648121445]
我々は、新しい自己教師型学習フレームワーク、グラフ情報支援ノード機能exTraction (GIANT)を提案する。
GIANT は eXtreme Multi-label Classification (XMC) 形式を利用しており、これはグラフ情報に基づいた言語モデルの微調整に不可欠である。
我々は,Open Graph Benchmarkデータセット上での標準GNNパイプラインよりもGIANTの方が優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-29T19:55:12Z) - Comprehensive Graph-conditional Similarity Preserving Network for
Unsupervised Cross-modal Hashing [97.44152794234405]
教師なしクロスモーダルハッシュ(UCMH)は近年ホットトピックとなっている。
本稿では,dgcpn(deep graph-neighbor coherence preservation network)を考案する。
DGCPNは3種類のデータ類似性を利用して、損失を保存する包括的な類似性を管理する。
論文 参考訳(メタデータ) (2020-12-25T07:40:59Z) - Inverse Graph Identification: Can We Identify Node Labels Given Graph
Labels? [89.13567439679709]
グラフ識別(GI)は、グラフ学習において長い間研究されており、特定の応用において不可欠である。
本稿では,逆グラフ識別(Inverse Graph Identification, IGI)と呼ばれる新しい問題を定義する。
本稿では,グラフアテンションネットワーク(GAT)を用いたノードレベルのメッセージパッシング処理を,GIのプロトコルの下でシンプルかつ効果的に行う方法を提案する。
論文 参考訳(メタデータ) (2020-07-12T12:06:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。