論文の概要: Full Bitcoin Blockchain Data Made Easy
- arxiv url: http://arxiv.org/abs/2106.08072v1
- Date: Tue, 15 Jun 2021 12:02:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-26 15:30:37.535352
- Title: Full Bitcoin Blockchain Data Made Easy
- Title(参考訳): Bitcoinブロックチェーンの完全なデータを簡単に
- Authors: Jules Azad Emery and Matthieu Latapy
- Abstract要約: 本稿では、完全なbitcoinブロックチェーンデータの収集と処理に焦点を当てる。
非常にベーシックで標準的なツールに依存しており、プロシージャは信頼性が高く、容易に再現できる。
これにより、データ全体を簡単に処理し、適切なサブセットを選択することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the fact that it is publicly available, collecting and processing the
full bitcoin blockchain data is not trivial. Its mere size, history, and other
features indeed raise quite specific challenges, that we address in this paper.
The strengths of our approach are the following: it relies on very basic and
standard tools, which makes the procedure reliable and easily reproducible; it
is a purely lossless procedure ensuring that we catch and preserve all existing
data; it provides additional indexing that makes it easy to further process the
whole data and select appropriate subsets of it. We present our procedure in
details and illustrate its added value on large-scale use cases, like address
clustering. We provide an implementation online, as well as the obtained
dataset.
- Abstract(参考訳): 公開されているにもかかわらず、完全なbitcoinブロックチェーンデータの収集と処理は簡単ではない。
サイズ、履歴、その他の機能は、実際には非常に特定の課題を生じさせます。
アプローチの長所は以下のとおりである。非常に基本的で標準的なツールに依存しており、プロシージャを信頼性と再現が容易にし、既存のすべてのデータを捕捉し保存することを保証する純粋に損失のないプロシージャであり、データ全体を処理し、適切なサブセットを選択するのが簡単になる追加のインデックスを提供する。
提案手法の詳細と,アドレスクラスタリングなどの大規模ユースケースにおける付加価値について述べる。
得られたデータセットと同様に、オンライン実装も提供します。
関連論文リスト
- Chainlet Orbits: Topological Address Embedding for the Bitcoin
Blockchain [15.099255988459602]
匿名性のある取引を可能にするBitcoinのような暗号通貨の台頭は、さまざまな不正行為の急増につながっている。
トランザクションにおけるそのトポロジ的特性を活用して,Bitcoinアドレスを埋め込む,Chainlet Orbitsという効果的なソリューションを導入する。
当社のアプローチでは,Bitcoinトランザクションネットワーク上で,解釈可能かつ説明可能なマシンラーニングモデルを,ほとんどの日において15分以内で使用することが可能です。
論文 参考訳(メタデータ) (2023-05-18T21:16:59Z) - Bag of Tricks for Training Data Extraction from Language Models [98.40637430115204]
公開データセットを用いてトレーニングデータ抽出を改善するための手法とベンチマーク手法について検討する。
実験結果から,これまで見過ごされていたいくつかのトリックが,トレーニングデータ抽出の成功に不可欠であることが示唆された。
論文 参考訳(メタデータ) (2023-02-09T06:46:42Z) - Efficient Online Reinforcement Learning with Offline Data [78.92501185886569]
オンライン学習時にオフラインデータを活用するために、既存のオフライン手法を単純に適用できることを示します。
私たちはこれらの設計選択を広範囲に改善し、パフォーマンスに最も影響を与える重要な要因を示します。
これらのシンプルなレコメンデーションの正しい適用によって、既存のアプローチよりも$mathbf2.5times$の改善が得られます。
論文 参考訳(メタデータ) (2023-02-06T17:30:22Z) - Smooth Anonymity for Sparse Binary Matrices [84.60886611165573]
この作業では、スパースデータセット全体を第三者とプライベートに操作し、共有することを目的としています。
実際、差分プライバシーは、プライバシの金の標準として現れていますが、スパースデータセットの共有に関しては、主要な結果の1つとして、偏微分プライベートメカニズムが極めて弱いプライバシ保証を持つ運命にあることを証明しています。
我々は、スムーズな$k$匿名性を示し、スムーズな$k$匿名性を提供する単純なアルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-07-13T17:09:25Z) - BABD: A Bitcoin Address Behavior Dataset for Address Behavior Pattern
Analysis [36.42552617883664]
私たちは、2019年7月12日から2021年5月26日までにBitcoin取引からなるデータセットを構築しました。
このデータセットには、13種類のBitcoinアドレス、148の機能を提供する5つのカテゴリ、ラベル付きデータ544,462が含まれている。
提案したデータセットは、k-nearest neighborsアルゴリズム、決定木、ランダムフォレスト、多層パーセプトロン、XGBoostといった一般的な機械学習モデルに基づく。
論文 参考訳(メタデータ) (2022-04-10T06:46:51Z) - Analysis of Arbitrary Content on Blockchain-Based Systems using BigQuery [0.0]
パブリックブロックチェーン上のコンテンツを素早く発見、分類するためのクラウドベースのアプローチを開発し、適用します。
当社の手法は,さまざまなブロックチェーンシステムに適用可能で,コンテンツ関連の使用パターンや乱用の可能性に関する洞察を提供する。
私たちの知る限りでは、ブロックチェーンに格納された非金融コンテンツを体系的に分析するのは、今回が初めてです。
論文 参考訳(メタデータ) (2022-03-17T15:12:38Z) - Optimal Data Selection: An Online Distributed View [61.31708750038692]
この問題のオンライン版と分散版のアルゴリズムを開発する。
ランダム選択法は, ランダム選択法よりも5~20%高い性能を示した。
ImageNet と MNIST の学習タスクにおいて、我々の選択方法はランダム選択よりも5-20% 高い性能を示した。
論文 参考訳(メタデータ) (2022-01-25T18:56:16Z) - Self-supervised Incremental Deep Graph Learning for Ethereum Phishing
Scam Detection [15.350215512903361]
グラフニューラルネットワーク(GNN)は、様々なノード分類タスクにおいて有望な性能を示している。
実世界の複雑なグラフに自然に抽象化できるトランザクションデータでは、ラベルの不足と大量のトランザクションデータがGNNの手法を利用するのを困難にしている。
フィッシング詐欺検出問題に対する自己教師付きインクリメンタルグラフ学習モデル(SIEGE)を提案する。
論文 参考訳(メタデータ) (2021-06-18T15:06:26Z) - Learning to Count in the Crowd from Limited Labeled Data [109.2954525909007]
我々は,限られた数のラベル付きサンプルから参加者を数えることを学ぶことで,アノテーションの努力を減らすことに重点を置いている。
具体的には,未ラベルデータに対する擬似地下真理推定を含むガウス過程に基づく反復学習機構を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:17:01Z) - Faster Secure Data Mining via Distributed Homomorphic Encryption [108.77460689459247]
ホモモルフィック暗号化(HE)は、最近、暗号化されたフィールド上で計算を行う能力により、ますます注目を集めている。
本稿では,スケーリング問題の解決に向けて,新しい分散HEベースのデータマイニングフレームワークを提案する。
各種データマイニングアルゴリズムとベンチマークデータセットを用いて,新しいフレームワークの有効性と有効性を検証する。
論文 参考訳(メタデータ) (2020-06-17T18:14:30Z) - Blockchain is Watching You: Profiling and Deanonymizing Ethereum Users [0.0]
擬似識別子に基づくユーザプロファイリング手法を提案し,実装する。
機密トランザクションオーバレイに適用可能な,Danaan-gift攻撃の変種である悪意のあるバリューフィンガープリント攻撃について述べる。
論文 参考訳(メタデータ) (2020-05-28T14:33:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。