論文の概要: A Public Dataset For the ZKsync Rollup
- arxiv url: http://arxiv.org/abs/2407.18699v1
- Date: Fri, 26 Jul 2024 12:27:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-29 13:30:50.924587
- Title: A Public Dataset For the ZKsync Rollup
- Title(参考訳): ZKsyncの公開データセット
- Authors: Maria Inês Silva, Johnnatan Messias, Benjamin Livshits,
- Abstract要約: 我々は,ZKsyncのアーカイブノードから抽出した1年間のアクティビティから得られたデータセットをキュレートし,外部関係者に自由に利用できるようにした。
本稿では、このデータセットの詳細と、どのように作成されたかを説明し、それを用いて実行可能ないくつかの分析例を示し、今後の研究方向性について論じる。
- 参考スコア(独自算出の注目度): 9.552930501118068
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite blockchain data being publicly available, practical challenges and high costs often hinder its effective use by researchers, thus limiting data-driven research and exploration in the blockchain space. This is especially true when it comes to Layer~2 (L2) ecosystems, and ZKsync, in particular. To address these issues, we have curated a dataset from 1 year of activity extracted from a ZKsync Era archive node and made it freely available to external parties. In this paper, we provide details on this dataset and how it was created, showcase a few example analyses that can be performed with it, and discuss some future research directions. We also publish and share the code used in our analysis on GitHub to promote reproducibility and to support further research.
- Abstract(参考訳): ブロックチェーンデータが公開されているにもかかわらず、実践的な課題と高いコストが研究者の効果的な使用を妨げることが少なくないため、ブロックチェーン分野におけるデータ駆動リサーチと探索が制限される。
これはLayer~2(L2)エコシステム、特にZKsyncに関しては特に当てはまります。
これらの問題に対処するため、ZKsyncのアーカイブノードから抽出した1年間のアクティビティからデータセットをキュレートし、外部のパーティで自由に利用できるようにしました。
本稿では、このデータセットの詳細と、どのように作成されたかを説明し、それを用いて実行可能ないくつかの分析例を示し、今後の研究方向性について論じる。
また、再現性を促進し、さらなる研究をサポートするためにGitHubで分析に使用されたコードを公開し、共有しています。
関連論文リスト
- Labeled Datasets for Research on Information Operations [71.34999856621306]
ソーシャルメディアプラットフォームによって検証されたIOポストと、同様のトピックを同じ時間フレーム(制御データ)で議論した303kアカウントによる1300万以上の投稿の両方を含む、26のキャンペーンに関するラベル付きデータセットを新たに提示する。
データセットは、さまざまなキャンペーンや国で調整されたアカウントによって使用される物語、ネットワークインタラクション、エンゲージメント戦略の研究を促進する。
論文 参考訳(メタデータ) (2024-11-15T22:15:01Z) - SEART Data Hub: Streamlining Large-Scale Source Code Mining and Pre-Processing [13.717170962455526]
私たちはSEART Data HubというWebアプリケーションを紹介します。これは、公開GitHubリポジトリからマイニングされたコードを特徴とする大規模データセットを簡単に構築し、事前処理できるWebアプリケーションです。
簡単なWebインターフェースを通じて、研究者はマイニング基準と、実行したい特定の前処理ステップを指定できる。
リクエストを提出すると、ユーザは数時間以内に、必要なデータセットのダウンロードリンク付きのメールを受け取る。
論文 参考訳(メタデータ) (2024-09-27T11:42:19Z) - SOK: Blockchain for Provenance [0.0]
Provenanceは、データ生成から操作まで追跡するので、データの整合性、信頼性、信頼性を確保するには不可欠だ。
証明技術は、その分散的で透明で不変な性質のために、証明を実装するための一般的な選択肢となっている。
ブロックチェーン設計に関する多くの研究は、特に証明に特化しており、この分野に特化している。
論文 参考訳(メタデータ) (2024-07-25T01:46:49Z) - CC-GPX: Extracting High-Quality Annotated Geospatial Data from Common Crawl [0.07499722271664144]
Common Crawl (CC) コーパスは2008年以来9.5ペタバイト以上のデータを含む最大のオープンウェブクローリングデータセットである。
本稿では,CC内のGPXファイルから注釈付きユーザ生成トラックを抽出する効率的なパイプラインを提案する。
得られたマルチモーダルデータセットには、人間による記述の1,416ペアと、最新のCCリリース6つのMultiLineStringベクターデータが含まれている。
論文 参考訳(メタデータ) (2024-05-17T18:31:26Z) - LaDe: The First Comprehensive Last-mile Delivery Dataset from Industry [44.573471568516915]
LaDeは、業界から数百万のパッケージを備えた、最初の公開ラストマイルデリバリデータセットである。
実際の運用期間は6ヶ月で、21kクーリエの10万パッケージが対象だ。
LaDeには3つの特徴がある。
論文 参考訳(メタデータ) (2023-06-19T02:30:28Z) - Blockchain-Empowered Trustworthy Data Sharing: Fundamentals,
Applications, and Challenges [32.33334974604895]
さまざまなデータ共有プラットフォームが出現し、オープンデータに対する公的な需要が高まり、特定のデータをオープンにすることを義務付ける法律が制定されている。
これらのプラットフォームの多くは不透明なままであり、データの正確性、証明と系統、プライバシーへの影響、同意管理、データプロバイダに対する公正なインセンティブの欠如など、多くの疑問につながります。
透明性、不変性、非監査性、分散化プロパティによって、ブロックチェーンはこれらの質問に答えて、データ共有プラットフォームへの信頼を高めることができなくなりました。
論文 参考訳(メタデータ) (2023-03-12T02:56:52Z) - Synthcity: facilitating innovative use cases of synthetic data in
different data modalities [86.52703093858631]
Synthcityは、MLフェアネス、プライバシ、拡張における合成データの革新的なユースケースのための、オープンソースのソフトウェアパッケージである。
Synthcityは、実践者に対して、合成データにおける最先端の研究とツールへの単一のアクセスポイントを提供する。
論文 参考訳(メタデータ) (2023-01-18T14:49:54Z) - The Problem of Zombie Datasets:A Framework For Deprecating Datasets [55.878249096379804]
我々は、ImageNet、8000 Million Tiny Images、MS-Celeb-1M、Duke MTMC、Brainwash、HRT Transgenderなど、いくつかの著名なデータセットの公開後処理について検討する。
本稿では,リスクの考慮,影響の緩和,アピール機構,タイムライン,非推奨プロトコル,公開チェックなどを含むデータセットの非推奨化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-18T20:13:51Z) - Datasets: A Community Library for Natural Language Processing [55.48866401721244]
データセットは、現代のNLPのためのコミュニティライブラリである。
このライブラリには650以上のユニークなデータセットが含まれており、250以上のコントリビュータを抱えており、さまざまな新しいクロスデータセット研究プロジェクトを支援している。
論文 参考訳(メタデータ) (2021-09-07T03:59:22Z) - Rapidly Bootstrapping a Question Answering Dataset for COVID-19 [88.86456834766288]
我々は、新型コロナウイルスに特化して設計された質問応答データセットの始まりであるCovidQAを紹介する。
これは、そのタイプの最初の公開リソースであり、より実質的な評価資源が利用可能になるまで研究を導くためのストップギャップとして意図されている。
論文 参考訳(メタデータ) (2020-04-23T17:35:11Z) - NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting and Localization [101.13851473792334]
我々は,5,109枚の画像からなる大規模集束群集NWPU-Crowdを構築し,合計2,133,375個の点と箱を付加したアノテートヘッドを構築した。
他の実世界のデータセットと比較すると、様々な照明シーンを含み、最大密度範囲 (020,033) を持つ。
本稿では,データ特性について述べるとともに,主要なSOTA(State-of-the-art)手法の性能を評価し,新たなデータに生じる問題を分析する。
論文 参考訳(メタデータ) (2020-01-10T09:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。