Fugu-MT 論文翻訳(概要): A Public Dataset For the ZKsync Rollup

論文の概要: A Public Dataset For the ZKsync Rollup

arxiv url: http://arxiv.org/abs/2407.18699v1
Date: Fri, 26 Jul 2024 12:27:39 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-29 13:30:50.924587
Title: A Public Dataset For the ZKsync Rollup
Title（参考訳）: ZKsyncの公開データセット
Authors: Maria Inês Silva, Johnnatan Messias, Benjamin Livshits,
Abstract要約: 我々は,ZKsyncのアーカイブノードから抽出した1年間のアクティビティから得られたデータセットをキュレートし,外部関係者に自由に利用できるようにした。本稿では、このデータセットの詳細と、どのように作成されたかを説明し、それを用いて実行可能ないくつかの分析例を示し、今後の研究方向性について論じる。
参考スコア（独自算出の注目度）: 9.552930501118068
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Despite blockchain data being publicly available, practical challenges and high costs often hinder its effective use by researchers, thus limiting data-driven research and exploration in the blockchain space. This is especially true when it comes to Layer~2 (L2) ecosystems, and ZKsync, in particular. To address these issues, we have curated a dataset from 1 year of activity extracted from a ZKsync Era archive node and made it freely available to external parties. In this paper, we provide details on this dataset and how it was created, showcase a few example analyses that can be performed with it, and discuss some future research directions. We also publish and share the code used in our analysis on GitHub to promote reproducibility and to support further research.
Abstract（参考訳）: ブロックチェーンデータが公開されているにもかかわらず、実践的な課題と高いコストが研究者の効果的な使用を妨げることが少なくないため、ブロックチェーン分野におけるデータ駆動リサーチと探索が制限される。これはLayer~2(L2)エコシステム、特にZKsyncに関しては特に当てはまります。これらの問題に対処するため、ZKsyncのアーカイブノードから抽出した1年間のアクティビティからデータセットをキュレートし、外部のパーティで自由に利用できるようにしました。本稿では、このデータセットの詳細と、どのように作成されたかを説明し、それを用いて実行可能ないくつかの分析例を示し、今後の研究方向性について論じる。また、再現性を促進し、さらなる研究をサポートするためにGitHubで分析に使用されたコードを公開し、共有しています。

関連論文リスト

A Scientific Data Integrity system based on Blockchain [36.94429692322632]
このような分散リポジトリ上でデータ完全性を検証するために,研究グループを支援する新しい手法を提案する。提案では,1)データ管理へのセキュアなアクセス,2)データの整合性の検証,3)同じ堅牢な整合性ポリシを備えたデータセットに新たなレコードを追加する簡単な方法,などが保証されている。
論文参考訳（メタデータ） (2026-01-19T22:09:52Z)
LinkXplore: A Framework for Affordable High-Quality Blockchain Data [1.3537117504260623]
LinkXploreは、オンチェーンデータの収集と管理のための最初のオープンフレームワークである。これにより、RPCクエリやストリームから直接生データを解析することで、コストのかかるブロックチェーンデータプロバイダをバイパスすることができる。これにより、限られた予算を持つ研究者と開発者の両方にとって、現実的な代替手段となる。
論文参考訳（メタデータ） (2025-11-17T12:56:07Z)
Decoding TRON: A Comprehensive Framework for Large-Scale Blockchain Data Extraction and Exploration [12.959008314269825]
本稿では,TRONブロックチェーンのための包括的データ抽出・探索フレームワークを提案する。革新的なハイパフォーマンスシステムは、ブロック、トランザクション、スマートコントラクト、レシートを含むTRONから生のオンチェーンデータを効率的に抽出することを目的としている。抽出したデータセットの詳細な分析では、TRONのブロック生成、トランザクションのトレンド、取引の優位性、リソースデリゲート市場、スマートコントラクトの利用パターン、USDTスタンプコインの中心的な役割に関する洞察が明らかになった。
論文参考訳（メタデータ） (2025-09-19T15:07:10Z)
XChainDataGen: A Cross-Chain Dataset Generation Framework [6.139772633069047]
本稿では,ブロックチェーンからクロスチェーンデータを抽出し,クロスチェーントランザクション(cctx)のデータセットを生成するツールであるXChainDataGenを提案する。 XChainDataGenを使用して、2024年の最後の7ヶ月で11のブロックチェーン上にデプロイされた5つのクロスチェーンプロトコルから、35GB以上のデータを抽出しました。クロスチェーントークン転送で28億米ドル以上を移動した11,285,753個のcctxを同定した。
論文参考訳（メタデータ） (2025-03-17T18:39:43Z)
Labeled Datasets for Research on Information Operations [71.34999856621306]
ソーシャルメディアプラットフォームによって検証されたIOポストと、同様のトピックを同じ時間フレーム(制御データ)で議論した303kアカウントによる1300万以上の投稿の両方を含む、26のキャンペーンに関するラベル付きデータセットを新たに提示する。データセットは、さまざまなキャンペーンや国で調整されたアカウントによって使用される物語、ネットワークインタラクション、エンゲージメント戦略の研究を促進する。
論文参考訳（メタデータ） (2024-11-15T22:15:01Z)
SEART Data Hub: Streamlining Large-Scale Source Code Mining and Pre-Processing [13.717170962455526]
私たちはSEART Data HubというWebアプリケーションを紹介します。これは、公開GitHubリポジトリからマイニングされたコードを特徴とする大規模データセットを簡単に構築し、事前処理できるWebアプリケーションです。簡単なWebインターフェースを通じて、研究者はマイニング基準と、実行したい特定の前処理ステップを指定できる。リクエストを提出すると、ユーザは数時間以内に、必要なデータセットのダウンロードリンク付きのメールを受け取る。
論文参考訳（メタデータ） (2024-09-27T11:42:19Z)
SOK: Blockchain for Provenance [0.0]
Provenanceは、データ生成から操作まで追跡するので、データの整合性、信頼性、信頼性を確保するには不可欠だ。証明技術は、その分散的で透明で不変な性質のために、証明を実装するための一般的な選択肢となっている。ブロックチェーン設計に関する多くの研究は、特に証明に特化しており、この分野に特化している。
論文参考訳（メタデータ） (2024-07-25T01:46:49Z)
CC-GPX: Extracting High-Quality Annotated Geospatial Data from Common Crawl [0.07499722271664144]
Common Crawl (CC) コーパスは2008年以来9.5ペタバイト以上のデータを含む最大のオープンウェブクローリングデータセットである。本稿では,CC内のGPXファイルから注釈付きユーザ生成トラックを抽出する効率的なパイプラインを提案する。得られたマルチモーダルデータセットには、人間による記述の1,416ペアと、最新のCCリリース6つのMultiLineStringベクターデータが含まれている。
論文参考訳（メタデータ） (2024-05-17T18:31:26Z)
Electric Vehicle Enquiry (EVE) Pilot [0.0]
このデータセットは、3年間のルノー動物園の利用データをカバーしている。データセットの収集プロセス、その処理、および含むすべての変数の記述について詳述する。
論文参考訳（メタデータ） (2024-03-05T08:32:21Z)
LaDe: The First Comprehensive Last-mile Delivery Dataset from Industry [44.573471568516915]
LaDeは、業界から数百万のパッケージを備えた、最初の公開ラストマイルデリバリデータセットである。実際の運用期間は6ヶ月で、21kクーリエの10万パッケージが対象だ。 LaDeには3つの特徴がある。
論文参考訳（メタデータ） (2023-06-19T02:30:28Z)
LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文参考訳（メタデータ） (2023-06-14T05:48:36Z)
Blockchain-Empowered Trustworthy Data Sharing: Fundamentals, Applications, and Challenges [32.33334974604895]
さまざまなデータ共有プラットフォームが出現し、オープンデータに対する公的な需要が高まり、特定のデータをオープンにすることを義務付ける法律が制定されている。これらのプラットフォームの多くは不透明なままであり、データの正確性、証明と系統、プライバシーへの影響、同意管理、データプロバイダに対する公正なインセンティブの欠如など、多くの疑問につながります。透明性、不変性、非監査性、分散化プロパティによって、ブロックチェーンはこれらの質問に答えて、データ共有プラットフォームへの信頼を高めることができなくなりました。
論文参考訳（メタデータ） (2023-03-12T02:56:52Z)
Synthcity: facilitating innovative use cases of synthetic data in different data modalities [86.52703093858631]
Synthcityは、MLフェアネス、プライバシ、拡張における合成データの革新的なユースケースのための、オープンソースのソフトウェアパッケージである。 Synthcityは、実践者に対して、合成データにおける最先端の研究とツールへの単一のアクセスポイントを提供する。
論文参考訳（メタデータ） (2023-01-18T14:49:54Z)
The Problem of Zombie Datasets:A Framework For Deprecating Datasets [55.878249096379804]
我々は、ImageNet、8000 Million Tiny Images、MS-Celeb-1M、Duke MTMC、Brainwash、HRT Transgenderなど、いくつかの著名なデータセットの公開後処理について検討する。本稿では,リスクの考慮,影響の緩和,アピール機構,タイムライン,非推奨プロトコル,公開チェックなどを含むデータセットの非推奨化フレームワークを提案する。
論文参考訳（メタデータ） (2021-10-18T20:13:51Z)
Datasets: A Community Library for Natural Language Processing [55.48866401721244]
データセットは、現代のNLPのためのコミュニティライブラリである。このライブラリには650以上のユニークなデータセットが含まれており、250以上のコントリビュータを抱えており、さまざまな新しいクロスデータセット研究プロジェクトを支援している。
論文参考訳（メタデータ） (2021-09-07T03:59:22Z)
Retiring Adult: New Datasets for Fair Machine Learning [47.27417042497261]
UCIアダルトは、多くのアルゴリズム的公正な介入の開発と比較の基礎として機能している。 UCIアダルトデータのスーパーセットを米国国勢調査資料から再構築し、その外部妥当性を制限するUCIアダルトデータセットの慣用性を明らかにする。私たちの主な貢献は、公正な機械学習の研究のために既存のデータエコシステムを拡張する、一連の新しいデータセットです。
論文参考訳（メタデータ） (2021-08-10T19:19:41Z)
Rapidly Bootstrapping a Question Answering Dataset for COVID-19 [88.86456834766288]
我々は、新型コロナウイルスに特化して設計された質問応答データセットの始まりであるCovidQAを紹介する。これは、そのタイプの最初の公開リソースであり、より実質的な評価資源が利用可能になるまで研究を導くためのストップギャップとして意図されている。
論文参考訳（メタデータ） (2020-04-23T17:35:11Z)
NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting and Localization [101.13851473792334]
我々は,5,109枚の画像からなる大規模集束群集NWPU-Crowdを構築し,合計2,133,375個の点と箱を付加したアノテートヘッドを構築した。他の実世界のデータセットと比較すると、様々な照明シーンを含み、最大密度範囲 (020,033) を持つ。本稿では,データ特性について述べるとともに,主要なSOTA(State-of-the-art)手法の性能を評価し,新たなデータに生じる問題を分析する。
論文参考訳（メタデータ） (2020-01-10T09:26:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。