論文の概要: DISL: Fueling Research with A Large Dataset of Solidity Smart Contracts
- arxiv url: http://arxiv.org/abs/2403.16861v2
- Date: Tue, 26 Mar 2024 07:56:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-27 20:44:21.778562
- Title: DISL: Fueling Research with A Large Dataset of Solidity Smart Contracts
- Title(参考訳): DISL: 固体スマートコントラクトの大規模データセットによる燃料研究
- Authors: Gabriele Morello, Mojtaba Eshghie, Sofia Bobadilla, Martin Monperrus,
- Abstract要約: DISLデータセットには、メインネットにデプロイされた514,506ドルのユニークなSolidityファイルのコレクションが含まれている。
現実世界のスマートコントラクトの大規模で多様なデータセットの必要性に対処する。
- 参考スコア(独自算出の注目度): 8.242194776558897
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The DISL dataset features a collection of $514,506$ unique Solidity files that have been deployed to Ethereum mainnet. It caters to the need for a large and diverse dataset of real-world smart contracts. DISL serves as a resource for developing machine learning systems and for benchmarking software engineering tools designed for smart contracts. By aggregating every verified smart contract from Etherscan up to January 15, 2024, DISL surpasses existing datasets in size and recency.
- Abstract(参考訳): DISLデータセットには、Ethereumメインネットにデプロイされた514,506ドルのユニークなSolidityファイルのコレクションが含まれている。
現実世界のスマートコントラクトの大規模で多様なデータセットの必要性に対処する。
DISLは、機械学習システムの開発や、スマートコントラクト用に設計されたソフトウェアエンジニアリングツールのベンチマークのためのリソースとして機能する。
2024年1月15日までにEtherscanから認証されたすべてのスマートコントラクトを集約することで、DECは既存のデータセットをサイズと正確性で上回る。
関連論文リスト
- SEART Data Hub: Streamlining Large-Scale Source Code Mining and Pre-Processing [13.717170962455526]
私たちはSEART Data HubというWebアプリケーションを紹介します。これは、公開GitHubリポジトリからマイニングされたコードを特徴とする大規模データセットを簡単に構築し、事前処理できるWebアプリケーションです。
簡単なWebインターフェースを通じて、研究者はマイニング基準と、実行したい特定の前処理ステップを指定できる。
リクエストを提出すると、ユーザは数時間以内に、必要なデータセットのダウンロードリンク付きのメールを受け取る。
論文 参考訳(メタデータ) (2024-09-27T11:42:19Z) - Towards Robust Speech Representation Learning for Thousands of Languages [77.2890285555615]
自己教師付き学習(SSL)は、ラベル付きデータの必要性を減らすことで、音声技術をより多くの言語に拡張するのに役立つ。
我々は4057言語にまたがる100万時間以上のデータに基づいて訓練された、ユニバーサル音声のための言語横断言語であるXEUSを提案する。
論文 参考訳(メタデータ) (2024-06-30T21:40:26Z) - Vulnerability Scanners for Ethereum Smart Contracts: A Large-Scale Study [44.25093111430751]
2023年だけでも、そのような脆弱性は数十億ドルを超える巨額の損失をもたらした。
スマートコントラクトの脆弱性を検出し、軽減するために、さまざまなツールが開発されている。
本研究では,既存のセキュリティスキャナの有効性と,現在も継続している脆弱性とのギャップについて検討する。
論文 参考訳(メタデータ) (2023-12-27T11:26:26Z) - Joint Prediction and Denoising for Large-scale Multilingual
Self-supervised Learning [69.77973092264338]
我々は、より強力な技術がより効率的な事前トレーニングをもたらし、SSLをより多くの研究グループに開放することを示します。
我々は,WavLMのジョイント予測を拡張し,136言語にまたがる40k時間のデータをデノベーションするWavLabLMを提案する。
このモデルではXLS-Rの性能を94%維持でき、データの3%しか保持できない。
論文 参考訳(メタデータ) (2023-09-26T23:55:57Z) - LMSYS-Chat-1M: A Large-Scale Real-World LLM Conversation Dataset [75.9621305227523]
LMSYS-Chat-1M(LMSYS-Chat-1M)について紹介する。
このデータセットは、VicunaのデモとArenaのWebサイトで、210KのIPアドレスから収集されています。
GPT-4と同様の動作を行うコンテンツモデレーションモデルの開発、安全性ベンチマークの構築、Vicunaと同様の動作を行う命令追従モデルのトレーニング、挑戦的なベンチマーク問題の作成、という4つのユースケースを通じて、その汎用性を実証する。
論文 参考訳(メタデータ) (2023-09-21T12:13:55Z) - DAppSCAN: Building Large-Scale Datasets for Smart Contract Weaknesses in
DApp Projects [28.841564946449463]
DAPPSCAN-SOURCEデータセットは39,904のSolidityファイルで構成される。
DAPPSCAN-BYTECODEデータセットは6,665のコンパイルされたスマートコントラクトで構成され、888のSWC弱点がある。
DAPPSCAN-BYTECODEに基づいて,最先端のスマートコントラクト弱点検出ツールの性能評価実験を行った。
論文 参考訳(メタデータ) (2023-05-15T08:56:13Z) - SDW-ASL: A Dynamic System to Generate Large Scale Dataset for Continuous
American Sign Language [0.0]
ASLデータセットの最初のバージョンは、30k文、416k単語、18k単語の語彙を合計104時間でリリースしています。
これはビデオの持続時間で現在まで発行されている最大の連続手話データセットである。
論文 参考訳(メタデータ) (2022-10-13T07:08:00Z) - USB: A Unified Semi-supervised Learning Benchmark [125.25384569880525]
半教師付き学習(SSL)は、大量のラベルのないデータを活用して、限定されたラベル付きサンプルを増やすことにより、モデルの一般化を改善する。
これまでの研究は通常、深層ニューラルネットワークをゼロから訓練するが、それは時間がかかり、環境に優しいものではない。
我々は、15の多様な、挑戦的で包括的なタスクを選択して、統一SSLベンチマーク(USB)を構築します。
論文 参考訳(メタデータ) (2022-08-12T15:45:48Z) - DATA: Domain-Aware and Task-Aware Pre-training [94.62676913928831]
我々は、自己教師付き学習(SSL)に特化した、シンプルで効果的なNASアプローチであるDataを提示する。
提案手法は,画像分類,オブジェクト検出,セマンティックセグメンテーションなど,下流タスクにおける計算コストの広い範囲にわたる有望な結果を実現する。
論文 参考訳(メタデータ) (2022-03-17T02:38:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。