論文の概要: DAppSCAN: Building Large-Scale Datasets for Smart Contract Weaknesses in
DApp Projects
- arxiv url: http://arxiv.org/abs/2305.08456v1
- Date: Mon, 15 May 2023 08:56:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 08:42:20.200355
- Title: DAppSCAN: Building Large-Scale Datasets for Smart Contract Weaknesses in
DApp Projects
- Title(参考訳): DAppSCAN: DAppプロジェクトにおけるスマートコントラクト弱さのための大規模データセットの構築
- Authors: Zibin Zheng, Jianzhong Su, Jiachi Chen, David Lo, Zhijie Zhong and
Mingxi Ye
- Abstract要約: DAppSCAN-Sourceデータセットは25,077のSolidityファイルで構成される。
DAPPSCAN-Bytecodeデータセットは8,167のコンパイルされたスマートコントラクトバイトコードと895のSWC弱点で構成されている。
- 参考スコア(独自算出の注目度): 28.841564946449463
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Smart Contract Weakness Classification Registry (SWC Registry) is a
widely recognized list of smart contract weaknesses specific to the Ethereum
platform. In recent years, significant research efforts have been dedicated to
building tools to detect SWC weaknesses. However, evaluating these tools has
proven challenging due to the absence of a large, unbiased, real-world dataset.
To address this issue, we recruited 22 participants and spent 44 person-months
analyzing 1,322 open-source audit reports from 30 security teams. In total, we
identified 10,016 weaknesses and developed two distinct datasets, i.e.,
DAppSCAN-Source and DAppSCAN-Bytecode. The DAppSCAN-Source dataset comprises
25,077 Solidity files, featuring 1,689 SWC vulnerabilities sourced from 1,139
real-world DApp projects. The Solidity files in this dataset may not be
directly compilable. To enable the dataset to be compilable, we developed a
tool capable of automatically identifying dependency relationships within DApps
and completing missing public libraries. By utilizing this tool, we created our
DAPPSCAN-Bytecode dataset, which consists of 8,167 compiled smart contract
bytecode with 895 SWC weaknesses. Based on the second dataset, we conducted an
empirical study to assess the performance of five state-of-the-art smart
contract vulnerability detection tools. The evaluation results revealed subpar
performance for these tools in terms of both effectiveness and success
detection rate, indicating that future development should prioritize real-world
datasets over simplistic toy contracts.
- Abstract(参考訳): smart contract weakness classification registry(swcレジストリ)は、ethereumプラットフォーム特有のスマートコントラクトの弱点のリストとして広く認識されている。
近年、SWCの弱点を検出するツールの開発に多大な研究努力が注がれている。
しかし、これらのツールの評価は、大きな偏りのない現実世界のデータセットがないため、困難であることが証明されている。
この問題に対処するため、22人の参加者を募集し、30のセキュリティチームから1322人のオープンソース監査レポートを分析した。
全体として10,016の弱点を特定し,DAppSCAN-SourceとDAppSCAN-Bytecodeという2つの異なるデータセットを開発した。
DAppSCAN-Sourceデータセットは25,077のSolidityファイルで構成される。
このデータセットのsolidityファイルは直接コンパイルできないかもしれない。
データセットをコンパイル可能にするために,dapp内の依存関係関係を自動的に識別し,不足している公開ライブラリを補完するツールを開発した。
このツールを利用することで、8,167個のコンパイルされたスマートコントラクトバイトコードと895個のSWC弱点からなるDAPPSCAN-Bytecodeデータセットを作成しました。
第2のデータセットに基づいて、5つの最先端スマートコントラクト脆弱性検出ツールの性能評価実験を行った。
評価の結果,これらのツールの性能は,有効性と成功検出率の両方において劣等であり,汎用的な玩具契約よりも実世界のデータセットを優先すべきであることが示唆された。
関連論文リスト
- DSBench: How Far Are Data Science Agents to Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - MADE-WIC: Multiple Annotated Datasets for Exploring Weaknesses In Code [2.399010142304227]
MADE-WICは、機能とコメントの大規模なデータセットであり、技術的負債とコードの弱点に対する複数のアノテーションがある。
約860Kのコード関数と、12のオープンソースプロジェクトからの2.7M以上の関連コメントが含まれている。
論文 参考訳(メタデータ) (2024-08-09T16:32:38Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - Static Application Security Testing (SAST) Tools for Smart Contracts: How Far Are We? [14.974832502863526]
近年,スマートコントラクトセキュリティの重要性が高まっている。
この問題に対処するため、スマートコントラクトの脆弱性を検出するために、多数の静的アプリケーションセキュリティテスト(SAST)ツールが提案されている。
本稿では,スマートコントラクトに対する45種類の脆弱性を含む,最新のきめ細かな分類法を提案する。
論文 参考訳(メタデータ) (2024-04-28T13:40:18Z) - Key-Point-Driven Data Synthesis with its Enhancement on Mathematical Reasoning [110.80663974060624]
キーポイント駆動型データ合成(KPDDS)は質問応答対を合成する新しいデータ合成フレームワークである。
KPDDSは厳格な品質管理と相当なスケーラビリティを備えた新しい質問の生成を保証する。
KPMathは,800万以上の質問応答対から構成される,数学的推論に適した広範囲な合成データセットである。
論文 参考訳(メタデータ) (2024-03-04T18:58:30Z) - Charting The Evolution of Solidity Error Handling [16.49756378654774]
スマートコントラクトが検証すべきトランザクションを実行するため,Solidityスマートコントラクトにおけるエラー処理の利用が不可欠だ。
我々は283Kのユニークなオープンソーススマートコントラクトについて大規模な実証研究を行い、時間とともにSolidity EH機能の使用に関するパターンを特定する。
論文 参考訳(メタデータ) (2024-02-05T16:50:39Z) - Vulnerability Scanners for Ethereum Smart Contracts: A Large-Scale Study [44.25093111430751]
2023年だけでも、そのような脆弱性は数十億ドルを超える巨額の損失をもたらした。
スマートコントラクトの脆弱性を検出し、軽減するために、さまざまなツールが開発されている。
本研究では,既存のセキュリティスキャナの有効性と,現在も継続している脆弱性とのギャップについて検討する。
論文 参考訳(メタデータ) (2023-12-27T11:26:26Z) - SmartBugs 2.0: An Execution Framework for Weakness Detection in Ethereum
Smart Contracts [0.757843972001219]
スマートコントラクトは、しばしば価値ある資産を扱うブロックチェーンプログラムである。
脆弱性の特定と排除を支援するため、自動分析のためのメソッドとツールが提案されている。
We present SmartBugs 2.0, a modular execution framework for smart contract analysis。
論文 参考訳(メタデータ) (2023-06-08T09:22:25Z) - D2A: A Dataset Built for AI-Based Vulnerability Detection Methods Using
Differential Analysis [55.15995704119158]
静的解析ツールによって報告されたラベル問題に対する差分解析に基づくアプローチであるD2Aを提案する。
D2Aを使用して大きなラベル付きデータセットを生成し、脆弱性識別のためのモデルをトレーニングします。
論文 参考訳(メタデータ) (2021-02-16T07:46:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。