論文の概要: Bastet: A Fine-Grained Expert-Labeled Dataset for DeFi Smart Contract Vulnerability Detection
- arxiv url: http://arxiv.org/abs/2606.03387v1
- Date: Tue, 02 Jun 2026 09:31:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.906771
- Title: Bastet: A Fine-Grained Expert-Labeled Dataset for DeFi Smart Contract Vulnerability Detection
- Title(参考訳): Bastet: DeFiスマートコントラクト脆弱性検出のための細粒度エキスパートラベル付きデータセット
- Authors: Wan-Hsuan Hsu, Wei-Hsin Wang, Cheng-Yu Liou, Ting-Rui Ke, Kentaroh Toyoda,
- Abstract要約: BastetはエキスパートラベルのDeFiスマートコントラクト脆弱性データセットである。
2021年4月から2024年11月までの394 Code4renaの競合監査レポートから4,402件の調査結果が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Smart contract vulnerabilities in Decentralized Finance (DeFi) protocols resulted in over 1.49 billion USD in confirmed losses in 2024 alone, across 192 incidents [1]. As LLM-based vulnerability detection emerges as a promising approach to address these threats, the quality of evaluation datasets has become a critical bottleneck. Existing datasets suffer from three fundamental problems: they are built on outdated Solidity versions (e.g., v0.4) that no longer reflect modern DeFi contracts [5][6][7]; they rely on automated or LLM-generated annotations that introduce hallucination-driven label noise [9][10]; and they apply coarse single-layer labeling that fails to capture the semantic complexity of real-world business logic vulnerabilities [6][7][11][12]. We present Bastet, an expert-labeled DeFi smart contract vulnerability dataset that addresses all three problems through real-world audit findings (2021-2024), human expert annotation with discussion-based consensus, and a two-layer taxonomy of 46 Tags and 77 Subtags. Bastet comprises 4,402 findings collected from 394 Code4rena competitive audit reports spanning April 2021 to November 2024, of which 849 findings are fully annotated by white-hat security researchers from the DeFiHackLabs community. All annotations are produced through a two-annotator consensus workflow, ensuring label accuracy grounded in real-world vulnerability root causes.
- Abstract(参考訳): 分散ファイナンス(DeFi)プロトコルにおけるスマートコントラクトの脆弱性は、2024年だけで149億USドルを突破し、192件のインシデントを突破した。
LLMベースの脆弱性検出は、これらの脅威に対処するための有望なアプローチとして登場し、評価データセットの品質が重要なボトルネックとなっている。
既存のデータセットは、時代遅れのSolidityバージョン(例: v0.4)上に構築されており、現在のDeFiコントラクト [5][6][7]を反映していない。
このデータセットは、現実の監査結果(2021-2024)、議論ベースのコンセンサスを備えた人間の専門家アノテーション、46のタグと77のサブタグからなる2層分類である。
Bastetは、2021年4月から2024年11月までの394 Code4renaの競合監査レポートから収集された4,402の調査結果で構成され、そのうち849の発見はDeFiHackLabsコミュニティのホワイトハットセキュリティ研究者によって完全に注釈付けされている。
すべてのアノテーションは2アノテーションのコンセンサスワークフローを通じて生成され、ラベルの精度が現実世界の脆弱性の根本原因に基づいていることが保証される。
関連論文リスト
- Three Heads Are Better Than One: A Multi-perspective Reasoning Framework for Enhanced Vulnerability Detection [17.33447267029733]
本稿では,3種類のLLMエージェントの認知シナジーを利用した多視点推論フレームワークReasonVulを提案する。
フレームワークはソースコードの独立した分析から始まり、続いてコンフリクトを解決するための構造化された議論メカニズムが続く。
我々は542のコンフリクトケースを分析し、389が正しく解決されたことを発見し、隠れた脆弱性を明らかにするフレームワークの能力を強調した。
論文 参考訳(メタデータ) (2026-05-18T09:57:22Z) - Credential Leakage in LLM Agent Skills: A Large-Scale Empirical Study [51.717224133855886]
サードパーティのスキルはLLMエージェントを強力な能力で拡張するが、特権のある環境では機密情報を扱うことが多い。
静的解析,サンドボックステスト,手動検査を用いて17,022のスキル(SkillsMPで170,226からサンプリング)を分析した。
我々は,1,708の課題で520の脆弱なスキルを識別し,10の漏洩パターン(事故4件,反対6件)の分類を導出する。
論文 参考訳(メタデータ) (2026-04-03T14:50:16Z) - Knowdit: Agentic Smart Contract Vulnerability Detection with Auditing Knowledge Summarization [14.193285719777052]
スマートコントラクト脆弱性検出のための知識駆動型エージェントフレームワークであるKnowditを提案する。
Knowditはまず、過去の人間の監査レポートから知識グラフを構築し、きめ細かいDeFiセマンティクスと繰り返し発生する脆弱性パターンをリンクする。
我々は,最新の12のCode4renaプロジェクトで,75のグランドトルース脆弱性のあるKnowditを評価した。
論文 参考訳(メタデータ) (2026-03-27T10:38:40Z) - An Effective and Cost-Efficient Agentic Framework for Ethereum Smart Contract Auditing [8.735899453872966]
Heimdallrは,4つのコアイノベーションを通じてハードルを克服するために設計された,自動監査エージェントだ。
重要なビジネスロジックを保持しながら、コンテキストオーバーヘッドを最小限にします。
複雑な脆弱性を検出し、機能的なエクスプロイトを自動的にチェーンする。
論文 参考訳(メタデータ) (2026-01-25T13:28:37Z) - SSR: Safeguarding Staking Rewards by Defining and Detecting Logical Defects in DeFi Staking [55.62033436283969]
DeFi(Decentralized Finance)の買収は、DeFiエコシステムにおける最も顕著なアプリケーションの1つだ。
DeFiの盗難の論理的欠陥により、攻撃者は不当な報酬を請求できる。
我々は,DeFi取引契約における論理的欠陥を検出するための静的解析ツールであるSSR(Safeguarding Stake Reward)を開発した。
論文 参考訳(メタデータ) (2026-01-09T15:01:41Z) - Encyclo-K: Evaluating LLMs with Dynamically Composed Knowledge Statements [78.87065404966002]
既存のベンチマークは、主に質問レベルで質問をキュレートする。
ベンチマーク構築をゼロから再考するステートメントベースのベンチマークであるEncyclo-Kを提案する。
論文 参考訳(メタデータ) (2025-12-31T13:55:54Z) - One Signature, Multiple Payments: Demystifying and Detecting Signature Replay Vulnerabilities in Smart Contracts [56.94148977064169]
署名の使用状況のチェックが不足すると、繰り返し検証が行われ、許可の不正使用のリスクが増大し、契約資産が脅かされる可能性がある。
我々はこの問題をSignature Replay Vulnerability (SRV) として定義する。
37のブロックチェーンセキュリティ企業を対象とした1,419の監査報告から、詳細なSRV記述と5種類のSRVを分類した108を識別しました。
論文 参考訳(メタデータ) (2025-11-12T09:17:13Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Benchmarking Reasoning Robustness in Large Language Models [76.79744000300363]
新規データや不完全データでは,性能が著しく低下することがわかった。
これらの結果は、厳密な論理的推論に対するリコールへの依存を浮き彫りにした。
本稿では,情報不足によって引き起こされる幻覚を利用して推論ギャップを明らかにする,Math-RoBと呼ばれる新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-03-06T15:36:06Z) - Retrieval Augmented Generation Integrated Large Language Models in Smart Contract Vulnerability Detection [0.0]
分散ファイナンス(DeFi)には、スマートコントラクトの脆弱性による大きな損失が伴っている。
攻撃が頻発するにつれて、監査サービスの必要性と需要が高まっている。
本研究では,大規模言語モデル(LLM)とRAG(Retrieval-Augmented Generation)を統合することにより,既存のフレームワークを構築する。
論文 参考訳(メタデータ) (2024-07-20T10:46:42Z) - Vulnerability Scanners for Ethereum Smart Contracts: A Large-Scale Study [44.25093111430751]
2023年だけでも、そのような脆弱性は数十億ドルを超える巨額の損失をもたらした。
スマートコントラクトの脆弱性を検出し、軽減するために、さまざまなツールが開発されている。
本研究では,既存のセキュリティスキャナの有効性と,現在も継続している脆弱性とのギャップについて検討する。
論文 参考訳(メタデータ) (2023-12-27T11:26:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。