論文の概要: An Effective and Cost-Efficient Agentic Framework for Ethereum Smart Contract Auditing
- arxiv url: http://arxiv.org/abs/2601.17833v1
- Date: Sun, 25 Jan 2026 13:28:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.425244
- Title: An Effective and Cost-Efficient Agentic Framework for Ethereum Smart Contract Auditing
- Title(参考訳): Ethereumスマートコントラクト監査のための効果的で費用効率の良いエージェントフレームワーク
- Authors: Xiaohui Hu, Wun Yu Chan, Yuejie Shi, Qumeng Sun, Wei-Cheng Wang, Chiachih Wu, Haoyu Wang, Ningyu He,
- Abstract要約: Heimdallrは,4つのコアイノベーションを通じてハードルを克服するために設計された,自動監査エージェントだ。
重要なビジネスロジックを保持しながら、コンテキストオーバーヘッドを最小限にします。
複雑な脆弱性を検出し、機能的なエクスプロイトを自動的にチェーンする。
- 参考スコア(独自算出の注目度): 8.735899453872966
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Smart contract security is paramount, but identifying intricate business logic vulnerabilities remains a persistent challenge because existing solutions consistently fall short: manual auditing is unscalable, static analysis tools are plagued by false positives, and fuzzers struggle to navigate deep logic states within complex systems. Even emerging AI-based methods suffer from hallucinations, context constraints, and a heavy reliance on expensive, proprietary Large Language Models. In this paper, we introduce Heimdallr, an automated auditing agent designed to overcome these hurdles through four core innovations. By reorganizing code at the function level, Heimdallr minimizes context overhead while preserving essential business logic. It then employs heuristic reasoning to detect complex vulnerabilities and automatically chain functional exploits. Finally, a cascaded verification layer validates these findings to eliminate false positives. Notably, this approach achieves high performance on lightweight, open-source models like GPToss-120B without relying on proprietary systems. Our evaluations demonstrate exceptional performance, as Heimdallr successfully reconstructed 17 out of 20 real-world attacks post June 2025, resulting in total losses of $384M, and uncovered 4 confirmed zero-day vulnerabilities that safeguarded $400M in TVL. Compared to SOTA baselines including both official industrial tools and academic tools, Heimdallr at most reduces analysis time by 97.59% and financial costs by 98.77% while boosting detection precision by over 93.66%. Notably, when applied to auditing contests, Heimdallr can achieve a 92.45% detection rate at a negligible cost of $2.31 per 10K LOC. We provide production-ready auditing services and release valuable benchmarks for future work.
- Abstract(参考訳): 手動の監査はスケール不可能で、静的分析ツールは偽陽性に悩まされ、ファジィは複雑なシステム内の深いロジック状態をナビゲートするのに苦労する。
新興のAIベースのメソッドでさえ、幻覚、コンテキスト制約、そして高価なプロプライエタリな大規模言語モデルへの強い依存に悩まされている。
本稿では,これらのハードルを克服する自動監査エージェントであるHeimdallrを紹介する。
関数レベルでコードを再編成することで、Heimdallrは重要なビジネスロジックを保持しながら、コンテキストオーバーヘッドを最小限にする。
その後、複雑な脆弱性を検出し、機能的エクスプロイトを自動的にチェーンするヒューリスティック推論を採用する。
最後に、カスケードされた検証層がこれらの発見を検証し、偽陽性を除去する。
特に、このアプローチはプロプライエタリなシステムに頼ることなく、GPToss-120Bのような軽量でオープンソースなモデルで高いパフォーマンスを実現する。
Heimdallr氏は2025年6月に20件の現実世界の攻撃のうち17件を再構築し、合計3億4400万ドル(約320億円)の損失を出し、4件のゼロデイ脆弱性がTVLで4億ドル(約440億円)を保護したことを突き止めた。
公式の工業用ツールや学術用ツールを含むSOTAのベースラインと比較して、ハイムドールは分析時間を97.59%削減し、費用は98.77%削減し、検出精度は93.66%以上向上した。
特に、監査コンテストに適用すると、Heimdallrは10K LOCあたり2.31ドルという無視できるコストで92.45%の検知率を達成することができる。
プロダクション対応の監査サービスを提供し、将来の作業に価値あるベンチマークをリリースします。
関連論文リスト
- SSR: Safeguarding Staking Rewards by Defining and Detecting Logical Defects in DeFi Staking [55.62033436283969]
DeFi(Decentralized Finance)の買収は、DeFiエコシステムにおける最も顕著なアプリケーションの1つだ。
DeFiの盗難の論理的欠陥により、攻撃者は不当な報酬を請求できる。
我々は,DeFi取引契約における論理的欠陥を検出するための静的解析ツールであるSSR(Safeguarding Stake Reward)を開発した。
論文 参考訳(メタデータ) (2026-01-09T15:01:41Z) - Towards Secure and Explainable Smart Contract Generation with Security-Aware Group Relative Policy Optimization [18.013438474903314]
本稿では,スマートコントラクト生成をセキュアかつ説明可能なフレームワークであるSmartCoder-R1を提案する。
我々は、人間のセキュリティ分析をエミュレートするためにモデルを訓練する。
SmartCoder-R1は、テクニックの新たな状態を確立し、5つの主要なメトリクスで最高のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-09-12T03:14:50Z) - CyberGym: Evaluating AI Agents' Real-World Cybersecurity Capabilities at Scale [45.97598662617568]
我々は188のソフトウェアプロジェクトにわたる1,507の実際の脆弱性を特徴とする大規模ベンチマークであるCyberGymを紹介した。
我々はCyberGymが35のゼロデイ脆弱性と17の歴史的不完全なパッチを発見できることを示した。
これらの結果は、CyberGymは、サイバーセキュリティにおけるAIの進歩を測定するための堅牢なベンチマークであるだけでなく、直接的な現実世界のセキュリティ効果を生み出すためのプラットフォームでもあることを強調している。
論文 参考訳(メタデータ) (2025-06-03T07:35:14Z) - AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security [74.22452069013289]
AegisLLMは、敵の攻撃や情報漏洩に対する協調的なマルチエージェント防御である。
テスト時のエージェント推論システムのスケーリングは,モデルの有用性を損なうことなく,ロバスト性を大幅に向上させることを示す。
アンラーニングやジェイルブレイクを含む主要な脅威シナリオに対する総合的な評価は、AegisLLMの有効性を示している。
論文 参考訳(メタデータ) (2025-04-29T17:36:05Z) - Do Automated Fixes Truly Mitigate Smart Contract Exploits? [7.570246812206772]
本稿では,スマートコントラクトのためのプログラム修復ツールの活用性を評価するための,新しい,体系的な実験フレームワークを提案する。
脆弱なスマートコントラクト143のデータセットを使用して、20の最先端のAPRツールを質的かつ定量的に分析する。
術式は29%から74%に低下した。
論文 参考訳(メタデータ) (2025-01-08T16:31:59Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - Retrieval Augmented Generation Integrated Large Language Models in Smart Contract Vulnerability Detection [0.0]
分散ファイナンス(DeFi)には、スマートコントラクトの脆弱性による大きな損失が伴っている。
攻撃が頻発するにつれて、監査サービスの必要性と需要が高まっている。
本研究では,大規模言語モデル(LLM)とRAG(Retrieval-Augmented Generation)を統合することにより,既存のフレームワークを構築する。
論文 参考訳(メタデータ) (2024-07-20T10:46:42Z) - G$^2$uardFL: Safeguarding Federated Learning Against Backdoor Attacks
through Attributed Client Graph Clustering [116.4277292854053]
Federated Learning (FL)は、データ共有なしで協調的なモデルトレーニングを提供する。
FLはバックドア攻撃に弱いため、有害なモデル重みがシステムの整合性を損なう。
本稿では、悪意のあるクライアントの識別を属性グラフクラスタリング問題として再解釈する保護フレームワークであるG$2$uardFLを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:15:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。