論文の概要: CHAINTRIX: A multi-pipeline LLM-augmented framework for automated smart-contract security auditing
- arxiv url: http://arxiv.org/abs/2605.09350v1
- Date: Sun, 10 May 2026 06:02:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.206659
- Title: CHAINTRIX: A multi-pipeline LLM-augmented framework for automated smart-contract security auditing
- Title(参考訳): CHAINTRIX: 自動スマートコントラクトセキュリティ監査のためのマルチパイプラインLLM拡張フレームワーク
- Authors: Gabriela Dobrita, Simona-Vasilica Oprea, Adela Bara,
- Abstract要約: Chaintrixは、スマートコントラクトエクスプロイトのためのエンドツーエンドの監査フレームワークである。
120の脆弱性のうち86が検出され、25の監査が100%リコールされた。
- 参考スコア(独自算出の注目度): 3.8615905456206256
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Smart-contract exploits have caused billions of USD in cumulative losses, yet audits remain expensive and slow. Automated tools have emerged to close this gap, but each class has a characteristic failure mode. Static analyzers report findings that frequently fail manual triage at high rates, while large language models (LLMs) hallucinate findings that contradict the source code. Thus, we propose Chaintrix, an end-to-end auditing framework whose central architectural commitment is that every LLM-generated claim must be discharged against a deterministic structural contract representation. We introduce a Cross-Contract Interaction Model (CCIM) that parses Solidity into a structured map of function-level reads, writes, modifiers and resolved cross-contract calls. CCIM serves as the substrate against which all 12 of Chaintrix's deterministic signal engines and the parallel LLM audit pipelines operate. A staged false-positive-reduction pipeline, terminating in a Structural Verdict Engine (SVE) that applies deterministic structural checks against parsed code, filters the merged finding set, with selected high-confidence findings further validated through symbolic execution and fuzz testing. We evaluate Chaintrix on EVMbench, the smart-contract security benchmark by OpenAI, Paradigm, OtterSec. Chaintrix detects 86 of 120 high-severity vulnerabilities (71.7% recall), with 25 audits scoring 100% recall, placing Chaintrix 26 percentage points above the strongest frontier-model baseline.
- Abstract(参考訳): スマートコントラクトによるエクスプロイトは、累積損失で数十億ドルのUSDを発生させたが、監査は高価で遅いままだ。
このギャップを埋めるために自動ツールが登場したが、各クラスには特有の障害モードがある。
静的解析器は、しばしば手動トリアージを高速で失敗するが、大きな言語モデル(LLM)はソースコードに矛盾する発見を幻覚させる。
そこで我々は,LLM 生成したすべてのクレームを決定論的構造的契約表現に対して排除しなければならないというアーキテクチャのコミットメントを,エンドツーエンドの監査フレームワークである Chaintrix を提案する。
関数レベルの読み込み,書き込み,修飾子,解決されたクロスコントラクト呼び出しの構造化マップにソリデーティを解析するクロスコントラクトインタラクションモデル(CCIM)を導入する。
CCIMは、Chaintrixの決定論的信号エンジンと並列LLM監査パイプラインの12基が動作する基盤として機能する。
解析されたコードに対して決定論的構造チェックを適用する構造検証エンジン(Structure Verdict Engine, SVE)で終端となるステージド偽陽性推論パイプラインは、マージされた検出セットをフィルタリングする。
OpenAI, Paradigm, OtterSecによるスマートコントラクトセキュリティベンチマークであるEVMbenchのChaintrixを評価する。
チェイントリクスは120の重大脆弱性(71.7%のリコール)の86を検知し、25の監査で100%リコールを記録し、チェイントリクスは最強のフロンティアモデルベースラインより26ポイント高い。
関連論文リスト
- ComplexMCP: Evaluation of LLM Agents in Dynamic, Interdependent, and Large-Scale Tool Sandbox [61.862814740220806]
$textbfComplexMCP$は厳格な条件下でエージェントを評価するために設計されたベンチマークである。
Model Context Protocol (MCP)上に構築された$textbfComplexMCP$は300以上の精巧にテストされたツールを提供する。
論文 参考訳(メタデータ) (2026-05-11T16:20:51Z) - GoAT-X: A Graph of Auditing Thoughts for Securing Token Transactions in Cross-Chain Contracts [52.51342355102833]
マルチチェーンエコシステムの重要な基盤であるクロスチェーンブリッジは、攻撃者にとって主要なターゲットとなっている。
バイトコードレベルの静的解析のような既存の防御は、チェーン間の相互作用のセマンティックな複雑さを扱うには不十分である。
パターンマッチングから体系的な第一原理検証へ自動的なクロスチェーンスマートコントラクト監査を移行するフレームワークであるGoAT-Xを提案する。
論文 参考訳(メタデータ) (2026-04-27T11:34:21Z) - Can Agents Secure Hardware? Evaluating Agentic LLM-Driven Obfuscation for IP Protection [1.7331553371038069]
本稿では,自動ハードウェアネットリスト難読化のためのエージェント型大規模言語モデル(LLM)によるフレームワークを提案する。
1つのプロンプト・ツー・アウトプット生成ステップではなく、このフレームワークはタスクを回路解析、合成、検証、攻撃評価のための特別なステージに分解する。
その結果, SAT攻撃は有効でありながら, 不正鍵の下で測定可能な出力劣化を導入しながら, 正しいロックネットリストを生成することがわかった。
論文 参考訳(メタデータ) (2026-04-14T21:04:48Z) - AVDA: Autonomous Vibe Detection Authoring for Cybersecurity [0.1633272850273525]
AVDAは、モデルコンテキストプロトコル(MCP)を活用して、組織コンテキストをAI支援コード生成に統合することで検出を自動化するフレームワークである。
我々は,多種多様な生産検出コーパスと最先端LCMの3つのオーサリング戦略 – Baseline, Sequential, Agentic – を評価した。
その結果,エージェント品質の87%をトークンコストの40倍以下で達成できた。
論文 参考訳(メタデータ) (2026-03-26T21:52:33Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Automated Self-Testing as a Quality Gate: Evidence-Driven Release Management for LLM Applications [51.56484100374058]
我々は,エビデンスに基づくリリース決定を伴う品質ゲートを導入する自動自己テストフレームワークを提案する。
内部展開型多エージェント対話型AIシステムの縦型ケーススタディにより,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2026-03-13T20:44:15Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - TraceLLM: Security Diagnosis Through Traces and Smart Contracts in Ethereum [23.800363904247146]
TraceLLMは、ジョイントトレースとコントラクトコード駆動セキュリティ分析のための最初のベンチマークを確立する。
TraceLLMは85.19%の精度で攻撃者および被害者のアドレスを特定し、70.37%の精度で自動レポートを生成する。
現実世界のインシデント全体で、TraceLLMは66.22%の精度でレポートを自動的に生成し、強力な一般化性を示す。
論文 参考訳(メタデータ) (2025-09-03T05:53:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。