論文の概要: SolAgent: A Specialized Multi-Agent Framework for Solidity Code Generation
- arxiv url: http://arxiv.org/abs/2601.23009v1
- Date: Fri, 30 Jan 2026 14:17:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:15.492949
- Title: SolAgent: A Specialized Multi-Agent Framework for Solidity Code Generation
- Title(参考訳): SolAgent: ソリデーティコード生成のための特別なマルチエージェントフレームワーク
- Authors: Wei Chen, Zhiyuan Peng, Xin Yin, Chao Ni, Chenhao Ying, Bang Xie, Yuan Luo,
- Abstract要約: 本稿では,人間専門家のワークフローを模倣する新しいツール強化マルチエージェントフレームワークであるSolAgentを提案する。
SolAgent には textbfdual-loop refinement メカニズムが組み込まれている。機能上の正確性を保証するために textitForge コンパイラを使用する内部ループと,セキュリティ上の脆弱性を取り除くために textitSlither 静的アナライザを活用する外部ループである。
高品質な現実世界プロジェクトから派生した厳格なスイートであるSolEval+Benchmarkの実験は、SolAgentがPass@1レートを textbf64.39 まで達成していることを示している。
- 参考スコア(独自算出の注目度): 14.448500293828177
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Smart contracts are the backbone of the decentralized web, yet ensuring their functional correctness and security remains a critical challenge. While Large Language Models (LLMs) have shown promise in code generation, they often struggle with the rigorous requirements of smart contracts, frequently producing code that is buggy or vulnerable. To address this, we propose SolAgent, a novel tool-augmented multi-agent framework that mimics the workflow of human experts. SolAgent integrates a \textbf{dual-loop refinement mechanism}: an inner loop using the \textit{Forge} compiler to ensure functional correctness, and an outer loop leveraging the \textit{Slither} static analyzer to eliminate security vulnerabilities. Additionally, the agent is equipped with file system capabilities to resolve complex project dependencies. Experiments on the SolEval+ Benchmark, a rigorous suite derived from high-quality real-world projects, demonstrate that SolAgent achieves a Pass@1 rate of up to \textbf{64.39\%}, significantly outperforming state-of-the-art LLMs ($\sim$25\%), AI IDEs (e.g., GitHub Copilot), and existing agent frameworks. Moreover, it reduces security vulnerabilities by up to \textbf{39.77\%} compared to human-written baselines. Finally, we demonstrate that the high-quality trajectories generated by SolAgent can be used to distill smaller, open-source models, democratizing access to secure smart contract generation. We release our data and code at https://github.com/openpaperz/SolAgent.
- Abstract(参考訳): スマートコントラクトは分散Webのバックボーンですが、機能上の正しさとセキュリティは依然として重要な課題です。
大きな言語モデル(LLM)はコード生成において有望であるが、スマートコントラクトの厳格な要件に悩まされ、バグや脆弱性のあるコードを生成することが多い。
これを解決するために,人間専門家のワークフローを模倣する新しいツール強化マルチエージェントフレームワークであるSolAgentを提案する。
SolAgent は \textbf{dual-loop refinement mechanism} を統合しており、機能的正しさを保証するために \textit{Forge} コンパイラを使用する内部ループと、セキュリティ上の脆弱性を取り除くために \textit{Slither} 静的アナライザを利用する外部ループである。
さらに、エージェントは複雑なプロジェクトの依存関係を解決するファイルシステム機能を備えている。
高品質の現実世界プロジェクトから派生した厳格なスイートであるSolEval+ Benchmarkの実験では、SolAgentがPass@1レートを \textbf{64.39\%}まで達成し、最先端のLLM($\sim$25\%)、AI IDE(例:GitHub Copilot)、既存のエージェントフレームワークを著しく上回る結果となった。
さらに、人手によるベースラインと比較して、セキュリティ上の脆弱性を \textbf{39.77\%} まで削減する。
最後に、SolAgentが生成する高品質なトラジェクトリを用いて、より小型でオープンソースのモデルを蒸留し、セキュアなスマートコントラクト生成へのアクセスを民主化できることを実証する。
データとコードはhttps://github.com/openpaperz/SolAgent.comで公開しています。
関連論文リスト
- BackdoorAgent: A Unified Framework for Backdoor Attacks on LLM-based Agents [58.83028403414688]
大規模言語モデル(LLM)エージェントは、計画、メモリ、ツールの使用を組み合わせた多段階ワークフローを通じてタスクを実行する。
エージェントワークフローの特定のステージに注入されたバックドアトリガーは、複数の中間状態を通して持続し、下流出力に悪影響を及ぼす可能性がある。
LLMエージェントにおけるバックドア脅威を統一したエージェント中心のビューを提供するモジュールおよびステージアウェアフレームワークである textbfBackdoorAgent を提案する。
論文 参考訳(メタデータ) (2026-01-08T03:49:39Z) - FHE-Agent: Automating CKKS Configuration for Practical Encrypted Inference via an LLM-Guided Agentic Framework [23.668677510478446]
本稿では、専門家推論プロセスを自動化するエージェントフレームワークであるFHE-Agentを紹介する。
探索をグローバルパラメータ選択と階層的ボトルネック修復に分解する。
検索戦略よりも精度が良く、レイテンシも低い。
論文 参考訳(メタデータ) (2025-11-23T23:26:21Z) - Exposing Weak Links in Multi-Agent Systems under Adversarial Prompting [5.544819942438653]
本稿では,マルチエージェントシステムのセキュリティ評価を行うフレームワークであるSafeAgentsを提案する。
広く採用されている5つのマルチエージェントアーキテクチャについて検討する。
この結果から,一般的なデザインパターンには重大な脆弱性があることが判明した。
論文 参考訳(メタデータ) (2025-11-14T04:22:49Z) - AgentGit: A Version Control Framework for Reliable and Scalable LLM-Powered Multi-Agent Systems [7.408263799616532]
AgentGitはGitライクなロールバックとブランチをマルチエージェントシステム(MAS)にもたらすフレームワークです。
AgentGitは冗長、ランタイム、トークンの使用を著しく削減し、複数のブランチをまたいだ並列探索をサポートしています。
この作業は、より堅牢なMAS設計への実践的なパスを提供し、コラボレーティブAIシステムにおけるエラー回復、安全な探索、計算、A/Bテストを可能にする。
論文 参考訳(メタデータ) (2025-11-01T17:11:31Z) - LightAgent: Production-level Open-source Agentic AI Framework [11.847936249298611]
軽量ながら強力なエージェントフレームワークである textbfLightAgent を提案する。
LightAgentはメモリ(mem0)、ツール、Tree of Thought(ToT)などのコア機能を統合する
完全なオープンソースソリューションとして、メインストリームのチャットプラットフォームとシームレスに統合される。
論文 参考訳(メタデータ) (2025-09-11T09:29:13Z) - AgentVigil: Generic Black-Box Red-teaming for Indirect Prompt Injection against LLM Agents [54.29555239363013]
本稿では,間接的なインジェクション脆弱性を自動的に検出し,悪用するための汎用的なブラックボックスファジリングフレームワークであるAgentVigilを提案する。
我々はAgentVigilをAgentDojoとVWA-advの2つの公開ベンチマークで評価し、o3-miniとGPT-4oに基づくエージェントに対して71%と70%の成功率を達成した。
攻撃を現実世界の環境に適用し、悪質なサイトを含む任意のURLに誘導するエージェントをうまく誘導する。
論文 参考訳(メタデータ) (2025-05-09T07:40:17Z) - On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents [58.79302663733703]
大規模言語モデルに基づくマルチエージェントシステムは、専門家エージェントの協力により、様々なタスクにまたがる優れた能力を示している。
不器用なエージェントや悪意のあるエージェントが与える影響 - システム全体のパフォーマンスにおいて、頻繁にタスクでエラーを犯すものは、いまだに過小評価されていない。
本稿では,下流タスクにおける障害要因下での各種システム構造のレジリエンスについて検討する。
論文 参考訳(メタデータ) (2024-08-02T03:25:20Z) - A Unified Debugging Approach via LLM-Based Multi-Agent Synergy [39.11825182386288]
FixAgentはマルチエージェントのシナジーによる統合デバッグのためのエンドツーエンドフレームワークである。
1.25$times$ 2.56$times$レポレベルのベンチマークであるDefects4Jのバグを修正した。
論文 参考訳(メタデータ) (2024-04-26T04:55:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。