論文の概要: ASIC-Agent: An Autonomous Multi-Agent System for ASIC Design with Benchmark Evaluation
- arxiv url: http://arxiv.org/abs/2508.15940v1
- Date: Thu, 21 Aug 2025 20:21:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.178651
- Title: ASIC-Agent: An Autonomous Multi-Agent System for ASIC Design with Benchmark Evaluation
- Title(参考訳): ASIC-Agent:ベンチマーク評価によるASIC設計のための自律マルチエージェントシステム
- Authors: Ahmed Allam, Youssef Mansour, Mohamed Shalan,
- Abstract要約: 大規模言語モデル (LLM) はレジスタ転送レベル (RTL) の設計において顕著な機能を示した。
LLM自体は、現実世界のハードウェア設計において重大な制限に直面している。
本稿では,デジタルASIC設計タスクに特化して設計された自律システムASIC-Agentについて述べる。
- 参考スコア(独自算出の注目度): 7.328100870402178
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) have demonstrated remarkable capabilities in Register Transfer Level (RTL) design, enabling high-quality code generation from natural language descriptions. However, LLMs alone face significant limitations in real-world hardware design workflows, including the inability to execute code, lack of debugging capabilities, and absence of long-term memory. To address these challenges, we present ASIC-Agent, an autonomous system designed specifically for digital ASIC design tasks. ASIC-Agent enhances base LLMs with a multi-agent architecture incorporating specialized sub-agents for RTL generation, verification, OpenLane hardening, and Caravel chip integration, all operating within a comprehensive sandbox environment with access to essential hardware design tools. The system leverages a vector database containing documentation, API references, error knowledge, and curated insights from the open-source silicon community. To evaluate ASIC-Agent's performance, we introduce ASIC-Agent-Bench, the first benchmark specifically designed to assess agentic systems in hardware design tasks. We evaluate ASIC-Agent with various base LLMs, providing quantitative comparisons and qualitative insights into agent behavior across different design scenarios. Our results demonstrate that ASIC-Agent, when powered by Claude 4 Sonnet, successfully automates a broad range of ASIC design tasks spanning varying levels of complexity, showing the potential of significantly accelerating the ASIC design workflow.
- Abstract(参考訳): 大きな言語モデル(LLM)は、レジスタ転送レベル(RTL)設計において顕著な機能を示し、自然言語記述から高品質なコード生成を可能にしている。
しかし、LLMだけでは、コード実行のできないこと、デバッグ機能の欠如、長期記憶の欠如など、現実世界のハードウェア設計ワークフローにおいて重大な制限に直面している。
これらの課題に対処するために,デジタルASIC設計タスクに特化して設計された自律システムASIC-Agentを提案する。
ASIC-Agentは、RTL生成、検証、OpenLaneハードニング、Caravelチップ統合のための特別なサブエージェントを組み込んだマルチエージェントアーキテクチャでベースLSMを強化し、すべてのハードウェア設計ツールにアクセス可能な包括的なサンドボックス環境内で動作する。
このシステムは、ドキュメント、API参照、エラー知識、オープンソースのシリコンコミュニティからのキュレートされた洞察を含むベクトルデータベースを活用する。
ASIC-Agentの性能を評価するために,ハードウェア設計タスクにおけるエージェントシステムの評価に特化して設計された最初のベンチマークであるASIC-Agent-Benchを紹介する。
我々はASIC-Agentを様々な基本LLMで評価し、異なる設計シナリオにおけるエージェントの挙動に関する定量的比較と定性的な洞察を提供する。
以上の結果から, ASIC-AgentはClaude 4 Sonnetを動力源として, 様々なレベルの複雑さにまたがる幅広いASIC設計タスクを自動化し, ASIC設計ワークフローを著しく加速させる可能性を示した。
関連論文リスト
- SV-LLM: An Agentic Approach for SoC Security Verification using Large Language Models [8.912091484067508]
SV-LLMは,システムオンチップ(SoC)セキュリティ検証の自動化と強化を目的とした,新しいマルチエージェントアシスタントシステムである。
検証質問応答、セキュリティ資産の識別、脅威モデリング、テスト計画とプロパティ生成、脆弱性検出、シミュレーションベースのバグ検証といったタスクのための特別なエージェントを統合することで、SV-LLMはワークフローを合理化する。
このシステムは,手作業による介入を減らすこと,精度の向上,セキュリティ分析の高速化,設計サイクルの初期段階におけるリスクの積極的な識別と緩和を支援することを目的としている。
論文 参考訳(メタデータ) (2025-06-25T13:31:13Z) - Specification and Evaluation of Multi-Agent LLM Systems -- Prototype and Cybersecurity Applications [0.0]
LLMは、推論技術、コード生成、ソフトウェア実行を複数の潜在的に特殊なLLMで組み合わせることで、複雑なタスクを解決するのに使うことができる。
本稿では,マルチエージェントシステムアーキテクチャとプロトタイプを用いて,エージェントスキーマ言語と仕様の実行と評価を紹介する。
サイバーセキュリティタスクを含むテストケースは、アーキテクチャと評価アプローチの可能性を示している。
論文 参考訳(メタデータ) (2025-06-12T08:16:17Z) - ProtocolLLM: RTL Benchmark for SystemVerilog Generation of Communication Protocols [45.66401695351214]
本稿では,広く使用されているSystemVerilogプロトコルを対象とした最初のベンチマークスイートであるProtocolLLMを紹介する。
我々は,ほとんどのモデルがタイミング制約に従う通信プロトコルのSystemVerilogコードを生成するのに失敗したことを観察する。
論文 参考訳(メタデータ) (2025-06-09T17:10:47Z) - OSS-UAgent: An Agent-based Usability Evaluation Framework for Open Source Software [47.02288620982592]
我々のフレームワークは,大規模言語モデル(LLM)を利用したインテリジェントエージェントを用いて,プログラミングタスクを実行する開発者をシミュレートする。
OSS-UAgentは正確でコンテキスト対応のコード生成を保証する。
本稿では,OSS-UAgentがグラフ解析プラットフォーム評価に活用している実例を紹介する。
論文 参考訳(メタデータ) (2025-05-29T08:40:10Z) - Exploring Code Language Models for Automated HLS-based Hardware Generation: Benchmark, Infrastructure and Analysis [14.458529723566379]
LLM(Large Language Model)は、PythonやC++などのプログラミング言語に使用される。
本稿では,LLMを利用してHLS(High-Level Synthesis)ベースのハードウェア設計を行う。
論文 参考訳(メタデータ) (2025-02-19T17:53:59Z) - SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering [79.07755560048388]
SWEエージェント(SWE-agent)は、LMエージェントが自律的にコンピュータを使用してソフトウェア工学のタスクを解決するシステムである。
SWEエージェントのカスタムエージェントコンピュータインタフェース(ACI)は、エージェントがコードファイルを作成し編集し、リポジトリ全体をナビゲートし、テストやその他のプログラムを実行する能力を著しく向上させる。
我々はSWE-benchとHumanEvalFixのSWE-agentを評価し、それぞれ12.5%と87.7%のパス@1レートで最先端の性能を実現した。
論文 参考訳(メタデータ) (2024-05-06T17:41:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。