論文の概要: HAVEN: Hybrid Automated Verification ENgine for UVM Testbench Synthesis with LLMs
- arxiv url: http://arxiv.org/abs/2604.27643v1
- Date: Thu, 30 Apr 2026 09:35:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.023544
- Title: HAVEN: Hybrid Automated Verification ENgine for UVM Testbench Synthesis with LLMs
- Title(参考訳): HAVEN: LLMを用いたUVMテストベンチ合成のためのハイブリッド自動検証ENgine
- Authors: Chang-Chih Meng, Yu-Ren Lu, Guan-Yu Lin, Tsung Tai Yeh, Kai-Chiang Wu, I-Chen Wu,
- Abstract要約: 本稿ではHAVEN(Hybrid Automated Verification ENgine)を提案する。
HAVENは、事前に定義されたプロトコル固有のJinja2テンプレートを使用して、すべてのUVMコンポーネントとUVMシーケンスを生成する最初のシステムである。
実験の結果,HAVENは100%のコンパイル成功,90.6%のコードカバレッジ,87.9%の関数カバレッジを有し,LSMを用いたテストベンチ生成システムではSOTAであることがわかった。
- 参考スコア(独自算出の注目度): 10.731838460133309
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Integrated Circuit (IC) verification consumes nearly 70% of the IC development cycle, and recent research leverages Large Language Models (LLMs) to automatically generate testbenches and reduce verification overhead. However, LLMs have difficulty generating testbenches correctly. Unlike high-level programming languages, Hardware Description Languages (HDLs) are extremely rare in LLMs training data, leading LLMs to produce incorrect code. To overcome challenges when using LLMs to generate Universal Verification Methodology (UVM) testbenches and sequences, wepropose HAVEN (Hybrid Automated Verification ENgine) to prevent LLMs from writing HDL directly. For UVM testbench generation, HAVEN utilizes LLM agents to analyze design specifications to produce a structured architectural plan. The HAVEN Template Engine then combines with predefined and protocol-specific templates to generate all UVM components with correct bus-handshake timing. For UVM sequence generation, HAVEN introduces a Protocol-Aware Sequence Domain-Specific Language (DSL) that decomposes sequences into fine-grained step types. A set of predefined DSL patterns first establishes sequences that achieve a high coverage rate without LLM involvement. HAVEN continues to improve the coverage rate by iteratively leveraging LLM agents to analyze coverage gap reports and compose additional targeted DSL sequences. Unlike previous works, HAVEN is the first system that utilizes pre-defined, protocol-specific Jinja2 templates to generate all UVM components and UVM sequences using our proposed Protocol-Aware DSL and rule-based code generator. Our experimental results on 19 open-source IP designs spanning three interface protocols (Direct, Wishbone, AXI4-Lite) show that HAVEN achieves 100% compilation success, 90.6% code coverage, and 87.9% functional coverage on average, and is SOTA among LLM-assisted testbench generation systems.
- Abstract(参考訳): IC(Integrated Circuit)検証はIC開発サイクルの70%近くを消費し、最近の研究はLarge Language Models(LLM)を活用して自動テストベンチを生成し、検証オーバーヘッドを削減する。
しかし、LSMはテストベンチを正しく生成することが困難である。
高レベルのプログラミング言語とは異なり、ハードウェア記述言語(HDL)はLLMのトレーニングデータでは極めて稀であり、LLMは間違ったコードを生成する。
LLMを使ってUniversal Verification Methodology(UVM)テストベンチとシーケンスを生成する際の課題を解決するために、HAVEN(Hybrid Automated Verification ENgine)を提案して、LLMが直接HDLを書くのを防ぐ。
UVMテストベンチ生成において、HAVENはLLMエージェントを使用して設計仕様を分析し、構造化されたアーキテクチャ計画を作成する。
HAVENテンプレートエンジンは事前に定義されたプロトコル固有のテンプレートと組み合わせて、すべてのUVMコンポーネントを適切なバスハンドシェイクタイミングで生成する。
UVMシーケンス生成のために、HAVENは、シーケンスをきめ細かいステップタイプに分解するProtocol-Aware Sequence Domain-Specific Language (DSL)を導入した。
事前定義されたDSLパターンのセットは、まずLLMの関与なしに高いカバレッジ率を達成するシーケンスを確立する。
HAVENは、LLMエージェントを反復的に活用してカバレッジギャップレポートを分析し、追加のターゲットDSLシーケンスを構成することで、カバレッジ率の改善を続けている。
これまでと異なり、HAVENはプロトコル固有のJinja2テンプレートを使用して、提案したProtocol-Aware DSLとルールベースのコードジェネレータを使用して、すべてのUVMコンポーネントとUVMシーケンスを生成する最初のシステムである。
3つのインタフェースプロトコル(Direct, Wishbone, AXI4-Lite)にまたがる19のオープンソースIP設計実験の結果,HAVENは100%のコンパイル成功,90.6%のコードカバレッジ,87.9%の関数カバレッジを実現しており,LLMによるテストベンチ生成システムではSOTAであることがわかった。
関連論文リスト
- LLM as a Neural Architect: Controlled Generation of Image Captioning Models Under Strict API Contracts [48.83701310501069]
LLM誘導型ニューラルネットワーク探索パイプラインであるNN-Captionを提案する。
LEMURの分類バックボーンからCNNエンコーダを構成することで、実行可能な画像キャプチャモデルを生成する。
この作業では、プロンプトベースのコード生成と自動評価を統合するパイプラインを提示する。
論文 参考訳(メタデータ) (2025-12-07T10:47:28Z) - PRO-V: An Efficient Program Generation Multi-Agent System for Automatic RTL Verification [6.983135183126461]
Pro-Vは、堅牢なRTL検証のためのプログラム生成マルチエージェントシステムである。
生成したテストベンチの正しさを高めるため、効率的なn個の反復サンプリング戦略が組み込まれている。
Pro-Vは、黄金のRTL実装では87.17%、RTL変異では76.28%の精度で検証されている。
論文 参考訳(メタデータ) (2025-06-13T20:06:34Z) - Hallucination to Consensus: Multi-Agent LLMs for End-to-End Test Generation [2.794277194464204]
ユニットテストは、ソフトウェアの正しさを保証する上で重要な役割を担います。
従来の手法は、高いコードカバレッジを達成するために、検索ベースまたはランダム化アルゴリズムに依存していた。
CANDORはJavaにおける自動単体テスト生成のための新しいプロンプトエンジニアリングベースのLLMフレームワークである。
論文 参考訳(メタデータ) (2025-06-03T14:43:05Z) - Efficient Real-time Refinement of Language Model Text Generation [65.1937138219008]
大規模言語モデル(LLM)は、幅広い自然言語タスクにおいて顕著な性能を示している。
重要な課題は、時に事実的に誤った答えを生じさせることである。
本稿では,LLM出力の検証と改善の効率化を目的とした新しい手法であるStreaming-VRを提案する。
論文 参考訳(メタデータ) (2025-01-14T03:59:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。