論文の概要: VeriPilot: An LLM-Powered Verilog Debugging Framework
- arxiv url: http://arxiv.org/abs/2606.23759v1
- Date: Mon, 22 Jun 2026 09:15:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.598826
- Title: VeriPilot: An LLM-Powered Verilog Debugging Framework
- Title(参考訳): VeriPilot: LLMベースのVerilogデバッグフレームワーク
- Authors: Yihan Wang, Cheng Liu, Jiazheng Zhang, Lei Zhang, Long Cheng, Xiaowei Li, Huawei Li,
- Abstract要約: We propose VeriPilot, a framework to enable fine-fine bug localization and repair in Verilog design。
VeriPilotは、Verilog設計とそれに対応する黄金モデルの間に内部変数のセマンティクスを整合させることで、出力レベルの比較を越えている。
その後、静的解析から派生した制御データフローグラフ(CDFG)を用いてステップバイステップの信号追跡を行う。
- 参考スコア(独自算出の注目度): 28.151772567640354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Verilog debugging remains one of the most time-consuming stages in digital circuit design. Recent advances in Large Language Models (LLMs) have enabled automated debugging; however, most existing approaches rely solely on test outputs and compiler feedback in an end-to-end manner, limiting their effectiveness on complex bugs. A key challenge is that the root cause of an error may be far removed from its observable outputs, making it difficult for LLMs to trace long dependency chains in code. This challenge is further exacerbated in large codebases, where long context lengths hinder efficient reasoning. To address these limitations, we propose VeriPilot, an LLM-powered debugging framework that leverages golden reference models to enable fine-grained bug localization and repair. VeriPilot goes beyond output-level comparison by aligning internal variable semantics between the Verilog design and its corresponding golden model through LLM-based analysis. It then performs step-by-step signal tracing using Control-Data-Flow Graphs (CDFGs) derived from static analysis, identifying a minimal set of suspicious code regions along with their correct counterparts from the golden model. These structured insights are subsequently provided to the LLM to guide reasoning and automated code repair. Experimental results on the Comprehensive Verilog Design Problems (CVDP) benchmark from NVIDIA demonstrate that VeriPilot improves the repair success rate of GPT-4o from 54.3\% to 85.71\%, significantly enhancing both bug localization accuracy and repair effectiveness for complex Verilog designs. The source code and benchmark are publicly available at Github https://github.com/YihanWn/VeriPilot.git.
- Abstract(参考訳): Verilogデバッギングはデジタル回路設計において最も時間がかかる段階の1つである。
近年のLLM(Large Language Models)の進歩により、自動デバッグが可能になったが、既存のほとんどのアプローチは、テスト出力とコンパイラフィードバックをエンドツーエンドにのみ依存し、複雑なバグに対する有効性を制限している。
重要な課題は、エラーの根本原因が観測可能な出力から遠く離れてしまう可能性があることだ。
この課題は、長いコンテキスト長が効率的な推論を妨げる大規模なコードベースでさらに悪化している。
これらの制限に対処するために,金の参照モデルを活用し,きめ細かいバグのローカライゼーションと修復を可能にする,LLMベースのデバッグフレームワークであるVeriPilotを提案する。
VeriPilotは出力レベルの比較を超えて、Verilogの設計とそれに対応する黄金モデルの間の内部変数のセマンティクスをLCMベースの分析によって整列する。
次に、静的解析から派生した制御データフローグラフ(CDFG)を使用してステップバイステップの信号追跡を行い、ゴールデンモデルから正しい値とともに、疑わしいコード領域の最小セットを特定する。
これらの構造化された洞察はLLMに提供され、推論と自動コード修正のガイドとなる。
NVIDIA の Comprehensive Verilog Design Problems (CVDP) ベンチマークによる実験の結果、VeriPilot は GPT-4o の修理成功率を 54.3\% から 85.71\% に改善し、複雑な Verilog Design のバグローカライゼーション精度と修復効率を著しく向上することを示した。
ソースコードとベンチマークはGithub https://github.com/YihanWn/VeriPilot.gitで公開されている。
関連論文リスト
- InspectCoder: Dynamic Analysis-Enabled Self Repair through interactive LLM-Debugger Collaboration [71.18377595277018]
大きな言語モデル(LLM)は、診断が難しい複雑なロジックエラーを伴うバグの多いコードを生成することが多い。
対話型デバッガ制御による動的解析を LLM に委ねる初のエージェントプログラム修復システムである InspectCoder を提案する。
論文 参考訳(メタデータ) (2025-10-21T06:26:29Z) - FVDebug: An LLM-Driven Debugging Assistant for Automated Root Cause Analysis of Formal Verification Failures [8.530369312832084]
障害トレースを実行可能な洞察に変換するインテリジェントなシステムであるFV Debugを紹介します。
提案手法は,(1)非巡回グラフに障害トレースを構造化する因果グラフ合成,(2)不審なノードの特定を促すバッチ型Large Language Model (LLM)解析を用いたグラフスキャナ,(3)高レベルの因果説明を生成するためのエージェント的物語探索を活用したInsight Roverを特徴とする。
論文 参考訳(メタデータ) (2025-09-16T20:22:10Z) - VeriDebug: A Unified LLM for Verilog Debugging via Contrastive Embedding and Guided Correction [36.69082579950107]
コントラスト表現とガイド付き修正機能を統合するアプローチであるVeri Debugを提案する。
我々のモデルは、既存のオープンソースSOTA 11.3から大幅に改善されたバグ修正(Acc1)において64.7の精度を実現している。
この性能はオープンソースの代替品より優れているだけでなく、GPT-3.5-turbo (36.6)のような大型のクローズドソースモデルよりも優れている。
論文 参考訳(メタデータ) (2025-04-27T04:09:48Z) - Teaching Your Models to Understand Code via Focal Preference Alignment [70.71693365502212]
既存の手法では、テストケースの成功率に基づいてn個の候補解が評価される。
このアプローチは、特定のエラーを特定するのではなく、失敗するコードブロック全体を整列するので、意味のあるエラーと訂正の関係を捉えるのに必要な粒度が欠けている。
我々は、人間の反復デバッグを模倣してコードLLMを洗練させる新しい優先順位調整フレームワークであるTarget-DPOを提案する。
論文 参考訳(メタデータ) (2025-03-04T16:56:34Z) - DebugBench: Evaluating Debugging Capability of Large Language Models [80.73121177868357]
DebugBench - LLM(Large Language Models)のベンチマーク。
C++、Java、Pythonの4つの主要なバグカテゴリと18のマイナータイプをカバーする。
ゼロショットシナリオで2つの商用および4つのオープンソースモデルを評価する。
論文 参考訳(メタデータ) (2024-01-09T15:46:38Z) - Benchmarking Large Language Models for Automated Verilog RTL Code
Generation [21.747037230069854]
有用なVerilogを生成するために,大規模言語モデル(LLM)を特徴付ける。
機能解析のためのテストベンチと,Verilogコードの構文をテストするフローからなる評価フレームワークを構築した。
その結果,LLMの微調整結果は,構文的に正しいコードを生成する能力が高いことがわかった。
論文 参考訳(メタデータ) (2022-12-13T16:34:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。