論文の概要: Verilog-Evolve: Feedback-Driven and Skill-Evolving Verilog Generation
- arxiv url: http://arxiv.org/abs/2605.26498v1
- Date: Tue, 26 May 2026 03:21:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.601408
- Title: Verilog-Evolve: Feedback-Driven and Skill-Evolving Verilog Generation
- Title(参考訳): Verilog-Evolve: フィードバック駆動とスキル進化によるVerilog生成
- Authors: Zehua Pei, Hui-Ling Zhen, Yu Zhang, Sinno Jialin Pan, Mingxuan Yuan, Bei Yu,
- Abstract要約: We present Verilog-Evolve, a feedback-driven framework for Versioned Verilog refinement and cross-session skills evolution。
各タスクに対して、Verilog-Evolveは様々なマイナー候補を生成し、機能シミュレーション、Yosys合成、ABCタイミングプロキシ、オプションGEMMメトリクスから実行可能なフィードバックで評価する。
タスク全体を改善するために、システムはモジュラースキルガイダンスを維持し、タスクとフィードバックコンテキストに従ってスキルを検索し、ログされた履歴から候補スキルを進化させる。
- 参考スコア(独自算出の注目度): 48.00513252649798
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) have improved Verilog generation from natural-language specifications, but most pipelines still treat generation as isolated sampling followed by functional checking. This is insufficient for practical RTL design, where useful Verilog must be correct, synthesizable, timing-conscious, and friendly to downstream hardware objectives. We present Verilog-Evolve, a feedback-driven framework for versioned Verilog refinement and cross-session skill evolution. For each task, Verilog-Evolve generates diverse minor candidates, evaluates them with executable feedback from functional simulation, Yosys synthesis, ABC timing proxy, and optional GEMM metrics, then promotes the best candidate into a major version under configurable scoring. To improve across tasks, the system maintains modular skill guidance, retrieves skills according to task and feedback context, and evolves candidate skills from logged histories through create/improve/skip decisions and verifier reports. Experiments on VerilogEval and mixed-precision GEMM tasks show that Verilog-Evolve improves final functional success and promotion stability while producing more downstream-friendly RTL under open-source synthesis, timing-proxy, and netlist-level GEMM objectives. Validation-gated skill evolution further improves GEMM downstream quality and achieves the best downstream score and GEMM held-out pass rate among the evaluated skill modes.
- Abstract(参考訳): 大規模言語モデル(LLM)は、自然言語仕様からVerilog生成を改善したが、ほとんどのパイプラインは分離されたサンプリングとして生成を処理し、機能的なチェックを行う。
これは実用的なRTL設計には不十分であり、有用なVerilogは正し、合成可能で、タイミングに敏感で、下流のハードウェアの目的にフレンドリでなければならない。
We present Verilog-Evolve, a feedback-driven framework for Versioned Verilog refinement and cross-session skills evolution。
各タスクに対して、Verilog-Evolveは様々なマイナー候補を生成し、機能シミュレーション、Yosys合成、ABCタイミングプロキシ、オプションGEMMメトリクスから実行可能なフィードバックで評価し、設定可能なスコアリングの下で最適な候補をメジャーバージョンに昇格させる。
タスク全体を改善するために、システムはモジュラースキルガイダンスを維持し、タスクとフィードバックのコンテキストに従ってスキルを検索し、生成/改善/スキップ決定と検証レポートを通じてログされた履歴から候補スキルを進化させる。
VerilogEvalおよび混合精度GEMMタスクの実験により、Verilog-Evolveは、オープンソース合成、タイミングプロキシ、ネットリストレベルのGEMM目標の下で、より下流フレンドリーなRTLを生成しながら、最終的な機能成功と促進安定性を改善した。
バリデーションゲートスキルの進化により、GEMM下流品質がさらに向上し、評価されたスキルモードの中で最高のダウンストリームスコアとGEMMホールドアウトパスレートを達成する。
関連論文リスト
- Veri-Sure: A Contract-Aware Multi-Agent Framework with Temporal Tracing and Formal Verification for Correct RTL Code Generation [4.723302382132762]
シリコングレードの正しさは、 (i) シミュレーション中心の評価の限られたカバレッジと信頼性、 (ii) 回帰と修復幻覚、 (iii) エージェントハンドオフ間で意図が再解釈される意味的ドリフトによってボトルネックが残っている。
エージェントの意図を整合させる設計契約を確立するマルチエージェントフレームワークであるVeri-Sureを提案する。
論文 参考訳(メタデータ) (2026-01-27T16:10:23Z) - EvoSyn: Generalizable Evolutionary Data Synthesis for Verifiable Learning [63.03672166010434]
我々は、進化的、タスクに依存しない、戦略を導いた、実行可能検証可能なデータ合成フレームワークを紹介します。
問題、多様な候補解、検証成果物を共同で合成する。
これは、人間による注釈付きチェックと戦略によるチェックの合意を強制する一貫性に基づく評価器を通じて戦略を反復的に発見する。
論文 参考訳(メタデータ) (2025-10-20T11:56:35Z) - VERIRL: Boosting the LLM-based Verilog Code Generation via Reinforcement Learning [32.974199255760944]
本稿では,Verilogコード生成に適した強化学習フレームワークを提案する。
スパース信号と雑音信号に対処するために,トレースバックに基づくRescore機構を提案する。
RL微調整中の破滅的忘れと過適合を軽減するため,サンプルバランスの重み付け戦略を導入する。
論文 参考訳(メタデータ) (2025-08-25T20:20:44Z) - On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。
推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。
本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - VeriMind: Agentic LLM for Automated Verilog Generation with a Novel Evaluation Metric [4.590930025882158]
We propose VeriMind, a agentic LLM framework for Verilog code generation。
本稿では,従来のpass@k測度とARC(Average Refinement Cycles)を組み合わせた新しい評価手法を提案する。
様々なハードウェア設計タスクの実験結果によると、我々のアプローチはpass@kメトリックで最大8.3%、pass@ARCメトリックで最大8.1%向上した。
論文 参考訳(メタデータ) (2025-03-15T23:43:06Z) - Learning to Solve and Verify: A Self-Play Framework for Code and Test Generation [69.62857948698436]
大規模言語モデル(LLM)の最近の進歩は、コーディングベンチマークのパフォーマンスを改善している。
しかし、手軽に利用できる高品質なデータの枯渇により、改善は停滞している。
本稿では,単一モデルのコードとテスト生成能力を共同で改善するセルフプレイ・ソルバ検証フレームワークであるSol-Verを提案する。
論文 参考訳(メタデータ) (2025-02-20T18:32:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。