論文の概要: COEVO: Co-Evolutionary Framework for Joint Functional Correctness and PPA Optimization in LLM-Based RTL Generation
- arxiv url: http://arxiv.org/abs/2604.15001v2
- Date: Fri, 17 Apr 2026 09:58:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 13:38:49.402632
- Title: COEVO: Co-Evolutionary Framework for Joint Functional Correctness and PPA Optimization in LLM-Based RTL Generation
- Title(参考訳): COEVO:LLMベースのRTL生成における共同機能補正とPPA最適化のための共進化的フレームワーク
- Authors: Heng Ping, Peiyu Zhang, Shixuan Li, Wei Yang, Anzhe Cheng, Shukai Duan, Xiaole Zhang, Paul Bogdan,
- Abstract要約: COEVOは、単一の進化ループ内で正確性とPPA最適化を統合する、共進化的なフレームワークである。
COEVOは、拡張テストベンチによって実現される領域、遅延、パワーと並行して、連続した共最適化次元として正しさを定式化する。
VerilogEval 2.0 と RTLLM 2.0 で評価され、COEVO は GPT-5.4-mini で97.5% と 94.5% Pass@1 を達成した。
- 参考スコア(独自算出の注目度): 13.387204340085944
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM-based RTL code generation methods increasingly target both functional correctness and PPA quality, yet existing approaches universally decouple the two objectives, optimizing PPA only after correctness is fully achieved. Whether through sequential multi-agent pipelines, evolutionary search with binary correctness gates, or hierarchical reward dependencies, partially correct but architecturally promising candidates are systematically discarded. Moreover, existing methods reduce the multi-objective PPA space to a single scalar fitness, obscuring the trade-offs among area, delay, and power. To address these limitations, we propose COEVO, a co-evolutionary framework that unifies correctness and PPA optimization within a single evolutionary loop. COEVO formulates correctness as a continuous co-optimization dimension alongside area, delay, and power, enabled by an enhanced testbench that provides fine-grained scoring and detailed diagnostic feedback. An adaptive correctness gate with annealing allows PPA-promising but partially correct candidates to guide the search toward jointly optimal solutions. To preserve the full PPA trade-off structure, COEVO employs four-dimensional Pareto-based non-dominated sorting with configurable intra-level sorting, replacing scalar fitness without manual weight tuning. Evaluated on VerilogEval 2.0 and RTLLM 2.0, COEVO achieves 97.5\% and 94.5\% Pass@1 with GPT-5.4-mini, surpassing all agentic baselines across four LLM backbones, while attaining the best PPA on 43 out of 49 synthesizable RTLLM designs.
- Abstract(参考訳): LLMベースのRTLコード生成手法は、機能的正当性とPPAの品質の両方を目標としているが、既存のアプローチでは2つの目的を普遍的に分離し、PPAの正当性を完全に達成した後のみ最適化する。
シーケンシャルなマルチエージェントパイプライン、バイナリの正当性ゲートによる進化的探索、階層的な報酬依存などを通じても、部分的には正しいがアーキテクチャ上有望な候補は体系的に破棄される。
さらに、既存の手法は、多目的PPA空間を単一のスカラー適合性に還元し、領域、遅延、パワー間のトレードオフを隠蔽する。
このような制約に対処するため,単一進化ループ内での正確性とPPA最適化を統一する共進化的フレームワークであるCOEVOを提案する。
COEVOは、詳細なスコアリングと詳細な診断フィードバックを提供する拡張テストベンチによって実現された、領域、遅延、パワーと並行して連続した最適化次元として正しさを定式化する。
アニールによる適応的正当性ゲートは、PPAをプロミジングするが部分的に正しければ、探索を最適解へ導くことができる。
完全なPPAトレードオフ構造を維持するため、COEVOは4次元のParetoベースの非支配的なソートと構成可能なレベルソートを採用し、手動の重量調整なしでスカラーフィットネスを置き換える。
VerilogEval 2.0 と RTLLM 2.0 で評価され、COEVO は GPT-5.4-mini で 97.5\% と 94.5\% Pass@1 を達成し、4つの LLM バックボーンで全てのエージェントベースラインを上回り、49 の合成可能な RTLLM 設計のうち43 で最高の PPA を達成する。
関連論文リスト
- POET: Power-Oriented Evolutionary Tuning for LLM-Based RTL PPA Optimization [15.350025051608064]
両課題に対処するフレームワークであるPOET(Power-Oriented Evolutionary Tuning)を提案する。
機能的正確性のために、POETは差分テストベースのテストベンチ生成パイプラインを導入し、オリジナルの設計を機能的設計として扱う。
PPA最適化のために、POETは、非支配的なソート、パワーファーストのイントラレベルランキング、および比例的サバイバルセレクションを備えたLLM駆動の進化メカニズムを採用している。
論文 参考訳(メタデータ) (2026-03-19T03:19:32Z) - GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization [133.27496265096445]
我々は,グループ相対的政策最適化を,その適合性を検討することなく,マルチリワード設定で適用する方法を示す。
次に、これらの問題を解決するための新しい政策最適化手法であるグループ報酬分離正規化政策最適化(GDPO)を紹介する。
GDPOはGRPOを一貫して上回り、マルチリワード強化学習最適化の有効性と一般化性を示す。
論文 参考訳(メタデータ) (2026-01-08T18:59:24Z) - REvolution: An Evolutionary Framework for RTL Generation driven by Large Language Models [2.127921199213507]
LLM(Large Language Models)は、レジスター-トランスファーレベル(RTL)コード生成に使用される。
本稿では,進化計算(EC)とLLMを組み合わせて自動RTL生成と最適化を行うフレームワークであるRevolutionを紹介する。
論文 参考訳(メタデータ) (2025-10-24T12:50:35Z) - Single-stream Policy Optimization [21.214853668053234]
SPO(Single-stream Policy Optimization)を導入する。
SPOはグループ単位のベースラインを永続的なKL適応値トラッカーに置き換え、バッチ全体にわたってメリットを標準化する。
グループフリーであるため、SPOはより高いスループットと、長い水平またはツール統合された設定で効果的にスケールすることができる。
論文 参考訳(メタデータ) (2025-09-16T16:39:11Z) - LLM4CMO: Large Language Model-aided Algorithm Design for Constrained Multiobjective Optimization [54.35609820607923]
大規模言語モデル(LLM)は、アルゴリズム設計を支援する新しい機会を提供する。
LLM4CMOは,2つの人口構成をもつ2段階のフレームワークをベースとした新しいCMOEAである。
LLMは複雑な進化最適化アルゴリズムの開発において効率的な共同設計者として機能する。
論文 参考訳(メタデータ) (2025-08-16T02:00:57Z) - Large language models as uncertainty-calibrated optimizers for experimental discovery [4.968931211284832]
本稿では,従来の最適化手法の不確実性を考慮した言語モデルのトレーニングにより,自然言語インタフェースによる信頼度向上が実現可能であることを示す。
提案手法は, 高収率反応条件の発見率を24%から43%にほぼ倍増させる。
論文 参考訳(メタデータ) (2025-04-08T17:59:57Z) - REBEL: Reinforcement Learning via Regressing Relative Rewards [59.68420022466047]
生成モデルの時代における最小限のRLアルゴリズムであるREBELを提案する。
理論的には、自然ポリシーグラディエントのような基本的なRLアルゴリズムはREBELの変種と見なすことができる。
我々はREBELが言語モデリングと画像生成に一貫したアプローチを提供し、PPOやDPOとより強くあるいは類似した性能を実現することを発見した。
論文 参考訳(メタデータ) (2024-04-25T17:20:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。