論文の概要: Dr.~RTL: Autonomous Agentic RTL Optimization through Tool-Grounded Self-Improvement
- arxiv url: http://arxiv.org/abs/2604.14989v1
- Date: Thu, 16 Apr 2026 13:18:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.914955
- Title: Dr.~RTL: Autonomous Agentic RTL Optimization through Tool-Grounded Self-Improvement
- Title(参考訳): Dr.〜RTL:ツールを用いた自己改善による自律エージェントRTL最適化
- Authors: Wenji Fang, Yao Lu, Shang Liu, Jing Wang, Ziyan Guo, Junxian He, Fengbin Tu, Zhiyao Xie,
- Abstract要約: 本稿では,リアルな評価環境におけるRTLタイミング最適化のためのエージェントフレームワークであるRTLについて述べる。
RTLはWNS/TNSの平均改善率を21%/17%で達成し, 業界主導の合成ツールに比べて6%の面積削減を実現した。
- 参考スコア(独自算出の注目度): 27.092208212388908
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent advances in large language models (LLMs) have sparked growing interest in automatic RTL optimization for better performance, power, and area (PPA). However, existing methods are still far from realistic RTL optimization. Their evaluation settings are often unrealistic: they are tested on manually degraded, small-scale RTL designs and rely on weak open-source tools. Their optimization methods are also limited, relying on coarse design-level feedback and simple pre-defined rewriting rules. To address these limitations, we present Dr. RTL, an agentic framework for RTL timing optimization in a realistic evaluation environment, with continual self-improvement through reusable optimization skills. We establish a realistic evaluation setting with more challenging RTL designs and an industrial EDA workflow. Within this setting, Dr. RTL performs closed-loop optimization through a multi-agent framework for critical-path analysis, parallel RTL rewriting, and tool-based evaluation. We further introduce group-relative skill learning, which compares parallel RTL rewrites and distills the optimization experience into an interpretable skill library. Currently, this library contains 47 pattern--strategy entries for cross-design reuse to improve PPA and accelerate convergence, and it can continue evolving over time. Evaluated on 20 real-world RTL designs, Dr. RTL achieves average WNS/TNS improvements of 21\%/17\% with a 6\% area reduction over the industry-leading commercial synthesis tool.
- Abstract(参考訳): 大規模言語モデル(LLM)の最近の進歩は、パフォーマンス、パワー、面積(PPA)を改善するために自動RTL最適化への関心が高まっている。
しかし、既存の手法は現実的なRTL最適化には程遠い。
彼らの評価設定は、しばしば非現実的であり、手動で分解された小さなRTL設計でテストされ、弱いオープンソースツールに依存している。
それらの最適化手法も制限されており、粗い設計レベルのフィードバックと単純な事前定義された書き換え規則に依存している。
これらの制約に対処するため,本研究では,RTLタイミング最適化のためのエージェントフレームワークであるDr. RTLを提案する。
より挑戦的なRTL設計と産業用EDAワークフローによる現実的な評価設定を確立する。
この設定の中で、RTLは、クリティカルパス分析、並列RTL書き換え、ツールベースの評価のためのマルチエージェントフレームワークを通じてクローズドループ最適化を行う。
さらに、並列RTL書き換えを比較し、最適化経験を解釈可能なスキルライブラリに蒸留するグループ相対スキル学習を導入する。
現在、このライブラリには、PPAを改善し、収束を加速するクロスデザイン再利用のための47のパターンストラテジーエントリが含まれており、時間とともに進化し続けることができる。
RTLは実世界の20のRTL設計に基づいて,業界主導の商用合成ツールに対して,平均的なWAS/TNS改善を21.%/17.%で達成し,6.%の面積削減を実現している。
関連論文リスト
- Execution-Verified Reinforcement Learning for Optimization Modeling [49.171122807323634]
実行検証学習フレームワークは、数学的プログラミング解法を決定論的で対話的な検証器として扱う。
NL4OPT, MAMO, IndustryOR, OptiBenchをグロビ, OR-Tools, COPTで行った実験では, EVOMがプロセス管理SFTに適合または優れていた。
論文 参考訳(メタデータ) (2026-04-01T03:39:11Z) - VeriAgent: A Tool-Integrated Multi-Agent System with Evolving Memory for PPA-Aware RTL Code Generation [52.43796056267479]
高品質なベリログコード生成のためのPPA対応ツール統合マルチエージェントフレームワークを提案する。
当社のフレームワークでは,EDAツールをtextitProgrammer Agent, textitCorrectness Agent, textitPPA Agentで構成されるクローズドループワークフローに明示的に組み込んでいる。
モデル再トレーニングなしに継続的な改善をサポートするために,構造化メモリノードに最適化エクスペリエンスを外部化するtextitEvolved Memory Mechanismを導入する。
論文 参考訳(メタデータ) (2026-03-18T11:25:40Z) - Understanding by Reconstruction: Reversing the Software Development Process for LLM Pretraining [66.89012795621349]
大規模言語モデル(LLM)は、複雑なソフトウェア工学に必要な、深く、長期にわたる推論に苦しむことが多い。
本稿では,再構築による理解という,新しいパラダイムを提案する。
マルチエージェントシミュレーションを用いて潜在エージェント軌道を合成するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-11T09:23:20Z) - A New Benchmark for the Appropriate Evaluation of RTL Code Optimization [11.115027718178759]
この研究は、RTL最適化における大規模言語モデル(LLM)の能力を評価するベンチマークであるRTL-OPTを導入する。
各タスクは、業界で実証された最適化パターンを反映した、一対のRTLコード、準最適バージョン、人間に最適化された参照を提供する。
さらに、RTL-OPTは自動評価フレームワークを統合し、機能的正当性を検証し、改善を定量化する。
論文 参考訳(メタデータ) (2026-01-05T03:47:26Z) - QiMeng-NeuComBack: Self-Evolving Translation from IR to Assembly Code [52.66657751895655]
大規模言語モデル(LLM)は、ニューラルコンパイルという魅力的な新しいパラダイムを提供する。
本稿では,IR-to-assemblyコンパイル用に設計された新しいベンチマークデータセットであるNeuComBackを紹介する。
LLMの内部的なプロンプト戦略を進化させる自己進化的プロンプト最適化法を提案する。
論文 参考訳(メタデータ) (2025-11-03T03:20:26Z) - REvolution: An Evolutionary Framework for RTL Generation driven by Large Language Models [2.127921199213507]
LLM(Large Language Models)は、レジスター-トランスファーレベル(RTL)コード生成に使用される。
本稿では,進化計算(EC)とLLMを組み合わせて自動RTL生成と最適化を行うフレームワークであるRevolutionを紹介する。
論文 参考訳(メタデータ) (2025-10-24T12:50:35Z) - Tool-R1: Sample-Efficient Reinforcement Learning for Agentic Tool Use [50.02614257515131]
大規模言語モデル(LLM)は、言語理解と推論において強力な能力を示している。
本稿では,LLMの汎用的,構成的,多段階的なツール使用を可能にする強化学習フレームワークであるTool-R1を提案する。
論文 参考訳(メタデータ) (2025-09-16T09:22:21Z) - Rethinking LLM-Based RTL Code Optimization Via Timing Logic Metamorphosis [3.3369784425736606]
RTL最適化の特定の領域に対応する4つのサブセットからなるRTL最適化評価のための新しいベンチマークを提案する。
LLMは論理演算を効果的に最適化し、既存のコンパイラベースのメソッドより優れている。
LLMは、複雑なタイミング論理を持つRTLコード上の既存のコンパイラベースのメソッドよりもパフォーマンスが良くない。
論文 参考訳(メタデータ) (2025-07-22T17:57:02Z) - ChipSeek-R1: Generating Human-Surpassing RTL with LLM via Hierarchical Reward-Driven Reinforcement Learning [32.11086992218369]
ChipSeek-R1は、大規模な言語モデルのための階層的な報酬駆動強化学習フレームワークである。
関数的正当性とPPA最適化の両方のRTLコードを生成する。
RTLLMのベンチマークでは、ChipSeek-R1はオリジナルの人間の書いたコードのPPAメトリクスを超える27のRTL設計を作成した。
論文 参考訳(メタデータ) (2025-07-07T08:08:20Z) - AIvril: AI-Driven RTL Generation With Verification In-The-Loop [0.7831852829409273]
LLM(Large Language Models)は、複雑な自然言語処理タスクを実行できる計算モデルである。
本稿では,RTL対応LLMの精度と信頼性を高めるためのフレームワークであるAIvrilを紹介する。
論文 参考訳(メタデータ) (2024-09-03T15:07:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。