論文の概要: SwiftCTS: Fast Cross-Design Prediction and Pareto Optimization of Clock Tree Metrics via Few-Shot Calibration
- arxiv url: http://arxiv.org/abs/2606.11348v1
- Date: Tue, 09 Jun 2026 18:25:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.137987
- Title: SwiftCTS: Fast Cross-Design Prediction and Pareto Optimization of Clock Tree Metrics via Few-Shot Calibration
- Title(参考訳): SwiftCTS: Few-Shotキャリブレーションによるクロックツリーメトリックの高速クロスデザイン予測とパレート最適化
- Authors: Barsat Khadka, Kawsher Roxy, Md Rubel Ahmed,
- Abstract要約: クロックツリー合成(CTS)は、物理設計フローにおける計算コストの高い段階である。
我々は、両方の制限に同時に対処する物理インフォームドサロゲートフレームワークであるSwiftCTSを紹介する。
スウィフトCTSは、軽量で物理地上の統計機能と勾配ブーイングされたアンサンブルを結合することにより、CPU上で5秒未満でトレーニングし、GPUサポートなしでミリ秒未満で配信する。
- 参考スコア(独自算出の注目度): 0.3670422696827525
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clock Tree Synthesis (CTS) is a computationally expensive stage in the physical design flow, requiring iterative EDA tool invocations to navigate a vast configuration space for optimal power, wirelength, and timing skew. Existing machine learning approaches require computationally expensive retraining or fine-tuning cycles to adapt to unseen macro architectures and are architecturally mismatched to the millions of evaluations demanded by exhaustive combinatorial search. We present SwiftCTS, a physics-informed surrogate framework that addresses both limitations simultaneously. By coupling lightweight, physics-grounded statistical features with gradient-boosted ensembles, SwiftCTS trains in under five seconds on a CPU and delivers sub-millisecond inference without GPU support. To handle out-of-distribution (OOD) designs without retraining or fine-tuning, we introduce a K-shot multiplicative calibration mechanism that anchors predictions to just one or two physical reference runs, reducing power prediction error from 24.5\% to 3.3\% and wirelength error from 56.6\% to under 1\% on unseen macros. Integrating this engine with an evolutionary optimizer, SwiftCTS evaluates 100,000 CTS configurations in under ten seconds, yielding Pareto-optimal frontiers that are physically validated within the OpenROAD flow. Closed-loop validation confirms prediction errors below 0.5\% for power and wirelength, and timing skew predictions within five picoseconds on an OOD benchmark, consistently outperforming default tool heuristics across all target metrics. Code publicly available at: \href{https://anonymous.4open.science/r/SwiftCTS-7E6E}{https://github.com/BarsatKhadka/SwiftCTS}
- Abstract(参考訳): クロックツリー合成(CTS)は、物理設計フローにおける計算コストのかかる段階であり、最適電力、ワイヤ長、タイミングスキューのために巨大な構成空間をナビゲートするために、反復EDAツールの実行を必要とする。
既存の機械学習アプローチでは、目に見えないマクロアーキテクチャに適応するために計算コストのかかるリトレーニングや微調整サイクルが必要であり、徹底的な組合せ探索によって要求される数百万の評価にアーキテクチャ的に不適合である。
我々は、両方の制限に同時に対処する物理インフォームドサロゲートフレームワークであるSwiftCTSを紹介する。
スウィフトCTSは、軽量で物理地上の統計機能と勾配ブーイングされたアンサンブルを結合することにより、CPU上で5秒未満でトレーニングし、GPUサポートなしでミリ秒以下の推論を提供する。
再トレーニングや微調整をせずにOOD(out-of-distriion)設計に対処するため、Kショット乗算校正機構を導入し、1つまたは2つの物理参照実行に予測を固定し、電力予測誤差を24.5\%から3.3\%、ワイヤ長誤差を56.6\%から1\%に削減する。
このエンジンと進化的オプティマイザを統合することで、SwiftCTSは10万のCTS構成を10秒未満で評価し、OpenROADフロー内で物理的に検証されるパレート最適化フロンティアを生成する。
クローズドループ検証は、パワーとワイヤ長の0.5倍未満の予測エラーを確認し、OODベンチマークの5ピコ秒以内のタイミングスキュー予測は、目標とするすべてのメトリクスのデフォルトツールヒューリスティックを一貫して上回る。
公開コード: \href{https://anonymous.4open.science/r/SwiftCTS-7E6E}{https://github.com/BarsatKhadka/SwiftCTS}
関連論文リスト
- LiQSS: Post-Transformer Linear Quantum-Inspired State-Space Tensor Networks for Real-Time 6G [85.58816960936069]
Sixth-Generation (6G) Open Radio Access Networks (O-RAN) における能動的およびエージェント的制御は、厳密なニアタイム(Near-RT)レイテンシと計算制約の下で制御グレードの予測を必要とする。
本稿では,効率的な無線テレメトリ予測のための変圧器後パラダイムについて検討する。
本稿では、自己アテンションを安定な状態空間動的カーネルに置き換える量子インスピレーション付き状態空間テンソルネットワークを提案する。
論文 参考訳(メタデータ) (2026-01-18T12:08:38Z) - LUT-Compiled Kolmogorov-Arnold Networks for Lightweight DoS Detection on IoT Edge Devices [20.271194684947282]
Kolmogorov-Arnold Networks (KAN) は、MLP(Multi-Layer Perceptrons)に代わるコンパクトな代替品を提供する。
B-spline評価は、レイテンシクリティカルなIoTアプリケーションには適さない、大幅な計算オーバーヘッドをもたらす。
本稿では,高価なスプライン計算を事前計算した量子テーブルに置き換えるルックアップテーブル(LUT)コンパイルパイプラインを提案する。
論文 参考訳(メタデータ) (2026-01-12T22:32:18Z) - INC: An Indirect Neural Corrector for Auto-Regressive Hybrid PDE Solvers [61.84396402100827]
本稿では,学習した補正を支配方程式に統合する間接ニューラルコレクタ(mathrmINC$)を提案する。
$mathrmINC$は、$t-1 + L$の順番でエラー増幅を減らし、$t$はタイムステップ、$L$はリプシッツ定数である。
大規模なベンチマークで$mathrmINC$をテストし、1Dカオスシステムから3D乱流まで、多くの異なる解法、神経バックボーン、テストケースをカバーした。
論文 参考訳(メタデータ) (2025-11-16T20:14:28Z) - FTT-GRU: A Hybrid Fast Temporal Transformer with GRU for Remaining Useful Life Prediction [0.6421270655703623]
本稿では,Fast Temporal Transformer (FTT) とゲートリカレントユニット (GRU) を組み合わせ,逐次モデリングを行うハイブリッドモデル FTT-GRU を提案する。
NASA CMAPSS FD001では、FTT-GRUはRMSE 30.76、MAE 18.97、R2=0.45$に達し、バッチ=1.12msのCPUレイテンシを持つ。
これらの結果は,コンパクトなTransformer-RNNハイブリッドがCMAPSS上で高精度かつ効率的なRUL予測を実現することを示す。
論文 参考訳(メタデータ) (2025-11-01T14:02:03Z) - Sparsity-Constraint Optimization via Splicing Iteration [1.3622424109977902]
我々は sPlicing itEration (SCOPE) を用いたスペーサリティ制約最適化アルゴリズムを開発した。
SCOPEはパラメータをチューニングせずに効率的に収束する。
SCOPEを用いて2次最適化を解き、スパース分類器を学習し、バイナリ変数のスパースマルコフネットワークを復元する。
C++実装に基づいたオープンソースのPythonパッケージskscopeがGitHubで公開されている。
論文 参考訳(メタデータ) (2024-06-17T18:34:51Z) - SpacTor-T5: Pre-training T5 Models with Span Corruption and Replaced
Token Detection [49.43407207482008]
SpacTorは、スパン汚職(SC)とトークン置換検出(RTD)を組み合わせたハイブリッド目標からなる新しいトレーニング手順である。
各種NLPタスクにおけるエンコーダ・デコーダアーキテクチャ(T5)による実験では、SpacTor-T5は標準のSCプリトレーニングと同じダウンストリーム性能が得られる。
論文 参考訳(メタデータ) (2024-01-24T00:36:13Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Accelerating Distributed K-FAC with Smart Parallelism of Computing and
Communication Tasks [13.552262050816616]
Kronecker-Factored Approximate Curvature (KFAC)は、深層モデルのトレーニングにおいて最も効率的な近似アルゴリズムの1つである。
しかし、KFACでモデルをトレーニングするためにGPUクラスタを活用すると、大規模な計算が発生すると同時に、イテレーション毎に余分な通信が導入される。
そこで我々は,D-KFACを提案する。
論文 参考訳(メタデータ) (2021-07-14T08:01:07Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。