論文の概要: AttentionCap: Transformer Based Capacitance Matrix Learning Toward Full-Chip Extraction
- arxiv url: http://arxiv.org/abs/2606.08161v1
- Date: Sat, 06 Jun 2026 13:20:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.88661
- Title: AttentionCap: Transformer Based Capacitance Matrix Learning Toward Full-Chip Extraction
- Title(参考訳): AttentionCap: フルチップ抽出に向けた変圧器型容量行列学習
- Authors: Jiechen Huang, Hector R. Rodriguez, Dingcheng Yang, Zuochang Ye, Yibo Lin, Wenjian Yu,
- Abstract要約: AttentionCapは、容量行列学習のためのカスタマイズされたTransformerである。
0.67%/3.99%の自己/カップリング・キャパシタンスエラーを、マルチ層およびマルチノード設定下で未確認の実際の設計で達成した。
事前トレーニングされたAttentionCapは、正確に5Kサンプルと4K微調整ステップしか持たない未確認ノードに転送する。
- 参考スコア(独自算出の注目度): 8.146803888982884
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As capacitance extraction accuracy of rule-based pattern matching becomes difficult to sustain at advanced nodes, a growing trend emerges to develop deep-learning-based 2D capacitance models. However, existing MLP- and CNN-based methods constrain their input to fixed metal-layer combinations in a specific process node, limiting their usability in practice. Recognizing the inherent similarity between capacitance matrix and the prevailing attention mechanism, we propose AttentionCap, a customized Transformer for capacitance matrix learning, with a Gram representation framework, a physics-aligned symmetric-attention output layer, and a novel normalized Laplacian loss. We also introduce a process-node embedding to enable multi-node learning. Trained on synthetic data, AttentionCap attains 0.67\%/3.99\% self/coupling-capacitance error on unseen real designs under a multi-layer and multi-node setting, surpassing the CNN-Cap baseline with 4.6$\times$/5.7$\times$ lower self/coupling error and 192$\times$ faster inference speed. A pretrained AttentionCap accurately transfers to an unseen node with only 5K samples and 4K finetuning steps. With sufficient accuracy on unseen real designs and strong transferability to new process nodes, AttentionCap offers highly practical value for modern EDA workflows. Code and data are available at https://github.com/THU-numbda/AttentionCap.
- Abstract(参考訳): 規則に基づくパターンマッチングのキャパシタンス抽出精度は、先進ノードでの維持が困難になるため、ディープラーニングベースの2Dキャパシタンスモデルの開発が進む傾向にある。
しかし、既存のMLPおよびCNNベースの手法は、特定のプロセスノードにおける固定された金属層の組み合わせに入力を制限し、実際にの使用性を制限する。
本稿では,キャパシタンスマトリクスと注目機構の類似性を認識し,キャパシタンスマトリクス学習のためのカスタマイズされたトランスフォーマーであるAttentionCapを提案する。
マルチノード学習を可能にするプロセスノード埋め込みも導入する。
合成データに基づいてトレーニングされたAttentionCapは、マルチ層およびマルチノード設定下での未確認の実際の設計に対して0.67\%/3.99\%の自己/結合容量エラーを達成し、CNN-Capベースラインを4.6$\times$/5.7$\times$低い自己/結合エラーと192$\times$高速推論速度で上回った。
事前トレーニングされたAttentionCapは、正確に5Kサンプルと4K微調整ステップしか持たない未確認ノードに転送する。
目に見えない実際の設計と、新しいプロセスノードへの強い転送性について十分な精度で、AttentionCapはモダンなEDAワークフローに非常に実用的な価値を提供する。
コードとデータはhttps://github.com/THU-numbda/AttentionCapで公開されている。
関連論文リスト
- A Comparative Study of Encoding Strategies for Quantum Convolutional Neural Networks [0.0]
量子畳み込みニューラルネットワーク(QCNN)は、短期量子機械学習のための有望なアーキテクチャを提供する。
しかし、古典的なデータを扱うQCNNは、入力を量子状態に埋め込むエンコーディングスキームに頼らなければならない。
この研究は、アングル、振幅、ハイブリッド位相/角度スキームの3つの代表符号化の実装レベル比較を示す。
論文 参考訳(メタデータ) (2025-12-14T01:31:16Z) - DeepRWCap: Neural-Guided Random-Walk Capacitance Solver for IC Design [3.790585344640331]
本稿では、機械学習誘導型ランダムウォークソルバであるDeepRWCapを紹介し、ウォークの各ステップを導くのに必要な遷移量を予測する。
DeepRWCapは、2段階のニューラルアーキテクチャを使用して、構造化された出力を、立方体面上の対面分布と空間カーネルに分解する。
論文 参考訳(メタデータ) (2025-11-10T08:25:13Z) - What Layers When: Learning to Skip Compute in LLMs with Residual Gates [66.23658560048241]
GateSkipは、デコーダのみのLMにおけるトークンワイド層スキップを可能にする残差ストリームゲーティング機構である。
各Attention/MLPブランチは、残ストリームに再入力する前に、ブランチの出力を凝縮するシグモイドリニアゲートを備えている。
論文 参考訳(メタデータ) (2025-10-13T16:31:50Z) - CARE Transformer: Mobile-Friendly Linear Visual Transformer via Decoupled Dual Interaction [77.8576094863446]
本稿では,新しいdetextbfCoupled dutextbfAl-interactive lineatextbfR atttextbfEntion (CARE) 機構を提案する。
まず,非対称な特徴分離戦略を提案し,非対称的に学習プロセスを局所帰納バイアスと長距離依存に分解する。
分離学習方式を採用し,特徴間の相補性を完全に活用することにより,高い効率性と精度を両立させることができる。
論文 参考訳(メタデータ) (2024-11-25T07:56:13Z) - Unveiling Induction Heads: Provable Training Dynamics and Feature Learning in Transformers [54.20763128054692]
我々は,2層変換器が$n$-gramのマルコフ連鎖データ上でICLを実行するためにどのように訓練されているかを検討する。
クロスエントロピー ICL 損失に対する勾配流が極限モデルに収束することを証明する。
論文 参考訳(メタデータ) (2024-09-09T18:10:26Z) - Adaptive Computation Modules: Granular Conditional Computation For Efficient Inference [12.371152982808914]
本稿では,適応計算モジュール (Adaptive Computation Module, ACM) を提案する。
ACMは、先行する学習者の出力を段階的に洗練する学習者列から構成される。追加のゲーティング機構は、各トークンに対して最適な学習者数を決定する。
コンピュータビジョンおよび音声認識におけるトランスフォーマーモデルの評価により,ACMを用いた置換層は,広範囲のユーザ定義予算において,下流の精度を低下させることなく,推論コストを大幅に低減することを示した。
論文 参考訳(メタデータ) (2023-12-15T20:39:43Z) - Automatic Rule Induction for Efficient Semi-Supervised Learning [56.91428251227253]
半教師付き学習は、少量のラベル付きデータからNLPモデルを一般化できることを約束している。
事前訓練されたトランスモデルはブラックボックス相関エンジンとして機能し、説明が困難であり、時には信頼性に欠ける振る舞いをする。
本稿では,これらの課題に,簡易かつ汎用的なフレームワークであるAutomatic Rule Injection (ARI) を用いて対処することを提案する。
論文 参考訳(メタデータ) (2022-05-18T16:50:20Z) - AdaCap: Adaptive Capacity control for Feed-Forward Neural Networks [0.0]
Adaptive Capacity (AdaCap)は、フィードフォワードニューラルネットワーク(FFNN)のトレーニングスキームである。
AdaCapは2つの新しい材料、Muddling labels for Regularization (MLR) LosとTikhonovオペレーターのトレーニングスキームの組み合わせである。
論文 参考訳(メタデータ) (2022-05-09T17:55:02Z) - CNN-Cap: Effective Convolutional Neural Network Based Capacitance Models
for Full-Chip Parasitic Extraction [4.08653138103384]
本稿では,畳み込みニューラルネットワークに基づくキャパシタンスモデルの構築に有効な手法を提案する。
CNN-Capは、GPUサーバ上の2次元フィールドソルバよりも4000倍高速で動作する。
論文 参考訳(メタデータ) (2021-07-14T07:14:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。