論文の概要: Optimizing Predictive AI in Physical Design Flows with Mini Pixel Batch
Gradient Descent
- arxiv url: http://arxiv.org/abs/2402.06034v1
- Date: Thu, 8 Feb 2024 20:14:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-12 18:56:41.804320
- Title: Optimizing Predictive AI in Physical Design Flows with Mini Pixel Batch
Gradient Descent
- Title(参考訳): Mini Pixel Batch Gradient Descentを用いた物理デザインフローにおける予測AIの最適化
- Authors: Haoyu Yang and Anthony Agnesina and Haoxing Ren
- Abstract要約: MSEの平均化効果は、モデルトレーニングとデプロイメントの両方において制限をもたらすと我々は主張する。
プラグ・アンド・プレイ最適化アルゴリズムであるMPGDを提案する。
代表的ベンチマークスーツの実験は、様々な物理設計予測タスクにおけるMPGDの顕著な利点を示している。
- 参考スコア(独自算出の注目度): 5.413212114044892
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Exploding predictive AI has enabled fast yet effective evaluation and
decision-making in modern chip physical design flows. State-of-the-art
frameworks typically include the objective of minimizing the mean square error
(MSE) between the prediction and the ground truth. We argue the averaging
effect of MSE induces limitations in both model training and deployment, and
good MSE behavior does not guarantee the capability of these models to assist
physical design flows which are likely sabotaged due to a small portion of
prediction error. To address this, we propose mini-pixel batch gradient descent
(MPGD), a plug-and-play optimization algorithm that takes the most informative
entries into consideration, offering probably faster and better convergence.
Experiments on representative benchmark suits show the significant benefits of
MPGD on various physical design prediction tasks using CNN or Graph-based
models.
- Abstract(参考訳): 爆発的な予測AIは、現代のチップ物理設計フローにおいて、高速かつ効果的な評価と意思決定を可能にした。
最先端のフレームワークは通常、予測と基底真理の間の平均二乗誤差(MSE)を最小化する目的を含む。
MSEの平均化効果はモデルトレーニングと展開の両面で制限を生じさせ,MSEの優れた動作は,予測誤差の少なさにより破壊される可能性のある物理設計フローを支援するためのモデルの有効性を保証しない。
そこで本研究では,より高速かつ優れたコンバージェンスを提供する,プラグアンドプレイ最適化アルゴリズムであるミニピクセルバッチ勾配勾配(MPGD)を提案する。
代表的ベンチマークスーツの実験は、CNNやグラフベースのモデルを用いた様々な物理設計予測タスクにおけるMPGDの顕著な利点を示している。
関連論文リスト
- Cliqueformer: Model-Based Optimization with Structured Transformers [102.55764949282906]
我々は、MBOタスクの構造を学習し、経験的に改良された設計につながるモデルを開発する。
我々はCliqueformerを、高次元のブラックボックス機能から、化学・遺伝設計の現実的なタスクまで、様々なタスクで評価する。
論文 参考訳(メタデータ) (2024-10-17T00:35:47Z) - Revisiting SMoE Language Models by Evaluating Inefficiencies with Task Specific Expert Pruning [78.72226641279863]
SMOE(Sparse Mixture of Expert)モデルは、言語モデリングにおける高密度モデルに代わるスケーラブルな代替品として登場した。
本研究は,SMoEアーキテクチャの設計に関する意思決定を行うために,タスク固有のモデルプルーニングについて検討する。
適応型タスク対応プルーニング手法 UNCURL を導入し,MoE 層当たりの専門家数をオフラインで学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-02T22:35:03Z) - Optimization of DNN-based speaker verification model through efficient quantization technique [15.250677730668466]
ディープモデルの量子化は、計算コストとメモリコストの両方を削減する手段を提供する。
本研究では,話者検証モデルの定量化のための最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-12T05:03:10Z) - On Robustness and Generalization of ML-Based Congestion Predictors to
Valid and Imperceptible Perturbations [9.982978359852494]
最近の研究は、ニューラルネットワークが入力の小さな、慎重に選択された摂動に対して一般的に脆弱であることを示した。
現状のCNNとGNNをベースとした渋滞モデルでは、知覚不能な摂動に対する脆さが示される。
我々の研究は、CADエンジニアがEDAフローにニューラルネットワークベースのメカニズムを統合する際に注意すべきであることを示唆している。
論文 参考訳(メタデータ) (2024-02-29T20:11:47Z) - Evaluation of Differentially Constrained Motion Models for Graph-Based
Trajectory Prediction [1.1947990549568765]
本研究では,予測課題に対する数値解法と組み合わせた各種動作モデルの性能について検討する。
この研究は、低階積分子モデルのようなより単純なモデルは、正確な予測を達成するために、より複雑な、例えばキネマティックモデルよりも好まれることを示している。
論文 参考訳(メタデータ) (2023-04-11T10:15:20Z) - When to Update Your Model: Constrained Model-based Reinforcement
Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。
続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。
さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-10-15T17:57:43Z) - AMED: Automatic Mixed-Precision Quantization for Edge Devices [3.5223695602582614]
量子ニューラルネットワークは、レイテンシ、消費電力、モデルサイズをパフォーマンスに大きな影響を与えずに減少させることでよく知られている。
混合精度量子化は、異なるビット幅での算術演算をサポートするカスタマイズされたハードウェアのより良い利用を提供する。
論文 参考訳(メタデータ) (2022-05-30T21:23:22Z) - Interpretable AI-based Large-scale 3D Pathloss Prediction Model for
enabling Emerging Self-Driving Networks [3.710841042000923]
本稿では,新しい鍵予測器を応用した機械学習モデルを提案する。
予測,一般化,計算性能の観点から各種MLアルゴリズムの性能を定量的に評価することにより,光グラディエントブースティングマシン(LightGBM)アルゴリズムが全体として他のアルゴリズムより優れていることを示す。
論文 参考訳(メタデータ) (2022-01-30T19:50:16Z) - Conservative Objective Models for Effective Offline Model-Based
Optimization [78.19085445065845]
計算設計の問題は、合成生物学からコンピュータアーキテクチャまで、様々な場面で発生している。
本研究では,分布外入力に対する接地的目標の実際の値を低くする目的関数のモデルを学習する手法を提案する。
COMは、様々なMBO問題に対して、既存のメソッドの実装と性能の面では単純である。
論文 参考訳(メタデータ) (2021-07-14T17:55:28Z) - Covert Model Poisoning Against Federated Learning: Algorithm Design and
Optimization [76.51980153902774]
フェデレーテッド・ラーニング(FL)はパラメータ伝達中にFLモデルに対する外部攻撃に対して脆弱である。
本稿では,最先端の防御アグリゲーション機構に対処する有効なMPアルゴリズムを提案する。
実験の結果,提案したCMPアルゴリズムは,既存の攻撃機構よりも効果的で,かなり優れていることが示された。
論文 参考訳(メタデータ) (2021-01-28T03:28:18Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。