論文の概要: GENIAL: Generative Design Space Exploration via Network Inversion for Low Power Algorithmic Logic Units
- arxiv url: http://arxiv.org/abs/2507.18989v1
- Date: Fri, 25 Jul 2025 06:34:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-28 16:16:48.84548
- Title: GENIAL: Generative Design Space Exploration via Network Inversion for Low Power Algorithmic Logic Units
- Title(参考訳): ジェネリック:低消費電力アルゴリズム論理ユニットのためのネットワークインバージョンによる生成設計空間探索
- Authors: Maxence Bouvier, Ryan Amaudruz, Felix Arnold, Renzo Andri, Lukas Cavigelli,
- Abstract要約: 本稿では,算術単位の自動生成と最適化のための機械学習ベースのフレームワークであるGENIALを紹介する。
我々は、ジェネリックは他の方法よりも一貫してサンプリング効率が高く、最適化された設計に向けてより高速に収束することを示した。
また、有限状態マシンの大幅な改善によって、我々のアプローチの汎用性を示す。
- 参考スコア(独自算出の注目度): 1.5845117761091052
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As AI workloads proliferate, optimizing arithmetic units is becoming increasingly important to reduce the footprint of digital systems. Conventional design flows, which often rely on manual or heuristics-based optimization, are limited in their ability to thoroughly explore the vast design space. In this paper, we introduce GENIAL, a machine learning-based framework for the automatic generation and optimization of arithmetic units, more specifically multipliers. At the core of GENIAL is a Transformer-based surrogate model trained in two stages, involving self-supervised pretraining followed by supervised finetuning, to robustly forecast key hardware metrics such as power and area from abstracted design representations. By inverting the surrogate model, GENIAL efficiently searches for new operand encodings that directly minimize power consumption in arithmetic units for specific input data distributions. Extensive experiments on large datasets demonstrate that GENIAL is consistently more sample efficient than other methods, and converges faster towards optimized designs. This enables to deploy a high-effort logic synthesis optimization flow in the loop, improving the accuracy of the surrogate model. Notably, GENIAL automatically discovers encodings that achieve up to 18% switching activity savings within multipliers on representative AI workloads compared with the conventional two's complement. We also demonstrate the versatility of our approach by achieving significant improvements on Finite State Machines, highlighting GENIAL's applicability for a wide spectrum of logic functions. Together, these advances mark a significant step toward automated Quality-of-Results-optimized combinational circuit generation for digital systems.
- Abstract(参考訳): AIのワークロードが増加するにつれて、デジタルシステムのフットプリントを減らすために、算術単位の最適化がますます重要になっている。
従来の設計フローは、しばしば手動やヒューリスティックスに基づく最適化に依存しており、広大な設計空間を徹底的に探索する能力に制限されている。
本稿では、算術単位の自動生成と最適化のための機械学習ベースのフレームワークであるGENIALを紹介し、より具体的には乗算器について述べる。
ジェネリックのコアとなるのはトランスフォーマーベースのサロゲートモデルで、自己教師付き事前訓練と教師付き微調整を伴い、抽象化された設計表現から電力や面積などの重要なハードウェアメトリクスを堅牢に予測する。
代用モデルを逆転させることで、特定の入力データ分布に対する算術単位の消費電力を直接最小化する新しいオペランド符号化を効率的に探索する。
大規模なデータセットに関する大規模な実験は、ジェネリックは他の方法よりも一貫してサンプリング効率が高く、最適化された設計に向けてより早く収束することを示した。
これにより、ループ内に高能率論理合成最適化フローを配置し、サロゲートモデルの精度を向上させることができる。
特に、GENIALは、従来の2つの補完よりも、代表的AIワークロード上の乗算器内で最大18%のスイッチングアクティビティセーブを達成するエンコーディングを自動的に検出する。
また、有限状態マシンの大幅な改善を達成し、幅広い論理関数に対するジェネリックの適用性を強調することによって、我々のアプローチの汎用性を実証する。
これらの進歩は、デジタルシステムにおけるQuality-of-Results最適化組合せ回路の自動生成に向けた重要な一歩となる。
関連論文リスト
- AnalogCoder-Pro: Unifying Analog Circuit Generation and Optimization via Multi-modal LLMs [30.598442053557896]
大きな言語モデル(LLM)はアナログ設計の自動化に新たな約束をもたらした。
本稿では,生成機能と最適化技術を統合する統合フレームワークであるAnalogCoder-Proを提案する。
これらの手法はアナログ回路設計の成功率を大幅に向上し,回路性能を向上することを示す。
論文 参考訳(メタデータ) (2025-08-04T15:25:48Z) - CROP: Circuit Retrieval and Optimization with Parameter Guidance using LLMs [4.481239665281804]
本稿では,最初の大規模言語モデル(LLM)を用いた自動VLSI設計フローチューニングフレームワークであるCROPを提案する。
提案手法は,(1)RTLソースコードを高密度ベクトル表現に変換するスケーラブルな手法,(2)意味的に類似した回路と設計をマッチングする埋め込み型検索システム,(3)検索強化型LLM誘導パラメータ探索システムを含む。
実験の結果、CROPのQoR(Quality-of-Results)の能力は、工業設計における既存のアプローチよりも少ないイテレーションで達成され、消費電力は9.9%削減された。
論文 参考訳(メタデータ) (2025-07-02T20:25:47Z) - Synergistic Development of Perovskite Memristors and Algorithms for Robust Analog Computing [53.77822620185878]
本稿では,ペロブスカイト・メムリスタの製作を同時に最適化し,ロバストなアナログDNNを開発するための相乗的手法を提案する。
BO誘導ノイズインジェクションを利用したトレーニング戦略であるBayesMultiを開発した。
我々の統合されたアプローチは、より深くより広いネットワークでのアナログコンピューティングの使用を可能にし、最大100倍の改善を実現します。
論文 参考訳(メタデータ) (2024-12-03T19:20:08Z) - Logic Synthesis Optimization with Predictive Self-Supervision via Causal Transformers [19.13500546022262]
LSOformerは、自動回帰トランスフォーマーモデルと予測SSLを利用して、結果の質の軌道(QoR)を予測する新しいアプローチである。
LSOformerは、クロスアテンションモジュールを統合して、回路グラフと最適化シーケンスからの洞察をマージし、QoRメトリクスの予測精度を向上させる。
論文 参考訳(メタデータ) (2024-09-16T18:45:07Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - INVICTUS: Optimizing Boolean Logic Circuit Synthesis via Synergistic
Learning and Search [18.558280701880136]
最先端論理合成アルゴリズムは、多数の論理最小化を持つ。
INVICTUSは、以前に見られた設計のトレーニングデータセットに基づいて、論理最小化のシーケンスを生成する。
論文 参考訳(メタデータ) (2023-05-22T15:50:42Z) - Performance Embeddings: A Similarity-based Approach to Automatic
Performance Optimization [71.69092462147292]
パフォーマンス埋め込みは、アプリケーション間でパフォーマンスチューニングの知識伝達を可能にする。
本研究では, 深層ニューラルネットワーク, 密度およびスパース線形代数合成, および数値風速予測ステンシルのケーススタディにおいて, この伝達チューニング手法を実証する。
論文 参考訳(メタデータ) (2023-03-14T15:51:35Z) - Machine Learning Framework for Quantum Sampling of Highly-Constrained,
Continuous Optimization Problems [101.18253437732933]
本研究では,連続空間の逆設計問題を,制約のないバイナリ最適化問題にマッピングする,汎用的な機械学習ベースのフレームワークを開発する。
本研究では, 熱発光トポロジを熱光応用に最適化し, (ii) 高効率ビームステアリングのための拡散メタグレーティングを行うことにより, 2つの逆設計問題に対するフレームワークの性能を示す。
論文 参考訳(メタデータ) (2021-05-06T02:22:23Z) - Optimization-driven Machine Learning for Intelligent Reflecting Surfaces
Assisted Wireless Networks [82.33619654835348]
インテリジェントサーフェス(IRS)は、個々の散乱素子の位相シフトを制御して無線チャネルを再形成するために用いられる。
散乱素子の規模が大きいため、受動ビームフォーミングは一般に高い計算複雑性によって挑戦される。
本稿では、IRS支援無線ネットワークの性能向上のための機械学習(ML)アプローチに焦点を当てる。
論文 参考訳(メタデータ) (2020-08-29T08:39:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。