論文の概要: IronMan: GNN-assisted Design Space Exploration in High-Level Synthesis
via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2102.08138v1
- Date: Tue, 16 Feb 2021 13:22:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-17 15:13:55.004575
- Title: IronMan: GNN-assisted Design Space Exploration in High-Level Synthesis
via Reinforcement Learning
- Title(参考訳): IronMan: 強化学習による高層合成におけるGNN支援設計空間探索
- Authors: Nan Wu, Yuan Xie, Cong Hao
- Abstract要約: 本稿では,設計空間のフレキシブルかつ自動探索を実現するためのエンドツーエンドフレームワークであるironmanを提案する。
主な目標は、ユーザー指定の制約、または異なる目的間のさまざまなトレードオフの下で最適なソリューションを可能にすることです。
IronManは、さまざまなDSP制約に完全に適合するソリューションを見つけることができ、DSPは2.54倍、HLSツールの最大6倍のレイテンシを持つ。
- 参考スコア(独自算出の注目度): 16.22144875007084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the great success of High-Level Synthesis (HLS) tools, we observe
several unresolved challenges: 1) the high-level abstraction of programming
styles in HLS sometimes conceals optimization opportunities; 2) existing HLS
tools do not provide flexible trade-off (Pareto) solutions among different
objectives and constraints; 3) the actual quality of the resulting RTL designs
is hard to predict. To address these challenges, we propose an end-to-end
framework, namelyIronMan. The primary goal is to enable a flexible and
automated design space exploration (DSE), to provide either optimal solutions
under user-specified constraints, or various trade-offs among different
objectives (such as different types of resources, area, and latency). Such DSE
either requires tedious manual efforts or is not achievable to attain these
goals through existing HLS tools. There are three components in IronMan: 1)
GPP, a highly accurate graph-neural-network-based performance and resource
predictor; 2) RLMD, a reinforcement-learning-based multi-objective DSE engine
that explores the optimal resource allocation strategy, to provide Pareto
solutions between different objectives; 3) CT, a code transformer to assist
RLMD and GPP, which extracts the data flow graph from original HLS C/C++ and
automatically generates synthesizable code with HLS directives. The
experimental results show that: 1) GPP achieves high prediction accuracy,
reducing prediction errors of HLS tools by 10.9x in resource utilization and
5.7x in timing; 2) RLMD obtains optimal or Pareto solutions that outperform the
genetic algorithm and simulated annealing by 12.7% and 12.9%, respectively; 3)
IronMan is able to find optimized solutions perfectly matching various DSP
constraints, with 2.54x fewer DSPs and up to 6x shorter latency than those of
HLS tools while being up to 400x faster than the heuristic algorithms and HLS
tools.
- Abstract(参考訳): 1)HLSにおけるプログラミングスタイルのハイレベルな抽象化は、最適化の機会を隠蔽することがある;2)既存のHLSツールは、異なる目的と制約の間で柔軟なトレードオフ(Pareto)ソリューションを提供していない;3)結果のRTL設計の実際の品質は予測が難しい。
これらの課題に対処するため、IronManというエンドツーエンドのフレームワークを提案します。
主な目標は、柔軟で自動化された設計空間探索(DSE)を可能にし、ユーザー指定の制約下で最適なソリューションを提供するか、さまざまな目的(リソース、エリア、レイテンシの種類など)間のさまざまなトレードオフを提供することです。
このようなDSEは、面倒な手作業を必要とするか、あるいは既存のHLSツールによってこれらの目標を達成することができない。
IronManには、高精度なグラフニューラルネットワークベースのパフォーマンスとリソース予測器であるGPPと、最適なリソース割り当て戦略を探索する強化学習ベースのマルチオブジェクトDSEエンジンであるRLMDと、異なる目的間でParetoソリューションを提供するCTと、オリジナルのHSS C/C++からデータフローグラフを抽出し、HSSディレクティブで自動的に合成可能なコードを生成するRLMDとGPPの3つのコンポーネントがあります。
The experimental results show that: 1) GPP achieves high prediction accuracy, reducing prediction errors of HLS tools by 10.9x in resource utilization and 5.7x in timing; 2) RLMD obtains optimal or Pareto solutions that outperform the genetic algorithm and simulated annealing by 12.7% and 12.9%, respectively; 3) IronMan is able to find optimized solutions perfectly matching various DSP constraints, with 2.54x fewer DSPs and up to 6x shorter latency than those of HLS tools while being up to 400x faster than the heuristic algorithms and HLS tools.
関連論文リスト
- FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文 参考訳(メタデータ) (2024-10-16T16:13:19Z) - Multiobjective Vehicle Routing Optimization with Time Windows: A Hybrid Approach Using Deep Reinforcement Learning and NSGA-II [52.083337333478674]
本稿では、時間窓を用いた多目的車両ルーティング問題(MOVRPTW)に対処するために、ウェイト・アウェア・ディープ・強化学習(WADRL)手法を提案する。
WADRLの結果を最適化するために非支配的ソート遺伝的アルゴリズム-II (NSGA-II) 法を用いる。
論文 参考訳(メタデータ) (2024-07-18T02:46:06Z) - Cross-Modality Program Representation Learning for Electronic Design Automation with High-Level Synthesis [45.471039079664656]
ドメイン固有アクセラレータ(DSA)は、ディープラーニングや自律運転などのアプリケーションで人気を集めている。
本稿では,ソースコードシーケンスのモダリティとグラフのモダリティを深く,きめ細かな方法で相互作用できるモデルであるProgSGを提案する。
ProgSGは、設計性能予測のRMSEを最大22%の価格で削減し、設計を平均1.10Times$で識別する。
論文 参考訳(メタデータ) (2024-06-13T22:34:58Z) - Skip the Benchmark: Generating System-Level High-Level Synthesis Data using Generative Machine Learning [8.416553728391309]
高レベル合成(HLS)設計空間探索(DSE)は、HLSプロセスにおいて最適なハードウェアソリューションを探索するための広く受け入れられているアプローチである。
いくつかのHLSベンチマークとデータセットは、研究コミュニティが彼らの方法論を評価するために利用できる。
本稿では,複雑なシステムレベルのHLS DSE実験を支援するのに十分頑健な合成データを生成するために,生成機械学習を用いた新しいアプローチであるVaeganを提案する。
論文 参考訳(メタデータ) (2024-04-23T05:32:22Z) - Accelerate Presolve in Large-Scale Linear Programming via Reinforcement
Learning [92.31528918811007]
本稿では,P1)-(P3) を同時に扱うための簡易かつ効率的な強化学習フレームワーク,すなわち,事前解決のための強化学習(RL4Presolve)を提案する。
2つの解法と8つのベンチマーク(実世界と合成)の実験により、RL4Presolveは大規模LPの解法効率を大幅に改善することを示した。
論文 参考訳(メタデータ) (2023-10-18T09:51:59Z) - Target-independent XLA optimization using Reinforcement Learning [6.442130495735239]
本稿では, 深層強化学習に基づく最適XLA HLOパスの探索を提案する。
また,探索性能の向上を図るため,深部RLアルゴリズムの改良も提案する。
全体として、我々の実験では、平均13.3%のオペレーションカウント削減効果が見られた。
論文 参考訳(メタデータ) (2023-08-28T07:23:03Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - High-Level Synthesis Performance Prediction using GNNs: Benchmarking,
Modeling, and Advancing [21.8349113634555]
アジャイルハードウェア開発には、初期の設計段階から高速で正確な回路品質の評価が必要である。
本稿では,C/C++プログラムをグラフとして表現することで,グラフニューラルネットワーク(GNN)の表現力を生かした高速かつ正確な性能モデリングを提案する。
提案する予測器はHLSを最大40倍に上回り,既存の予測器を2倍から5倍に上回っている。
論文 参考訳(メタデータ) (2022-01-18T09:53:48Z) - Graph Neural Network-based Resource Allocation Strategies for
Multi-Object Spectroscopy [6.98188921994299]
トレーニング可能な資源割り当て戦略のための二部グラフニューラルネットワークアーキテクチャを提案する。
値と制約の項目は、可能なアロケーションに対応するエッジによって接続される2つのグラフノードのセットを形成する。
本研究では,高多重化Subaru Prime Focus Spectrographの天体目標選択戦略を最適化するために,本手法を適用した。
論文 参考訳(メタデータ) (2021-09-27T21:54:06Z) - Deep Learning-based Resource Allocation For Device-to-Device
Communication [66.74874646973593]
デバイス間通信(D2D)を用いたマルチチャネルセルシステムにおいて,リソース割り当ての最適化のためのフレームワークを提案する。
任意のチャネル条件に対する最適な資源配分戦略をディープニューラルネットワーク(DNN)モデルにより近似する深層学習(DL)フレームワークを提案する。
シミュレーションの結果,提案手法のリアルタイム性能を低速で実現できることが確認された。
論文 参考訳(メタデータ) (2020-11-25T14:19:23Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。