Fugu-MT 論文翻訳(概要): Compiler-Driven Simulation of Reconfigurable Hardware Accelerators

論文の概要: Compiler-Driven Simulation of Reconfigurable Hardware Accelerators

arxiv url: http://arxiv.org/abs/2202.00739v1
Date: Tue, 1 Feb 2022 20:31:04 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-03 15:19:34.748230
Title: Compiler-Driven Simulation of Reconfigurable Hardware Accelerators
Title（参考訳）: 再構成可能なハードウェアアクセラレータのコンパイラ駆動シミュレーション
Authors: Zhijing Li, Yuwei Ye, Stephen Neuendorffer, Adrian Sampso
Abstract要約: 既存のシミュレータは、RTLシミュレーションのような低レベルのアプローチと一般的なアプローチの2つの極端である。本研究は,ハードウェアアクセラレータをモデル化可能なコンパイラ駆動シミュレーションワークフローを提案する。
参考スコア（独自算出の注目度）: 0.8807375890824978
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: As customized accelerator design has become increasingly popular to keep up with the demand for high performance computing, it poses challenges for modern simulator design to adapt to such a large variety of accelerators. Existing simulators tend to two extremes: low-level and general approaches, such as RTL simulation, that can model any hardware but require substantial effort and long execution times; and higher-level application-specific models that can be much faster and easier to use but require one-off engineering effort. This work proposes a compiler-driven simulation workflow that can model configurable hardware accelerator. The key idea is to separate structure representation from simulation by developing an intermediate language that can flexibly represent a wide variety of hardware constructs. We design the Event Queue (EQueue) dialect of MLIR, a dialect that can model arbitrary hardware accelerators with explicit data movement and distributed event-based control; we also implement a generic simulation engine to model EQueue programs with hybrid MLIR dialects representing different abstraction levels. We demonstrate two case studies of EQueue-implemented accelerators: the systolic array of convolution and SIMD processors in a modern FPGA. In the former we show EQueue simulation is as accurate as a state-of-the-art simulator, while offering higher extensibility and lower iteration cost via compiler passes. In the latter we demonstrate our simulation flow can guide designer efficiently improve their design using visualizable simulation outputs.
Abstract（参考訳）: ハイパフォーマンスコンピューティングの需要に対応するためにカスタマイズされた加速器の設計がますます人気になってきており、現代のシミュレータ設計がこのような多種多様な加速器に適応することは困難である。既存のシミュレータは、ハードウェアをモデル化できるが、かなりの労力と実行時間を要するrtlシミュレーションのような低レベルおよび一般的なアプローチと、より高速で使いやすいが1回限りのエンジニアリング労力を必要とする高レベルのアプリケーション固有のモデルである。本研究は,構成可能なハードウェアアクセラレータをモデル化するコンパイラ駆動シミュレーションワークフローを提案する。鍵となるアイデアは、様々なハードウェア構成を柔軟に表現できる中間言語を開発することで、構造表現をシミュレーションから分離することである。我々は、明示的なデータ移動と分散イベントベース制御を備えた任意のハードウェアアクセラレータをモデル化可能なMLIRのEvent Queue(EQueue)方言を設計し、異なる抽象レベルを表すハイブリッドMLIR方言でEQueueプログラムをモデル化するための汎用シミュレーションエンジンを実装した。本稿では、EQueue実装アクセラレータの2つのケーススタディとして、現代のFPGAにおける畳み込みとSIMDプロセッサのシストリック配列を示す。前者では、EQueueシミュレーションは最先端のシミュレータと同じくらい正確であり、高い拡張性とコンパイラパスによるイテレーションコストの低減を提供する。後者では、可視化可能なシミュレーションアウトプットを用いて、設計を効率的に改善できるシミュレーションフローを示す。

関連論文リスト

AEQUAM: Accelerating Quantum Algorithm Validation through FPGA-Based Emulation [0.46873264197900916]
AEQUAMは、より高速でアクセスしやすい量子回路検証を可能にするツールチェーンである。 OpenQASM 2.0をRISCライクな命令に変換するコンパイラと、数値表現とシミュレート回路を選択するCythonソフトウェアモデルと、FPGAベースのハードウェアエミュレータ用のRTL記述を生成するVHDLジェネレータで構成される。
論文参考訳（メタデータ） (2025-06-01T14:17:23Z)
Phantora: Maximizing Code Reuse in Simulation-based Machine Learning System Performance Estimation [13.326000659635378]
Phantoraは、機械学習トレーニングワークロードのパフォーマンス見積のための、ハイブリッドGPUクラスタシミュレータである。 MLフレームワークのソースコードをシミュレーションで直接再利用することが可能で、再実装の必要がなくなる。 Phantoraは最先端のトレーニングフレームワークを3つサポートしている。
論文参考訳（メタデータ） (2025-05-02T22:36:24Z)
Fast, Modular, and Differentiable Framework for Machine Learning-Enhanced Molecular Simulations [12.00988094580341]
分子動力学およびモンテカルロシミュレーションのためのエンドツーエンド微分分子シミュレーションフレームワーク(DIMOS)を提案する。そのモジュール性のおかげで、古典的および機械学習に基づくアプローチは、システムのハイブリッド記述(ML/MM)に簡単に組み合わせることができる。優れたパフォーマンスと高い汎用性は、さまざまなベンチマークやアプリケーションで調査されている。
論文参考訳（メタデータ） (2025-03-26T13:39:10Z)
Simulation Streams: A Programming Paradigm for Controlling Large Language Models and Building Complex Systems with Generative AI [3.3126968968429407]
Simulation Streamsは、LLM(Large Language Models)を効率的に制御し活用するために設計されたプログラミングパラダイムである。私たちの一番の目標は、一貫性を維持するための制限に対処しながら、LLMのエージェント能力を活用するフレームワークを作ることです。
論文参考訳（メタデータ） (2025-01-30T16:38:03Z)
Tao: Re-Thinking DL-based Microarchitecture Simulation [8.501776613988484]
既存のマイクロアーキテクチャシミュレータは、異なる側面で優れ、不足している。ディープラーニング(DL)ベースのシミュレーションは驚くほど高速で、精度は極めて高いが、適切な低レベルのマイクロアーキテクチャのパフォーマンス指標を提供することができない。本稿では,3つの主要な貢献により,DLに基づくシミュレーションを再設計するTAOを紹介する。
論文参考訳（メタデータ） (2024-04-16T21:45:10Z)
CityFlowER: An Efficient and Realistic Traffic Simulator with Embedded Machine Learning Models [25.567208505574072]
CityFlowERは、効率的で現実的な都市交通シミュレーションのための高度なシミュレータである。シミュレータ内に機械学習モデルが組み込まれており、外部APIインタラクションの必要がなくなる。これは、特に大規模なシミュレーションにおいて、非並列な柔軟性と効率を提供する。
論文参考訳（メタデータ） (2024-02-09T01:19:41Z)
Design-Space Exploration of SNN Models using Application-Specific Multi-Core Architectures [0.3599866690398789]
RAVSimは最先端のSNNシミュレータであり、彼らのウェブサイトで公式モジュールとして公開されている。 RAVSimは、ユーザがモデルと対話し、出力集中の振る舞いを観察し、シミュレーション実行中いつでもパラメトリック値のセットを変更することができる実行時仮想シミュレーション環境である。
論文参考訳（メタデータ） (2024-02-07T20:41:00Z)
Using the Abstract Computer Architecture Description Language to Model AI Hardware Accelerators [77.89070422157178]
AI統合製品の製造者は、製品のパフォーマンス要件に適合するアクセラレータを選択するという、重大な課題に直面します。抽象コンピュータアーキテクチャ記述言語(ACADL)は、コンピュータアーキテクチャブロック図の簡潔な形式化である。本稿では,AIハードウェアアクセラレーションのモデル化にACADLを用いること,DNNのマッピングにACADL記述を使用し,タイミングシミュレーションのセマンティクスを解説し,性能評価結果の収集を行う。
論文参考訳（メタデータ） (2024-01-30T19:27:16Z)
DEAP: Design Space Exploration for DNN Accelerator Parallelism [0.0]
大規模言語モデル(LLM)はますます複雑で、訓練やサービスにも強力になっています。本稿では、ハードウェアとソフトウェアの共同設計がどのように連携し、カスタマイズされたハードウェアシステムを構築するかを示す。
論文参考訳（メタデータ） (2023-12-24T02:43:01Z)
Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。 TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文参考訳（メタデータ） (2023-10-12T20:49:15Z)
In Situ Framework for Coupling Simulation and Machine Learning with Application to CFD [51.04126395480625]
近年、流体力学計算を容易にする機械学習(ML)の多くの成功例が報告されている。シミュレーションが大きくなるにつれて、従来のオフライン学習のための新しいトレーニングデータセットの生成は、I/Oとストレージのボトルネックを生み出します。この作業は、この結合を単純化し、異種クラスタでのその場トレーニングと推論を可能にするソリューションを提供する。
論文参考訳（メタデータ） (2023-06-22T14:07:54Z)
Data-Driven Offline Optimization For Architecting Hardware Accelerators [89.68870139177785]
PRIMEと呼ばれるハードウェアアクセラレータを設計するための,データ駆動型オフライン最適化手法を開発した。 PRIMEは、最先端のシミュレーション駆動方式の性能を約1.54倍と1.20倍に改善し、必要な総シミュレーション時間をそれぞれ93%と99%削減する。さらにPRIMEは、ゼロショット設定で見えないアプリケーションのための効果的なアクセラレーターを設計し、シミュレーションベースの手法を1.26倍に向上させた。
論文参考訳（メタデータ） (2021-10-20T17:06:09Z)
SimNet: Computer Architecture Simulation using Machine Learning [3.7019798164954336]
この研究では、機械学習(ML)を使用して離散イベントシミュレーションを加速する共同作業について説明します。提案した命令遅延予測器に基づいて,GPU加速並列シミュレータを実装した。そのシミュレーション精度とスループットを、最先端シミュレータに対して検証し、評価する。
論文参考訳（メタデータ） (2021-05-12T17:31:52Z)
High-performance symbolic-numerics via multiple dispatch [52.77024349608834]
Symbolics.jlは拡張可能なシンボルシステムで、動的多重ディスパッチを使用してドメインのニーズに応じて振る舞いを変更する。実装に依存しないアクションでジェネリックapiを形式化することで、システムに最適化されたデータ構造を遡及的に追加できることを示します。従来の用語書き換えシンプリファイアと電子グラフベースの用語書き換えシンプリファイアをスワップする機能を実証する。
論文参考訳（メタデータ） (2021-05-09T14:22:43Z)
Learning Discrete Energy-based Models via Auxiliary-variable Local Exploration [130.89746032163106]
離散構造データに対する条件付きおよび非条件付きEMMを学習するための新しいアルゴリズムであるALOEを提案する。エネルギー関数とサンプリング器は、新しい変分型電力繰り返しにより効率よく訓練できることを示す。本稿では、ソフトウェアテストのためのエネルギーモデルガイド付ファジィザについて、libfuzzerのようなよく設計されたファジィエンジンに匹敵する性能を実現する。
論文参考訳（メタデータ） (2020-11-10T19:31:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。