論文の概要: Designing and Implementing a Generator Framework for a SIMD Abstraction Library
- arxiv url: http://arxiv.org/abs/2407.18728v1
- Date: Fri, 26 Jul 2024 13:25:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-29 13:21:06.713240
- Title: Designing and Implementing a Generator Framework for a SIMD Abstraction Library
- Title(参考訳): SIMD抽象化ライブラリのためのジェネレータフレームワークの設計と実装
- Authors: Johannes Pietrzyk, Alexander Krause, Dirk Habich, Wolfgang Lehner,
- Abstract要約: SIMD抽象化ライブラリを生成するための新しいエンドツーエンドフレームワークであるTSLGenを提案する。
私たちのフレームワークは既存のライブラリに匹敵するもので、同じパフォーマンスを実現しています。
- 参考スコア(独自算出の注目度): 53.84310825081338
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Single Instruction Multiple Data (SIMD) parallel paradigm is a well-established and heavily-used hardware-driven technique to increase the single-thread performance in different system domains such as database or machine learning. Depending on the hardware vendor and the specific processor generation/version, SIMD capabilities come in different flavors concerning the register size and the supported SIMD instructions. Due to this heterogeneity and the lack of standardized calling conventions, building high-performance and portable systems is a challenging task. To address this challenge, academia and industry have invested a remarkable effort into creating SIMD abstraction libraries that provide unified access to different SIMD hardware capabilities. However, those one-size-fits-all library approaches are inherently complex, which hampers maintainability and extensibility. Furthermore, they assume similar SIMD hardware designs, which may be invalidated through ARM SVE's emergence. Additionally, while existing SIMD abstraction libraries do a great job of hiding away the specifics of the underlying hardware, their lack of expressiveness impedes crucial algorithm design decisions for system developers. To overcome these limitations, we present TSLGen, a novel end-to-end framework approach for generating an SIMD abstraction library in this paper. We have implemented our TSLGen framework and used our generated Template SIMD Library (TSL) to program various system components from different domains. As we will show, the programming effort is comparable to existing libraries, and we achieve the same performance results. However, our framework is easy to maintain and to extend, which simultaneously supports disruptive changes to the interface by design and exposes valuable insights for assessing provided functionality.
- Abstract(参考訳): SIMD(Single Instruction Multiple Data)並列パラダイム(Single Instruction Multiple Data)は、データベースや機械学習など、さまざまなシステムドメインにおけるシングルスレッドのパフォーマンスを向上させるための、確立されたハードウェア駆動技術である。
ハードウェアベンダと特定のプロセッサ生成/バージョンに依存して、SIMD機能にはレジスタサイズとサポート対象SIMD命令に関する異なるフレーバーがある。
このような不均一性と標準化された呼び出し規約の欠如のため、高性能でポータブルなシステムを構築することは難しい課題である。
この課題に対処するため、学界と業界は、異なるSIMDハードウェア機能への統一的なアクセスを提供するSIMD抽象化ライブラリの作成に、驚くべき努力を払ってきた。
しかし、これら一大のライブラリアプローチは本質的に複雑であり、保守性と拡張性を損なう。
さらに、同様のSIMDハードウェア設計を前提としており、ARM SVEの出現によって無効化される可能性がある。
さらに、既存のSIMD抽象化ライブラリは、基盤となるハードウェアの仕様を隠蔽する素晴らしい仕事をしていますが、表現力の欠如は、システム開発者にとって重要なアルゴリズム設計決定を妨げます。
本稿では,SIMD抽象化ライブラリを生成するための新しいエンドツーエンドフレームワークTSLGenを提案する。
我々は、TSLGenフレームワークを実装し、生成されたTemplate SIMDライブラリ(TSL)を使用して、異なるドメインから様々なシステムコンポーネントをプログラムした。
お見せするとおり、プログラミングの取り組みは既存のライブラリに匹敵するものであり、同じパフォーマンスを実現しています。
しかし、我々のフレームワークはメンテナンスや拡張が容易であり、同時に設計によるインターフェイスの破壊的な変更をサポートし、提供された機能を評価する上で貴重な洞察を公開する。
関連論文リスト
- Scalable, Tokenization-Free Diffusion Model Architectures with Efficient Initial Convolution and Fixed-Size Reusable Structures for On-Device Image Generation [0.0]
ビジョントランスフォーマーとU-Netアーキテクチャは拡散モデルの実装において広く採用されている。
固定サイズ再利用可能なトランスブロックをコア構造として利用するアーキテクチャを提案する。
私たちのアーキテクチャの特徴は、複雑さの低い、トークンのない設計、位置埋め込みの欠如、均一性、スケーラビリティです。
論文 参考訳(メタデータ) (2024-11-09T08:58:57Z) - AsCAN: Asymmetric Convolution-Attention Networks for Efficient Recognition and Generation [48.82264764771652]
本稿では,畳み込みブロックと変圧器ブロックを組み合わせたハイブリッドアーキテクチャAsCANを紹介する。
AsCANは、認識、セグメンテーション、クラス条件画像生成など、さまざまなタスクをサポートしている。
次に、同じアーキテクチャをスケールして、大規模なテキスト・イメージタスクを解決し、最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-11-07T18:43:17Z) - MILP-StuDio: MILP Instance Generation via Block Structure Decomposition [55.79888361191114]
Mixed-integer linear programming (MILP) は、多くの応用において最も一般的な数学的定式化の1つである。
我々は,ブロック構造を保存して高品質なインスタンスを生成するために,ブロック構造分解(MILP-StuDio)と呼ばれる新しいMILP生成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-30T08:33:27Z) - CARLOS: An Open, Modular, and Scalable Simulation Framework for the Development and Testing of Software for C-ITS [0.0]
CARLOS - C-ITSにおけるソフトウェアの開発とテストのためのオープンでモジュール化されたスケーラブルなシミュレーションフレームワークを提案する。
このフレームワークの中核となるビルディングブロックを提供し、コミュニティによってどのように利用され、拡張されるかを説明します。
本稿では、重要な設計原則を説明し、3つの主要なユースケースを示すことによって、アーキテクチャのモチベーションを高める。
論文 参考訳(メタデータ) (2024-04-02T10:48:36Z) - Using the Abstract Computer Architecture Description Language to Model
AI Hardware Accelerators [77.89070422157178]
AI統合製品の製造者は、製品のパフォーマンス要件に適合するアクセラレータを選択するという、重大な課題に直面します。
抽象コンピュータアーキテクチャ記述言語(ACADL)は、コンピュータアーキテクチャブロック図の簡潔な形式化である。
本稿では,AIハードウェアアクセラレーションのモデル化にACADLを用いること,DNNのマッピングにACADL記述を使用し,タイミングシミュレーションのセマンティクスを解説し,性能評価結果の収集を行う。
論文 参考訳(メタデータ) (2024-01-30T19:27:16Z) - LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.55208585024198]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。
LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。
LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文 参考訳(メタデータ) (2023-10-30T17:55:02Z) - Energy-efficient Task Adaptation for NLP Edge Inference Leveraging
Heterogeneous Memory Architectures [68.91874045918112]
Adapter-ALBERTは、様々なタスクにわたる最大データ再利用のための効率的なモデル最適化である。
検証されたNLPエッジアクセラレータ上でシミュレーションを行うことにより、モデルを不均一なオンチップメモリアーキテクチャにマッピングする利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T14:40:59Z) - Virtualization of Tiny Embedded Systems with a robust real-time capable
and extensible Stack Virtual Machine REXAVM supporting Material-integrated
Intelligent Systems and Tiny Machine Learning [0.0]
本稿では,動作に等価なソフトウェアとハードウェア(FPGA)の実装において,提案するVMアーキテクチャの適合性を示し,評価する。
全体的なアーキテクチャアプローチでは、VMは特にデジタル信号処理と小さな機械学習に対処する。
論文 参考訳(メタデータ) (2023-02-17T17:13:35Z) - MLIR: A Compiler Infrastructure for the End of Moore's Law [14.795080852112083]
MLIRは、ソフトウェアの断片化に対処し、異種ハードウェアのコンパイルを改善し、ドメイン固有のコンパイラを構築するコストを大幅に削減することを目的としている。
MLIRはコードジェネレータ、トランスレータ、トランスレータを様々な抽象化レベルで設計し実装する。
論文 参考訳(メタデータ) (2020-02-25T17:24:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。