Fugu-MT 論文翻訳(概要): Designing and Implementing a Generator Framework for a SIMD Abstraction Library

論文の概要: Designing and Implementing a Generator Framework for a SIMD Abstraction Library

arxiv url: http://arxiv.org/abs/2407.18728v1
Date: Fri, 26 Jul 2024 13:25:38 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-29 13:21:06.713240
Title: Designing and Implementing a Generator Framework for a SIMD Abstraction Library
Title（参考訳）: SIMD抽象化ライブラリのためのジェネレータフレームワークの設計と実装
Authors: Johannes Pietrzyk, Alexander Krause, Dirk Habich, Wolfgang Lehner,
Abstract要約: SIMD抽象化ライブラリを生成するための新しいエンドツーエンドフレームワークであるTSLGenを提案する。私たちのフレームワークは既存のライブラリに匹敵するもので、同じパフォーマンスを実現しています。
参考スコア（独自算出の注目度）: 53.84310825081338
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The Single Instruction Multiple Data (SIMD) parallel paradigm is a well-established and heavily-used hardware-driven technique to increase the single-thread performance in different system domains such as database or machine learning. Depending on the hardware vendor and the specific processor generation/version, SIMD capabilities come in different flavors concerning the register size and the supported SIMD instructions. Due to this heterogeneity and the lack of standardized calling conventions, building high-performance and portable systems is a challenging task. To address this challenge, academia and industry have invested a remarkable effort into creating SIMD abstraction libraries that provide unified access to different SIMD hardware capabilities. However, those one-size-fits-all library approaches are inherently complex, which hampers maintainability and extensibility. Furthermore, they assume similar SIMD hardware designs, which may be invalidated through ARM SVE's emergence. Additionally, while existing SIMD abstraction libraries do a great job of hiding away the specifics of the underlying hardware, their lack of expressiveness impedes crucial algorithm design decisions for system developers. To overcome these limitations, we present TSLGen, a novel end-to-end framework approach for generating an SIMD abstraction library in this paper. We have implemented our TSLGen framework and used our generated Template SIMD Library (TSL) to program various system components from different domains. As we will show, the programming effort is comparable to existing libraries, and we achieve the same performance results. However, our framework is easy to maintain and to extend, which simultaneously supports disruptive changes to the interface by design and exposes valuable insights for assessing provided functionality.
Abstract（参考訳）: SIMD(Single Instruction Multiple Data)並列パラダイム(Single Instruction Multiple Data)は、データベースや機械学習など、さまざまなシステムドメインにおけるシングルスレッドのパフォーマンスを向上させるための、確立されたハードウェア駆動技術である。ハードウェアベンダと特定のプロセッサ生成/バージョンに依存して、SIMD機能にはレジスタサイズとサポート対象SIMD命令に関する異なるフレーバーがある。このような不均一性と標準化された呼び出し規約の欠如のため、高性能でポータブルなシステムを構築することは難しい課題である。この課題に対処するため、学界と業界は、異なるSIMDハードウェア機能への統一的なアクセスを提供するSIMD抽象化ライブラリの作成に、驚くべき努力を払ってきた。しかし、これら一大のライブラリアプローチは本質的に複雑であり、保守性と拡張性を損なう。さらに、同様のSIMDハードウェア設計を前提としており、ARM SVEの出現によって無効化される可能性がある。さらに、既存のSIMD抽象化ライブラリは、基盤となるハードウェアの仕様を隠蔽する素晴らしい仕事をしていますが、表現力の欠如は、システム開発者にとって重要なアルゴリズム設計決定を妨げます。本稿では,SIMD抽象化ライブラリを生成するための新しいエンドツーエンドフレームワークTSLGenを提案する。我々は、TSLGenフレームワークを実装し、生成されたTemplate SIMDライブラリ(TSL)を使用して、異なるドメインから様々なシステムコンポーネントをプログラムした。お見せするとおり、プログラミングの取り組みは既存のライブラリに匹敵するものであり、同じパフォーマンスを実現しています。しかし、我々のフレームワークはメンテナンスや拡張が容易であり、同時に設計によるインターフェイスの破壊的な変更をサポートし、提供された機能を評価する上で貴重な洞察を公開する。

関連論文リスト

LLMServingSim 2.0: A Unified Simulator for Heterogeneous and Disaggregated LLM Serving Infrastructure [4.1898448424363695]
インフラを提供する大規模言語モデル(LLM)は、異質性や非凝集性へとシフトしている。本稿では,LLMServingSim 2.0について述べる。LLMServingSim 2.0は,ランタイム駆動のハードウェア-ソフトウェアインタラクションを明示的かつ解析可能なものにするシステムレベルのシミュレータである。
論文参考訳（メタデータ） (2026-02-26T14:22:17Z)
RooflineBench: A Benchmarking Framework for On-Device LLMs via Roofline Analysis [53.90240071275054]
SLM(Small Language Models)によるローカライズドインテリジェンスへの移行により、リソース制約のあるエッジハードウェア上での厳密なパフォーマンス評価の必要性が高まっている。運用強度レンズ(OI)によるアーキテクチャプリミティブとハードウェア制約を統一する体系的フレームワークを提案する。推論-ポテンシャル領域を定義することにより、同一ハードウェア基板上のLarge Language Models(LLM)の効率差を比較するための新しい指標として、相対推論ポテンシャルを導入する。
論文参考訳（メタデータ） (2026-02-12T03:02:22Z)
AR-MOT: Autoregressive Multi-object Tracking [56.09738000988466]
本稿では,大規模言語モデル(LLM)フレームワーク内のシーケンス生成タスクとしてMOTを定式化する,新しい自己回帰パラダイムを提案する。この設計により、タスク固有のヘッドを必要とせずに、フレキシブルなシーケンス構成によって構造化された結果を出力できる。地域レベルの視覚知覚を高めるために,事前訓練された検出器に基づくオブジェクト・トケナイザを導入する。
論文参考訳（メタデータ） (2026-01-05T09:17:28Z)
BuildBench: Benchmarking LLM Agents on Compiling Real-World Open-Source Software [39.43177863341685]
既存のメソッドは手動でキュレートされたルールに依存しており、カスタマイズされた設定や環境設定を必要とするOSSに適応できない。近年、Large Language Models (LLMs) を用いた試みでは、高度に評価されたOSSのサブセットを選択的に評価した。より困難で現実的なベンチマークであるBUILD-BENCHを提案する。
論文参考訳（メタデータ） (2025-09-27T03:02:46Z)
Data Dependency-Aware Code Generation from Enhanced UML Sequence Diagrams [54.528185120850274]
本稿では,API2Depという新しいステップバイステップコード生成フレームワークを提案する。まず、サービス指向アーキテクチャに適した拡張Unified Modeling Language (UML) APIダイアグラムを紹介します。次に、データフローの重要な役割を認識し、専用のデータ依存推論タスクを導入する。
論文参考訳（メタデータ） (2025-08-05T12:28:23Z)
SimdBench: Benchmarking Large Language Models for SIMD-Intrinsic Code Generation [7.839161849517216]
大きな言語モデルは、SIMD固有のプログラミングの課題でプログラマを支援することを約束している。既存のコード生成ベンチマークではスカラーコードのみに焦点が当てられており、SIMDイントロニクスを用いたベクトル化コードの生成においてLLMがどのように機能するかは定かではない。我々はSIMD固有のコード生成用に特別に設計された最初のコードベンチマークであるSimdBenchを提案する。
論文参考訳（メタデータ） (2025-07-21T03:55:41Z)
MultiCoSim: A Python-based Multi-Fidelity Co-Simulation Framework [0.4972323953932129]
MultiCoSimはPythonベースのシミュレーションフレームワークで、ユーザーはシミュレーションコンポーネントを定義し、構成し、構成することができる。 CPSは本質的にハードウェア、ソフトウェア、物理プロセスを統合する。既存のシミュレーションツールは、しばしば厳格な構成、自動化サポートの欠如、ポータビリティとモジュール性への障害を示す。
論文参考訳（メタデータ） (2025-06-12T16:31:39Z)
SIMCOPILOT: Evaluating Large Language Models for Copilot-Style Code Generation [5.880496520248658]
SIMCOPILOTは、対話型"コパイロット"スタイルのコーディングアシスタントとして、大規模言語モデル(LLM)の役割をシミュレートするベンチマークである。ベンチマークには、Java(SIMCOPILOTJ)とPython用の専用のサブベンチマークが含まれている。
論文参考訳（メタデータ） (2025-05-21T04:59:44Z)
APE-Bench I: Towards File-level Automated Proof Engineering of Formal Math Libraries [5.227446378450704]
APE-Bench Iは、Mathlib4の実際のコミット履歴から構築された最初の現実的なベンチマークである。 Eleansticはスケーラブルな並列検証インフラストラクチャで、Mathlibの複数バージョンにわたる検証に最適化されている。
論文参考訳（メタデータ） (2025-04-27T05:04:02Z)
TrapSIMD: SIMD-Aware Compiler Optimization for 2D Trapped-Ion Quantum Machines [14.239863509836864]
本稿では,SIMD対応のコンパイラフレームワークであるFluxTrapについて紹介する。 F FluxTrapは実行時間を最大3.82倍に削減し、数桁の忠実度を向上させる。
論文参考訳（メタデータ） (2025-04-24T18:49:51Z)
Understanding and Optimizing Multi-Stage AI Inference Pipelines [11.254219071373319]
HERMESは不均一な多段LPM推論実行シミュレータである。 HERMESは、以前のフレームワークとは異なり、複数のモデルを同時に実行する異種クライアントをサポートする。我々は、推論ステージがエンドツーエンドのレイテンシ、ハイブリッドパイプラインの最適戦略、リモートKVキャッシュ検索のアーキテクチャ的影響について検討する。
論文参考訳（メタデータ） (2025-04-14T00:29:49Z)
Simulation Streams: A Programming Paradigm for Controlling Large Language Models and Building Complex Systems with Generative AI [3.3126968968429407]
Simulation Streamsは、LLM(Large Language Models)を効率的に制御し活用するために設計されたプログラミングパラダイムである。私たちの一番の目標は、一貫性を維持するための制限に対処しながら、LLMのエージェント能力を活用するフレームワークを作ることです。
論文参考訳（メタデータ） (2025-01-30T16:38:03Z)
EpiCoder: Encompassing Diversity and Complexity in Code Generation [49.170195362149386]
抽象構文木(AST)にヒントを得た新しい特徴木ベース合成フレームワークを提案する。コードの構文構造をキャプチャするASTとは異なり、私たちのフレームワークはコード要素間のセマンティックな関係をモデル化します。広く使われているベースモデルを微調整してEpiCoderシリーズを作成し、関数レベルとファイルレベルの両方で最先端のパフォーマンスを実現しました。
論文参考訳（メタデータ） (2025-01-08T18:58:15Z)
Commit0: Library Generation from Scratch [77.38414688148006]
Commit0は、AIエージェントにスクラッチからライブラリを書くよう促すベンチマークである。エージェントには、ライブラリのAPIを概説する仕様文書と、インタラクティブなユニットテストスイートが提供されている。 Commit0はまた、モデルが生成したコードに対して静的解析と実行フィードバックを受け取る、インタラクティブな環境も提供する。
論文参考訳（メタデータ） (2024-12-02T18:11:30Z)
Scalable, Tokenization-Free Diffusion Model Architectures with Efficient Initial Convolution and Fixed-Size Reusable Structures for On-Device Image Generation [0.0]
ビジョントランスフォーマーとU-Netアーキテクチャは拡散モデルの実装において広く採用されている。固定サイズ再利用可能なトランスブロックをコア構造として利用するアーキテクチャを提案する。私たちのアーキテクチャの特徴は、複雑さの低い、トークンのない設計、位置埋め込みの欠如、均一性、スケーラビリティです。
論文参考訳（メタデータ） (2024-11-09T08:58:57Z)
AsCAN: Asymmetric Convolution-Attention Networks for Efficient Recognition and Generation [48.82264764771652]
本稿では,畳み込みブロックと変圧器ブロックを組み合わせたハイブリッドアーキテクチャAsCANを紹介する。 AsCANは、認識、セグメンテーション、クラス条件画像生成など、さまざまなタスクをサポートしている。次に、同じアーキテクチャをスケールして、大規模なテキスト・イメージタスクを解決し、最先端のパフォーマンスを示す。
論文参考訳（メタデータ） (2024-11-07T18:43:17Z)
MILP-StuDio: MILP Instance Generation via Block Structure Decomposition [55.79888361191114]
Mixed-integer linear programming (MILP) は、多くの応用において最も一般的な数学的定式化の1つである。我々は,ブロック構造を保存して高品質なインスタンスを生成するために,ブロック構造分解(MILP-StuDio)と呼ばれる新しいMILP生成フレームワークを提案する。
論文参考訳（メタデータ） (2024-10-30T08:33:27Z)
CARLOS: An Open, Modular, and Scalable Simulation Framework for the Development and Testing of Software for C-ITS [0.0]
CARLOS - C-ITSにおけるソフトウェアの開発とテストのためのオープンでモジュール化されたスケーラブルなシミュレーションフレームワークを提案する。このフレームワークの中核となるビルディングブロックを提供し、コミュニティによってどのように利用され、拡張されるかを説明します。本稿では、重要な設計原則を説明し、3つの主要なユースケースを示すことによって、アーキテクチャのモチベーションを高める。
論文参考訳（メタデータ） (2024-04-02T10:48:36Z)
Using the Abstract Computer Architecture Description Language to Model AI Hardware Accelerators [77.89070422157178]
AI統合製品の製造者は、製品のパフォーマンス要件に適合するアクセラレータを選択するという、重大な課題に直面します。抽象コンピュータアーキテクチャ記述言語(ACADL)は、コンピュータアーキテクチャブロック図の簡潔な形式化である。本稿では,AIハードウェアアクセラレーションのモデル化にACADLを用いること,DNNのマッピングにACADL記述を使用し,タイミングシミュレーションのセマンティクスを解説し,性能評価結果の収集を行う。
論文参考訳（メタデータ） (2024-01-30T19:27:16Z)
LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.55208585024198]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。 LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。 LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文参考訳（メタデータ） (2023-10-30T17:55:02Z)
Energy-efficient Task Adaptation for NLP Edge Inference Leveraging Heterogeneous Memory Architectures [68.91874045918112]
Adapter-ALBERTは、様々なタスクにわたる最大データ再利用のための効率的なモデル最適化である。検証されたNLPエッジアクセラレータ上でシミュレーションを行うことにより、モデルを不均一なオンチップメモリアーキテクチャにマッピングする利点を実証する。
論文参考訳（メタデータ） (2023-03-25T14:40:59Z)
Virtualization of Tiny Embedded Systems with a robust real-time capable and extensible Stack Virtual Machine REXAVM supporting Material-integrated Intelligent Systems and Tiny Machine Learning [0.0]
本稿では,動作に等価なソフトウェアとハードウェア(FPGA)の実装において,提案するVMアーキテクチャの適合性を示し,評価する。全体的なアーキテクチャアプローチでは、VMは特にデジタル信号処理と小さな機械学習に対処する。
論文参考訳（メタデータ） (2023-02-17T17:13:35Z)
MLIR: A Compiler Infrastructure for the End of Moore's Law [14.795080852112083]
MLIRは、ソフトウェアの断片化に対処し、異種ハードウェアのコンパイルを改善し、ドメイン固有のコンパイラを構築するコストを大幅に削減することを目的としている。 MLIRはコードジェネレータ、トランスレータ、トランスレータを様々な抽象化レベルで設計し実装する。
論文参考訳（メタデータ） (2020-02-25T17:24:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。