論文の概要: CIM-MLC: A Multi-level Compilation Stack for Computing-In-Memory
Accelerators
- arxiv url: http://arxiv.org/abs/2401.12428v1
- Date: Tue, 23 Jan 2024 01:33:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-24 17:20:32.558188
- Title: CIM-MLC: A Multi-level Compilation Stack for Computing-In-Memory
Accelerators
- Title(参考訳): cim-mlc: メモリ内アクセラレータのためのマルチレベルコンパイルスタック
- Authors: Songyun Qu, Shixin Zhao, Bing Li, Yintao He, Xuyi Cai, Lei Zhang, Ying
Wang
- Abstract要約: 汎用CIMアーキテクチャのための汎用多レベルコンパイルフレームワークであるCIM-MLCを提案する。
CIM-MLCは、複数のアーキテクチャ層にわたるマッピングとスケジューリング戦略を探索することができる。
- 参考スコア(独自算出の注目度): 11.295416364138232
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, various computing-in-memory (CIM) processors have been
presented, showing superior performance over traditional architectures. To
unleash the potential of various CIM architectures, such as device precision,
crossbar size, and crossbar number, it is necessary to develop compilation
tools that are fully aware of the CIM architectural details and implementation
diversity. However, due to the lack of architectural support in current popular
open-source compiling stacks, existing CIM designs either manually deploy
networks or build their own compilers, which is time-consuming and
labor-intensive. Although some works expose the specific CIM device programming
interfaces to compilers, they are often bound to a fixed CIM architecture,
lacking the flexibility to support the CIM architectures with different
computing granularity. On the other hand, existing compilation works usually
consider the scheduling of limited operation types (such as crossbar-bound
matrix-vector multiplication). Unlike conventional processors, CIM accelerators
are featured by their diverse architecture, circuit, and device, which cannot
be simply abstracted by a single level if we seek to fully explore the
advantages brought by CIM. Therefore, we propose CIM-MLC, a universal
multi-level compilation framework for general CIM architectures. We first
establish a general hardware abstraction for CIM architectures and computing
modes to represent various CIM accelerators. Based on the proposed abstraction,
CIM-MLC can compile tasks onto a wide range of CIM accelerators having
different devices, architectures, and programming interfaces. More importantly,
compared with existing compilation work, CIM-MLC can explore the mapping and
scheduling strategies across multiple architectural tiers, which form a
tractable yet effective design space, to achieve better scheduling and
instruction generation results.
- Abstract(参考訳): 近年,cim (compute-in-memory) プロセッサが登場し,従来のアーキテクチャよりも優れた性能を示している。
デバイス精度,クロスバーサイズ,クロスバー数などの各種CIMアーキテクチャの可能性を解き放つためには,CIMアーキテクチャの詳細や実装の多様性を十分に把握したコンパイルツールを開発する必要がある。
しかし、現在の一般的なオープンソースコンパイルスタックのアーキテクチャサポートが不足しているため、既存のCIM設計では、手動でネットワークをデプロイするか、独自のコンパイラを構築している。
特定のCIMデバイスプログラミングインタフェースをコンパイラに公開する研究もあるが、それらはしばしば固定されたCIMアーキテクチャに縛られ、異なる計算粒度のCIMアーキテクチャをサポートする柔軟性に欠ける。
一方、既存のコンパイル作業は通常、限られた操作タイプのスケジューリング(クロスバー境界行列-ベクトル乗算など)を考える。
従来のプロセッサとは異なり、CIMアクセラレータはアーキテクチャ、回路、デバイスによって特徴付けられており、CIMがもたらす利点を十分に探求しようとすると、単に1つのレベルで抽象化することはできない。
そこで本研究では,汎用CIMアーキテクチャのための汎用マルチレベルコンパイルフレームワークであるCIM-MLCを提案する。
まず,様々なCIMアクセラレータを表現するために,CIMアーキテクチャと計算モードの一般的なハードウェア抽象化を確立する。
提案された抽象化に基づいて、CIM-MLCはさまざまなデバイス、アーキテクチャ、プログラミングインターフェースを持つ幅広いCIMアクセラレーターにタスクをコンパイルすることができる。
さらに重要なことに、CIM-MLCは既存のコンパイル作業と比較して、複数のアーキテクチャ階層にわたるマッピングとスケジューリング戦略を探索することができる。
関連論文リスト
- Using the Abstract Computer Architecture Description Language to Model
AI Hardware Accelerators [77.89070422157178]
AI統合製品の製造者は、製品のパフォーマンス要件に適合するアクセラレータを選択するという、重大な課題に直面します。
抽象コンピュータアーキテクチャ記述言語(ACADL)は、コンピュータアーキテクチャブロック図の簡潔な形式化である。
本稿では,AIハードウェアアクセラレーションのモデル化にACADLを用いること,DNNのマッピングにACADL記述を使用し,タイミングシミュレーションのセマンティクスを解説し,性能評価結果の収集を行う。
論文 参考訳(メタデータ) (2024-01-30T19:27:16Z) - CLSA-CIM: A Cross-Layer Scheduling Approach for Computing-in-Memory
Architectures [0.1747623282473278]
CIMアーキテクチャの階層間スケジューリングアルゴリズムであるCLSA-CIMを提案する。
CLSA-CIMと既存の重み付け戦略を統合し,SOTA(State-of-the-art)スケジューリングアルゴリズムとの比較を行った。
論文 参考訳(メタデータ) (2024-01-15T13:35:21Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z) - A Many-ported and Shared Memory Architecture for High-Performance ADAS
SoCs [11.760927352147798]
本稿では,ADASアプリケーションへのネイティブ並列アクセス間で高いデータスループットを実現するための共有メモリアーキテクチャを提案する。
その結果、提案アーキテクチャは、読み取りと書き込みの両方のアクセスに対して、100%近いスループットを提供することがわかった。
また、設計のスケーラビリティとモジュラリティを確保しながら、ドメイン固有のペイロードに一貫性を持たせることもできる。
論文 参考訳(メタデータ) (2022-09-13T04:58:27Z) - An Experimental Evaluation of Machine Learning Training on a Real
Processing-in-Memory System [9.429605859159023]
機械学習(ML)アルゴリズムのトレーニングは、計算集約的なプロセスであり、しばしばメモリバウンドである。
メモリ内の処理能力を備えたメモリ中心のコンピューティングシステムは、このデータ移動ボトルネックを軽減することができる。
実世界の汎用PIMアーキテクチャ上で,いくつかの代表的古典的MLアルゴリズムを実装した。
論文 参考訳(メタデータ) (2022-07-16T09:39:53Z) - Towards efficient feature sharing in MIMO architectures [102.40140369542755]
マルチインプットのマルチアウトプットアーキテクチャでは、ひとつのベースネットワーク内でマルチワークをトレーニングし、サブネットワーク予測を平均化し、無料でアンサンブルの恩恵を受けることを提案している。
相対的な成功にもかかわらず、これらのアーキテクチャはパラメータの使用に不便である。
この論文では、学習したサブネットワークは、より小さなモバイルやAR/VRデバイスに適用性を制限する汎用的な機能でさえも共有できない点を強調します。
論文 参考訳(メタデータ) (2022-05-20T12:33:34Z) - Enabling Retargetable Optimizing Compilers for Quantum Accelerators via
a Multi-Level Intermediate Representation [78.8942067357231]
我々は、最適化され、再ターゲット可能で、事前コンパイルが可能なマルチレベル量子古典中間表現(IR)を提案する。
ゲートベースのOpenQASM 3言語全体をサポートし、共通量子プログラミングパターンのカスタム拡張と構文の改善を提供します。
私たちの研究は、通常のPythonのアプローチよりも1000倍高速で、スタンドアロンの量子言語コンパイラよりも5~10倍高速なコンパイル時間を実現しています。
論文 参考訳(メタデータ) (2021-09-01T17:29:47Z) - A backend-agnostic, quantum-classical framework for simulations of
chemistry in C++ [62.997667081978825]
本稿では,量子古典ソフトウェアをプロトタイピング,開発,デプロイするためのプラットフォームとして,XACCシステムレベルの量子コンピューティングフレームワークを提案する。
現在XACCで実装されている最先端の化学アルゴリズムのいくつかを示す一連の例を示す。
論文 参考訳(メタデータ) (2021-05-04T16:53:51Z) - Bring Your Own Codegen to Deep Learning Compiler [8.87545486816377]
本稿では,独自のコード生成ツールの開発にのみ集中できるオープンソースフレームワークを提案する。
当社のフレームワークは、柔軟で使いやすいインターフェースをユーザーに提供し、モデルを「最高の」プロセッサで実行できるセグメントに分割します。
論文 参考訳(メタデータ) (2021-05-03T17:22:25Z) - Extending C++ for Heterogeneous Quantum-Classical Computing [56.782064931823015]
qcorはC++とコンパイラの実装の言語拡張で、異種量子古典プログラミング、コンパイル、単一ソースコンテキストでの実行を可能にする。
我々の研究は、量子言語で高レベルな量子カーネル(関数)を表現できる、第一種C++コンパイラを提供する。
論文 参考訳(メタデータ) (2020-10-08T12:49:07Z) - MLIR: A Compiler Infrastructure for the End of Moore's Law [14.795080852112083]
MLIRは、ソフトウェアの断片化に対処し、異種ハードウェアのコンパイルを改善し、ドメイン固有のコンパイラを構築するコストを大幅に削減することを目的としている。
MLIRはコードジェネレータ、トランスレータ、トランスレータを様々な抽象化レベルで設計し実装する。
論文 参考訳(メタデータ) (2020-02-25T17:24:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。