論文の概要: CIM-MLC: A Multi-level Compilation Stack for Computing-In-Memory
Accelerators
- arxiv url: http://arxiv.org/abs/2401.12428v1
- Date: Tue, 23 Jan 2024 01:33:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-24 17:20:32.558188
- Title: CIM-MLC: A Multi-level Compilation Stack for Computing-In-Memory
Accelerators
- Title(参考訳): cim-mlc: メモリ内アクセラレータのためのマルチレベルコンパイルスタック
- Authors: Songyun Qu, Shixin Zhao, Bing Li, Yintao He, Xuyi Cai, Lei Zhang, Ying
Wang
- Abstract要約: 汎用CIMアーキテクチャのための汎用多レベルコンパイルフレームワークであるCIM-MLCを提案する。
CIM-MLCは、複数のアーキテクチャ層にわたるマッピングとスケジューリング戦略を探索することができる。
- 参考スコア(独自算出の注目度): 11.295416364138232
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, various computing-in-memory (CIM) processors have been
presented, showing superior performance over traditional architectures. To
unleash the potential of various CIM architectures, such as device precision,
crossbar size, and crossbar number, it is necessary to develop compilation
tools that are fully aware of the CIM architectural details and implementation
diversity. However, due to the lack of architectural support in current popular
open-source compiling stacks, existing CIM designs either manually deploy
networks or build their own compilers, which is time-consuming and
labor-intensive. Although some works expose the specific CIM device programming
interfaces to compilers, they are often bound to a fixed CIM architecture,
lacking the flexibility to support the CIM architectures with different
computing granularity. On the other hand, existing compilation works usually
consider the scheduling of limited operation types (such as crossbar-bound
matrix-vector multiplication). Unlike conventional processors, CIM accelerators
are featured by their diverse architecture, circuit, and device, which cannot
be simply abstracted by a single level if we seek to fully explore the
advantages brought by CIM. Therefore, we propose CIM-MLC, a universal
multi-level compilation framework for general CIM architectures. We first
establish a general hardware abstraction for CIM architectures and computing
modes to represent various CIM accelerators. Based on the proposed abstraction,
CIM-MLC can compile tasks onto a wide range of CIM accelerators having
different devices, architectures, and programming interfaces. More importantly,
compared with existing compilation work, CIM-MLC can explore the mapping and
scheduling strategies across multiple architectural tiers, which form a
tractable yet effective design space, to achieve better scheduling and
instruction generation results.
- Abstract(参考訳): 近年,cim (compute-in-memory) プロセッサが登場し,従来のアーキテクチャよりも優れた性能を示している。
デバイス精度,クロスバーサイズ,クロスバー数などの各種CIMアーキテクチャの可能性を解き放つためには,CIMアーキテクチャの詳細や実装の多様性を十分に把握したコンパイルツールを開発する必要がある。
しかし、現在の一般的なオープンソースコンパイルスタックのアーキテクチャサポートが不足しているため、既存のCIM設計では、手動でネットワークをデプロイするか、独自のコンパイラを構築している。
特定のCIMデバイスプログラミングインタフェースをコンパイラに公開する研究もあるが、それらはしばしば固定されたCIMアーキテクチャに縛られ、異なる計算粒度のCIMアーキテクチャをサポートする柔軟性に欠ける。
一方、既存のコンパイル作業は通常、限られた操作タイプのスケジューリング(クロスバー境界行列-ベクトル乗算など)を考える。
従来のプロセッサとは異なり、CIMアクセラレータはアーキテクチャ、回路、デバイスによって特徴付けられており、CIMがもたらす利点を十分に探求しようとすると、単に1つのレベルで抽象化することはできない。
そこで本研究では,汎用CIMアーキテクチャのための汎用マルチレベルコンパイルフレームワークであるCIM-MLCを提案する。
まず,様々なCIMアクセラレータを表現するために,CIMアーキテクチャと計算モードの一般的なハードウェア抽象化を確立する。
提案された抽象化に基づいて、CIM-MLCはさまざまなデバイス、アーキテクチャ、プログラミングインターフェースを持つ幅広いCIMアクセラレーターにタスクをコンパイルすることができる。
さらに重要なことに、CIM-MLCは既存のコンパイル作業と比較して、複数のアーキテクチャ階層にわたるマッピングとスケジューリング戦略を探索することができる。
関連論文リスト
- Uni-MoE: Scaling Unified Multimodal LLMs with Mixture of Experts [54.529880848937104]
そこで我々は,MoEアーキテクチャをUni-MoEと呼ぶ一貫したMLLMを開発し,様々なモダリティを扱えるようにした。
具体的には、統一マルチモーダル表現のためのコネクタを持つモダリティ特化エンコーダを特徴とする。
マルチモーダルデータセットの包括的集合を用いた命令調整Uni-MoEの評価を行った。
論文 参考訳(メタデータ) (2024-05-18T12:16:01Z) - EasyACIM: An End-to-End Automated Analog CIM with Synthesizable Architecture and Agile Design Space Exploration [4.31899314328104]
本研究は、合成可能なアーキテクチャ(EasyACIM)に基づくエンドツーエンド自動ACIMを提案する。
EasyACIMは、様々な設計仕様でACIMのレイアウトを自動的に生成できる。
EasyACIMが提供するACIMソリューションは、最先端(SOTA)ACIMと比較して、幅広い設計空間と競争性能を有する。
論文 参考訳(メタデータ) (2024-04-12T08:12:17Z) - Dataflow-Aware PIM-Enabled Manycore Architecture for Deep Learning Workloads [16.67441258454545]
PIM(Processing-in-Memory)は、ディープラーニング(DL)ワークロードのエネルギー効率と高性能アクセラレーションの実現手段として登場した。
抵抗型ランダムアクセスメモリ(ReRAM)は、PIMを実装する上で最も有望な技術の一つである。
既存のPIMベースのアーキテクチャは、主に通信の役割を無視しながら計算に焦点を当てている。
論文 参考訳(メタデータ) (2024-03-28T00:29:15Z) - Mechanistic Design and Scaling of Hybrid Architectures [114.3129802943915]
我々は、様々な計算プリミティブから構築された新しいハイブリッドアーキテクチャを特定し、テストする。
本研究では,大規模計算最適法則と新しい状態最適スケーリング法則解析を用いて,結果のアーキテクチャを実験的に検証する。
我々は,MAD合成法と計算-最適パープレキシティを相関させ,新しいアーキテクチャの正確な評価を可能にする。
論文 参考訳(メタデータ) (2024-03-26T16:33:12Z) - Using the Abstract Computer Architecture Description Language to Model
AI Hardware Accelerators [77.89070422157178]
AI統合製品の製造者は、製品のパフォーマンス要件に適合するアクセラレータを選択するという、重大な課題に直面します。
抽象コンピュータアーキテクチャ記述言語(ACADL)は、コンピュータアーキテクチャブロック図の簡潔な形式化である。
本稿では,AIハードウェアアクセラレーションのモデル化にACADLを用いること,DNNのマッピングにACADL記述を使用し,タイミングシミュレーションのセマンティクスを解説し,性能評価結果の収集を行う。
論文 参考訳(メタデータ) (2024-01-30T19:27:16Z) - CLSA-CIM: A Cross-Layer Scheduling Approach for Computing-in-Memory
Architectures [0.1747623282473278]
CIMアーキテクチャの階層間スケジューリングアルゴリズムであるCLSA-CIMを提案する。
CLSA-CIMと既存の重み付け戦略を統合し,SOTA(State-of-the-art)スケジューリングアルゴリズムとの比較を行った。
論文 参考訳(メタデータ) (2024-01-15T13:35:21Z) - Machine Learning-Enabled Software and System Architecture Frameworks [48.87872564630711]
データサイエンスと機械学習に関連する関心事、例えばデータサイエンティストやデータエンジニアの利害関係者は、まだ既存のアーキテクチャフレームワークには含まれていない。
10か国25以上の組織から61名の被験者を対象に調査を行った。
論文 参考訳(メタデータ) (2023-08-09T21:54:34Z) - A Many-ported and Shared Memory Architecture for High-Performance ADAS
SoCs [11.760927352147798]
本稿では,ADASアプリケーションへのネイティブ並列アクセス間で高いデータスループットを実現するための共有メモリアーキテクチャを提案する。
その結果、提案アーキテクチャは、読み取りと書き込みの両方のアクセスに対して、100%近いスループットを提供することがわかった。
また、設計のスケーラビリティとモジュラリティを確保しながら、ドメイン固有のペイロードに一貫性を持たせることもできる。
論文 参考訳(メタデータ) (2022-09-13T04:58:27Z) - Enabling Retargetable Optimizing Compilers for Quantum Accelerators via
a Multi-Level Intermediate Representation [78.8942067357231]
我々は、最適化され、再ターゲット可能で、事前コンパイルが可能なマルチレベル量子古典中間表現(IR)を提案する。
ゲートベースのOpenQASM 3言語全体をサポートし、共通量子プログラミングパターンのカスタム拡張と構文の改善を提供します。
私たちの研究は、通常のPythonのアプローチよりも1000倍高速で、スタンドアロンの量子言語コンパイラよりも5~10倍高速なコンパイル時間を実現しています。
論文 参考訳(メタデータ) (2021-09-01T17:29:47Z) - Extending C++ for Heterogeneous Quantum-Classical Computing [56.782064931823015]
qcorはC++とコンパイラの実装の言語拡張で、異種量子古典プログラミング、コンパイル、単一ソースコンテキストでの実行を可能にする。
我々の研究は、量子言語で高レベルな量子カーネル(関数)を表現できる、第一種C++コンパイラを提供する。
論文 参考訳(メタデータ) (2020-10-08T12:49:07Z) - MLIR: A Compiler Infrastructure for the End of Moore's Law [14.795080852112083]
MLIRは、ソフトウェアの断片化に対処し、異種ハードウェアのコンパイルを改善し、ドメイン固有のコンパイラを構築するコストを大幅に削減することを目的としている。
MLIRはコードジェネレータ、トランスレータ、トランスレータを様々な抽象化レベルで設計し実装する。
論文 参考訳(メタデータ) (2020-02-25T17:24:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。