論文の概要: Methodology for Realizing VMM with Binary RRAM Arrays: Experimental
Demonstration of Binarized-ADALINE Using OxRAM Crossbar
- arxiv url: http://arxiv.org/abs/2006.05657v1
- Date: Wed, 10 Jun 2020 05:18:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 05:31:51.824561
- Title: Methodology for Realizing VMM with Binary RRAM Arrays: Experimental
Demonstration of Binarized-ADALINE Using OxRAM Crossbar
- Title(参考訳): 二元RRAMアレイによるVMMの実現手法:OxRAMクロスバーを用いた二元化ADALINEの実験実証
- Authors: Sandeep Kaur Kingra, Vivek Parmar, Shubham Negi, Sufyan Khan, Boris
Hudec, Tuo-Hung Hou and Manan Suri
- Abstract要約: OxRAMクロスバー上に二値化ADALINE(Adaptive Linear)分類器を実験的に示す。
シミュレーションでは,VMMを用いたバイナライズ-ADALINEネットワークが78%,実験では67%の分類精度を実現している。
- 参考スコア(独自算出の注目度): 4.173646531054261
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present an efficient hardware mapping methodology for
realizing vector matrix multiplication (VMM) on resistive memory (RRAM) arrays.
Using the proposed VMM computation technique, we experimentally demonstrate a
binarized-ADALINE (Adaptive Linear) classifier on an OxRAM crossbar. An 8x8
OxRAM crossbar with Ni/3-nm HfO2/7 nm Al-doped-TiO2/TiN device stack is used.
Weight training for the binarized-ADALINE classifier is performed ex-situ on
UCI cancer dataset. Post weight generation the OxRAM array is carefully
programmed to binary weight-states using the proposed weight mapping technique
on a custom-built testbench. Our VMM powered binarized-ADALINE network achieves
a classification accuracy of 78% in simulation and 67% in experiments.
Experimental accuracy was found to drop mainly due to crossbar inherent
sneak-path issues and RRAM device programming variability.
- Abstract(参考訳): 本稿では,抵抗メモリ(RRAM)アレイ上のベクトル行列乗算(VMM)を実現するための効率的なハードウェアマッピング手法を提案する。
提案手法を用いて,OxRAMクロスバー上に二値化ADALINE(Adaptive Linear)分類器を試作した。
Ni/3nm HfO2/7nm AlドープTiO2/TiNデバイススタックを備えた8x8 OxRAMクロスバーを使用する。
UCIがんデータセットに基づいて二項化ADALINE分類器の重量訓練を行う。
OxRAMアレイは、カスタムビルドテストベンチ上で提案した重みマッピング技術を用いて、2重み付け状態に慎重にプログラムされる。
シミュレーションでは,VMMを用いたバイナライズ-ADALINEネットワークが78%,実験では67%の分類精度を実現している。
実験精度は、主にクロスバー固有のスニーパス問題とRRAMデバイスプログラミングのばらつきにより低下した。
関連論文リスト
- MambaAD: Exploring State Space Models for Multi-class Unsupervised Anomaly Detection [53.03687787922032]
長距離モデリングと線形効率の優れたマンバモデルが注目されている。
MambaADは、事前訓練されたエンコーダと(Locality-Enhanced State Space)LSSモジュールをマルチスケールで備えたMambaデコーダで構成されている。
提案したLSSモジュールは、並列カスケード(Hybrid State Space) HSSブロックとマルチカーネル畳み込み操作を統合し、長距離情報とローカル情報の両方を効果的にキャプチャする。
論文 参考訳(メタデータ) (2024-04-09T18:28:55Z) - LQ-LoRA: Low-rank Plus Quantized Matrix Decomposition for Efficient Language Model Finetuning [66.85589263870702]
提案手法では,事前学習した行列を高精度の低ランク成分とメモリ効率の量子化成分に分解するために反復アルゴリズムを用いる。
微調整されたRoBERTaとLLaMA-2の実験は、我々の低ランク+量子化行列分解法(LQ-LoRA)が強いQLoRAおよびGPTQ-LoRAベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2023-11-20T18:57:41Z) - Multi-level, Forming Free, Bulk Switching Trilayer RRAM for Neuromorphic
Computing at the Edge [0.0]
我々は三層金属酸化物スタックをベースとした成形・バルク切替RRAM技術を開発した。
我々は三層バルクRRAMクロスバーに基づくニューロモルフィック・コンピューティング・イン・メモリプラットフォームを開発した。
我々の研究は、厳格なサイズ、重み、パワー制約の下で、エッジでのニューロモルフィックコンピューティングの道を開いた。
論文 参考訳(メタデータ) (2023-10-20T22:37:46Z) - Scaling Limits of Memristor-Based Routers for Asynchronous Neuromorphic
Systems [2.5264231114078353]
マルチコアニューロモルフィックシステムは、通常、コア間のスパイク伝達にオンチップルータを使用する。
有望な代替手段は、メムリシティブなクロスバーアレイの機能を利用して、スパイクをルーティングするプログラム可能なスイッチ行列として使用することである。
本稿では,非同期スパイキングニューラルネットワーク(SNN)ハードウェアでスパイクを送信するためのルーティングチャネルとして使用する場合,メムリシティブなクロスバーアレイの課題について検討する。
論文 参考訳(メタデータ) (2023-07-16T17:50:24Z) - Hardware-aware Training Techniques for Improving Robustness of Ex-Situ
Neural Network Transfer onto Passive TiO2 ReRAM Crossbars [0.8553766625486795]
ドロップアウト, 再パラメータ化トリック, TiO2クロスバー変数の正規化といった手法を応用したトレーニング手法を提案する。
提案手法を用いてトレーニングされたニューラルネットワークでは、テストセットのデータポイントの79.5%を95%以上の精度で分類することができる。
論文 参考訳(メタデータ) (2023-05-29T13:55:02Z) - MV-JAR: Masked Voxel Jigsaw and Reconstruction for LiDAR-Based
Self-Supervised Pre-Training [58.07391711548269]
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
論文 参考訳(メタデータ) (2023-03-23T17:59:02Z) - A 65nm 8b-Activation 8b-Weight SRAM-Based Charge-Domain Computing-in-Memory Macro Using A Fully-Parallel Analog Adder Network and A Single-ADC Interface [16.228299091691873]
コンピューティング・イン・メモリ(Computer-in-Memory, CiM)は、メモリ内の多重累積演算を可能にする、有望な緩和手法である。
この研究は、CIFAR-10データセットで88.6%の精度を示しながら、51.2GOPSのスループットと10.3TOPS/Wエネルギー効率を達成する。
論文 参考訳(メタデータ) (2022-11-23T07:52:10Z) - Monarch: Expressive Structured Matrices for Efficient and Accurate
Training [64.6871423399431]
大規模なニューラルネットワークは多くのドメインで優れているが、トレーニングや微調整は高価である。
計算やメモリ要件を減らすための一般的なアプローチは、重み付け行列を構造化行列に置き換えることである。
ハードウェア効率のよい行列(Monarch)のクラスを提案する。
論文 参考訳(メタデータ) (2022-04-01T17:37:29Z) - Integrate Lattice-Free MMI into End-to-End Speech Recognition [87.01137882072322]
音声認識(ASR)研究において、識別基準はDNN-HMMシステムにおいて優れた性能を達成している。
このモチベーションにより、差別的基準の採用は、エンドツーエンド(E2E)のASRシステムの性能を高めることを約束している。
これまでの研究は、最小ベイズリスク(MBR、差別基準の一つ)をE2E ASRシステムに導入してきた。
本研究では,他の広く使われている識別基準であるLF-MMIをE2Eに統合する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-29T14:32:46Z) - Memory-Efficient Backpropagation through Large Linear Layers [107.20037639738433]
Transformersのような現代のニューラルネットワークでは、線形層は後方通過時にアクティベーションを保持するために大きなメモリを必要とする。
本研究では,線形層によるバックプロパゲーションを実現するためのメモリ削減手法を提案する。
論文 参考訳(メタデータ) (2022-01-31T13:02:41Z) - CAP-RAM: A Charge-Domain In-Memory Computing 6T-SRAM for Accurate and
Precision-Programmable CNN Inference [27.376343943107788]
CAP-RAMは、コンパクトで、正確で、ビット幅でプログラム可能なインメモリ・コンピューティング(IMC)の静的ランダムアクセスメモリ(SRAM)マクロである。
エネルギー効率の良い畳み込みニューラルネットワーク(CNN)の推論を行う。
65nmのプロトタイプは、CAP-RAMの優れた線形性と計算精度を検証する。
論文 参考訳(メタデータ) (2021-07-06T04:59:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。