論文の概要: $MC^2RAM$: Markov Chain Monte Carlo Sampling in SRAM for Fast Bayesian
Inference
- arxiv url: http://arxiv.org/abs/2003.02629v1
- Date: Fri, 28 Feb 2020 23:18:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 02:55:31.366390
- Title: $MC^2RAM$: Markov Chain Monte Carlo Sampling in SRAM for Fast Bayesian
Inference
- Title(参考訳): mc^2ram$:高速ベイズ推定のためのsramにおけるマルコフ連鎖モンテカルロサンプリング
- Authors: Priyesh Shukla, Ahish Shylendra, Theja Tulabandhula, and Amit Ranjan
Trivedi
- Abstract要約: 本稿では、乱数生成器(RNG)、デジタル・デジタル・コンバータ(DAC)、アナログ・デジタル・コンバータ(ADC)を組み込むことにより、反復の新たなアーキテクチャを示す。
本研究は,低レベルのハードウェア非イデオロギーが高レベルのサンプリング特性にどのような影響を及ぼすか,興味深い知見を浮き彫りにしている。
- 参考スコア(独自算出の注目度): 1.6777183511743465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work discusses the implementation of Markov Chain Monte Carlo (MCMC)
sampling from an arbitrary Gaussian mixture model (GMM) within SRAM. We show a
novel architecture of SRAM by embedding it with random number generators
(RNGs), digital-to-analog converters (DACs), and analog-to-digital converters
(ADCs) so that SRAM arrays can be used for high performance Metropolis-Hastings
(MH) algorithm-based MCMC sampling. Most of the expensive computations are
performed within the SRAM and can be parallelized for high speed sampling. Our
iterative compute flow minimizes data movement during sampling. We characterize
power-performance trade-off of our design by simulating on 45 nm CMOS
technology. For a two-dimensional, two mixture GMM, the implementation consumes
~ 91 micro-Watts power per sampling iteration and produces 500 samples in 2000
clock cycles on an average at 1 GHz clock frequency. Our study highlights
interesting insights on how low-level hardware non-idealities can affect
high-level sampling characteristics, and recommends ways to optimally operate
SRAM within area/power constraints for high performance sampling.
- Abstract(参考訳): 本稿では,SRAM内の任意のガウス混合モデル(GMM)からマルコフ・チェイン・モンテカルロ(MCMC)をサンプリングする手法について述べる。
本稿では,乱数生成器(RNG),デジタル・アナログ変換器(DAC),アナログ・デジタル変換器(ADC)を組み込んで,SRAMアレイを高性能なメトロポリス・ハスティングス(MH)アルゴリズムに基づくMCMCサンプリングに利用できるようにする。
高価な計算のほとんどはSRAM内で行われ、高速サンプリングのために並列化することができる。
我々の反復計算フローはサンプリング時のデータ移動を最小化する。
我々は45nmCMOS技術でシミュレーションすることで、設計の電力効率のトレードオフを特徴づける。
2次元の混合GMMでは、サンプリング繰り返しごとに91マイクロワットの電力を消費し、平均1GHzのクロック周波数で2000クロックサイクルで500のサンプルを生成する。
本研究は,低レベルのハードウェア非イデオロギーが高レベルのサンプリング特性に与える影響について興味深い知見を示し,高パフォーマンスサンプリングのための領域/電力制約内でSRAMを最適に操作する方法を推奨する。
関連論文リスト
- Iterated Denoising Energy Matching for Sampling from Boltzmann Densities [109.23137009609519]
反復Denoising Energy Matching (iDEM)
iDEMは,拡散型サンプリング装置から高モデル密度のサンプリング領域を (I) 交換し, (II) それらのサンプルをマッチング目的に使用した。
提案手法は,全測定値の最先端性能を達成し,2~5倍の速さでトレーニングを行う。
論文 参考訳(メタデータ) (2024-02-09T01:11:23Z) - Evaluation of STT-MRAM as a Scratchpad for Training in ML Accelerators [9.877596714655096]
深層ニューラルネットワーク(DNN)のトレーニングは非常にメモリ集約的なプロセスである。
Spin-Transfer-Torque MRAM (STT-MRAM) は、加速器の訓練に望ましいいくつかの特性を提供する。
MRAMはシステムレベルのエネルギーを最大15-22倍改善することを示す。
論文 参考訳(メタデータ) (2023-08-03T20:36:48Z) - Parallel Sampling of Diffusion Models [76.3124029406809]
拡散モデルは強力な生成モデルであるが、サンプリングが遅い。
そこで本研究では,複数のステップを並列にdenoisingすることで,事前学習した拡散モデルのサンプリングを高速化するParaDiGMSを提案する。
論文 参考訳(メタデータ) (2023-05-25T17:59:42Z) - MRAM-based Analog Sigmoid Function for In-memory Computing [0.0]
本稿では、2つのスピン軌道トルク磁気抵抗ランダムアクセスメモリ(SOT-MRAM)とCMOSインバータを用いた超越活性化関数のアナログ実装を提案する。
提案したアナログニューロン回路は1.8-27倍の消費電力を消費し、最先端アナログやデジタル実装と比較して2.5-4931倍の面積を占める。
論文 参考訳(メタデータ) (2022-04-21T07:13:54Z) - Neural-PIM: Efficient Processing-In-Memory with Neural Approximation of
Peripherals [11.31429464715989]
本稿では,ディープラーニングタスクを効率的に高速化する新しいPIMアーキテクチャを提案する。
アナログ集積回路とニューラル近似周辺回路で必要となるA/D変換を最小化する。
異なるベンチマークによる評価では、Neural-PIMはエネルギー効率を5.36x (1.73x)向上し、スループットを3.43x (1.59x)向上する。
論文 参考訳(メタデータ) (2022-01-30T16:14:49Z) - CAP-RAM: A Charge-Domain In-Memory Computing 6T-SRAM for Accurate and
Precision-Programmable CNN Inference [27.376343943107788]
CAP-RAMは、コンパクトで、正確で、ビット幅でプログラム可能なインメモリ・コンピューティング(IMC)の静的ランダムアクセスメモリ(SRAM)マクロである。
エネルギー効率の良い畳み込みニューラルネットワーク(CNN)の推論を行う。
65nmのプロトタイプは、CAP-RAMの優れた線形性と計算精度を検証する。
論文 参考訳(メタデータ) (2021-07-06T04:59:16Z) - Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-05-25T15:55:14Z) - Sampling in Combinatorial Spaces with SurVAE Flow Augmented MCMC [83.48593305367523]
ハイブリッドモンテカルロ(Hybrid Monte Carlo)は、複素連続分布からサンプリングする強力なマルコフ連鎖モンテカルロ法である。
本稿では,SurVAEフローを用いたモンテカルロ法の拡張に基づく新しい手法を提案する。
本稿では,統計学,計算物理学,機械学習など,様々な分野におけるアルゴリズムの有効性を実証し,代替アルゴリズムと比較した改良点を考察する。
論文 参考訳(メタデータ) (2021-02-04T02:21:08Z) - Fast and differentiable simulation of driven quantum systems [58.720142291102135]
我々は、ダイソン展開に基づく半解析手法を導入し、標準数値法よりもはるかに高速に駆動量子系を時間発展させることができる。
回路QEDアーキテクチャにおけるトランスモン量子ビットを用いた2量子ゲートの最適化結果を示す。
論文 参考訳(メタデータ) (2020-12-16T21:43:38Z) - Plug-And-Play Learned Gaussian-mixture Approximate Message Passing [71.74028918819046]
そこで本研究では,従来のi.i.d.ソースに適した圧縮圧縮センシング(CS)リカバリアルゴリズムを提案する。
我々のアルゴリズムは、Borgerdingの学習AMP(LAMP)に基づいて構築されるが、アルゴリズムに普遍的な復調関数を採用することにより、それを大幅に改善する。
数値評価により,L-GM-AMPアルゴリズムは事前の知識を必要とせず,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-11-18T16:40:45Z) - SOT-MRAM based Sigmoidal Neuron for Neuromorphic Architectures [0.0]
本稿では、スピン軌道トルク(SOT)磁気抵抗性ランダムアクセスメモリ(MRAM)デバイス固有の物理特性を活用し、ニューロモルフィックアーキテクチャにおけるシグモダルニューロンを実現する。
提案したSOT-MRAM系ニューロンの出力-面積-積値の74倍と12倍の低下を示す。
論文 参考訳(メタデータ) (2020-06-01T20:18:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。