論文の概要: DISCA: A Digital In-memory Stochastic Computing Architecture Using A Compressed Bent-Pyramid Format
- arxiv url: http://arxiv.org/abs/2511.17265v1
- Date: Fri, 21 Nov 2025 14:13:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:19.05832
- Title: DISCA: A Digital In-memory Stochastic Computing Architecture Using A Compressed Bent-Pyramid Format
- Title(参考訳): DISCA:圧縮ベントピラミドフォーマットを用いたデジタルインメモリ確率計算アーキテクチャ
- Authors: Shady Agwa, Yikang Shen, Shiwei Wang, Themis Prodromakis,
- Abstract要約: 大規模AIモデルは人間の脳の機能を模倣し、データ集約行列乗算タスクを通じて数百万と数十億のパラメータを特徴付ける。
これらのAIアプリケーションは、ロボット工学や無人航空機による監視など、急速にエッジに移行しているため、エッジにおけるAIアーキテクチャのハードウェア予算により多くの制約が加えられている。
準確率的なBent-Pyramidデータフォーマットの圧縮版を利用した新しいディジタルインメモリ・コンピューティング・アーキテクチャであるdisCAを提案する。
- 参考スコア(独自算出の注目度): 19.67472721720097
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Nowadays, we are witnessing an Artificial Intelligence revolution that dominates the technology landscape in various application domains, such as healthcare, robotics, automotive, security, and defense. Massive-scale AI models, which mimic the human brain's functionality, typically feature millions and even billions of parameters through data-intensive matrix multiplication tasks. While conventional Von-Neumann architectures struggle with the memory wall and the end of Moore's Law, these AI applications are migrating rapidly towards the edge, such as in robotics and unmanned aerial vehicles for surveillance, thereby adding more constraints to the hardware budget of AI architectures at the edge. Although in-memory computing has been proposed as a promising solution for the memory wall, both analog and digital in-memory computing architectures suffer from substantial degradation of the proposed benefits due to various design limitations. We propose a new digital in-memory stochastic computing architecture, DISCA, utilizing a compressed version of the quasi-stochastic Bent-Pyramid data format. DISCA inherits the same computational simplicity of analog computing, while preserving the same scalability, productivity, and reliability of digital systems. Post-layout modeling results of DISCA show an energy efficiency of 3.59 TOPS/W per bit at 500 MHz using a commercial 180nm CMOS technology. Therefore, DISCA significantly improves the energy efficiency for matrix multiplication workloads by orders of magnitude if scaled and compared to its counterpart architectures.
- Abstract(参考訳): 今日では、医療、ロボティクス、自動車、セキュリティ、防衛など、さまざまなアプリケーション領域におけるテクノロジーのランドスケープを支配している人工知能革命を目撃しています。
人間の脳の機能を模倣した大規模AIモデルは、データ集約型行列乗算タスクを通じて、数百万から数十億のパラメータを特徴付けるのが一般的である。
従来のVon-Neumannアーキテクチャはメモリウォールとムーアの法則の終了に苦しむが、これらのAIアプリケーションはロボット工学や無人航空機などの監視のために急速にエッジに移行しており、それによってエッジにおけるAIアーキテクチャのハードウェア予算により多くの制約が加えられている。
メモリウォールに対する有望な解決策としてインメモリコンピューティングが提案されているが、アナログおよびデジタルインメモリコンピューティングアーキテクチャは、様々な設計上の制約により、提案された利点の大幅な劣化に悩まされている。
準確率型Bent-Pyramidデータフォーマットの圧縮版を利用して,新しいディジタルインメモリ確率計算アーキテクチャであるdisCAを提案する。
DISCAはアナログコンピューティングの計算の単純さを継承し、デジタルシステムのスケーラビリティ、生産性、信頼性を保っている。
DISCAのレイアウト後のモデリング結果は、商用180nmCMOS技術を用いて、500MHzで1ビットあたり3.59TOPS/Wのエネルギー効率を示す。
したがって、DICAは行列乗算処理のエネルギー効率をスケールして、対応するアーキテクチャと比較すると桁違いに改善する。
関連論文リスト
- DaCe AD: Unifying High-Performance Automatic Differentiation for Machine Learning and Scientific Computing [54.73410106410609]
この研究は、コード修正を必要としない汎用的で効率的な自動微分エンジンであるDaCe ADを提示する。
DaCe ADは、新しいILPベースのアルゴリズムを使用して、記憶と再計算の間のトレードオフを最適化し、与えられたメモリ制約内で最大性能を達成する。
論文 参考訳(メタデータ) (2025-09-02T11:09:45Z) - Efficient and accurate neural field reconstruction using resistive memory [52.68088466453264]
デジタルコンピュータにおける従来の信号再構成手法は、ソフトウェアとハードウェアの両方の課題に直面している。
本稿では,スパース入力からの信号再構成のためのソフトウェア・ハードウェア協調最適化を用いた体系的アプローチを提案する。
この研究は、AI駆動の信号復元技術を進歩させ、将来の効率的で堅牢な医療AIと3Dビジョンアプリケーションへの道を開く。
論文 参考訳(メタデータ) (2024-04-15T09:33:09Z) - Resistive Memory-based Neural Differential Equation Solver for Score-based Diffusion Model [55.116403765330084]
スコアベースの拡散のような現在のAIGC法は、迅速性と効率性の点で依然として不足している。
スコアベース拡散のための時間連続型およびアナログ型インメモリ型ニューラル微分方程式解法を提案する。
我々は180nmの抵抗型メモリインメモリ・コンピューティング・マクロを用いて,我々の解を実験的に検証した。
論文 参考訳(メタデータ) (2024-04-08T16:34:35Z) - Random resistive memory-based deep extreme point learning machine for
unified visual processing [67.51600474104171]
ハードウェア・ソフトウェア共同設計型, ランダム抵抗型メモリベース深部極点学習マシン(DEPLM)を提案する。
我々の共同設計システムは,従来のシステムと比較して,エネルギー効率の大幅な向上とトレーニングコストの削減を実現している。
論文 参考訳(メタデータ) (2023-12-14T09:46:16Z) - Pruning random resistive memory for optimizing analogue AI [54.21621702814583]
AIモデルは、エネルギー消費と環境持続可能性に前例のない課題を提示する。
有望な解決策の1つは、アナログコンピューティングを再考することである。
ここでは、構造的塑性に着想を得たエッジプルーニングを用いたユニバーサルソリューション、ソフトウェア・ハードウエアの共設計について報告する。
論文 参考訳(メタデータ) (2023-11-13T08:59:01Z) - Edge AI without Compromise: Efficient, Versatile and Accurate
Neurocomputing in Resistive Random-Access Memory [0.0]
我々は,RRAM CIMを用いた最初のマルチモーダルエッジAIチップであるNeuRRAMを提案する。
計算ビット精度の異なる先行技術よりも, 5 倍のエネルギー効率を 5 倍から 8 倍に向上することを示す。
この作業は、高度に効率的で再構成可能なエッジAIハードウェアプラットフォームを構築するための道を開くものだ。
論文 参考訳(メタデータ) (2021-08-17T21:08:51Z) - In-memory Implementation of On-chip Trainable and Scalable ANN for AI/ML
Applications [0.0]
本稿では,人工知能(AI)と機械学習(ML)アプリケーションを実現するための,ANNのためのインメモリコンピューティングアーキテクチャを提案する。
我々の新しいオンチップトレーニングとインメモリアーキテクチャは、プリチャージサイクル当たりの配列の複数行を同時にアクセスすることで、エネルギーコストを削減し、スループットを向上させる。
提案したアーキテクチャはIRISデータセットでトレーニングされ、以前の分類器と比較してMAC当たりのエネルギー効率が4,6倍に向上した。
論文 参考訳(メタデータ) (2020-05-19T15:36:39Z) - One-step regression and classification with crosspoint resistive memory
arrays [62.997667081978825]
高速で低エネルギーのコンピュータは、エッジでリアルタイム人工知能を実現するために要求されている。
ワンステップ学習は、ボストンの住宅のコスト予測と、MNIST桁認識のための2層ニューラルネットワークのトレーニングによって支援される。
結果は、クロスポイントアレイ内の物理計算、並列計算、アナログ計算のおかげで、1つの計算ステップで得られる。
論文 参考訳(メタデータ) (2020-05-05T08:00:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。