Fugu-MT 論文翻訳(概要): Multibit neural inference in a N-ary crossbar architecture

論文の概要: Multibit neural inference in a N-ary crossbar architecture

arxiv url: http://arxiv.org/abs/2604.26979v1
Date: Tue, 28 Apr 2026 13:29:51 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-01 16:31:53.691592
Title: Multibit neural inference in a N-ary crossbar architecture
Title（参考訳）: N-ary Crossbar アーキテクチャにおける多ビット神経推論
Authors: Anatole Moureaux, Anthony Lopes Temporao, Flavio Abreu Araujo,
Abstract要約: インメモリコンピューティング(IMC)は、メモリクロスバーアレイ内のアナログ行列ベクトル乗算(MVM)を計算することで、エネルギー効率の良いニューラルネットワーク推論を可能にする。本稿では,最小限の実装仮定でMVM結果を取得するN-aryクロスバーアーキテクチャのシミュレーションフレームワークを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In-memory computing (IMC) enables energy-efficient neural network inference by computing analog matrix-vector multiplications (MVM) in memory crossbar arrays. In this work we present a simulation framework for N-ary crossbar architectures that retrieves MVM results with minimal implementation assumptions. The XOR and MNIST classification tasks were successfully inferred using a simulated crossbar array of (4x4) 4-states magnetic tunnel junctions (MTJ). MNIST accuracy reached 94.48% (vs. 97.56% software baseline). The software-hardware performance gap was further reduced using PCA dimensionality reduction. We identified weight quantization as the primary error source, and studied its impact alongside systematic nonidealities and random noise. We find that cell-specific random noise is less detrimental than systematic errors due to averaging across the array. Finally, we demonstrate an optimal number of states per cell that balances quantization error against resistance state resolution to minimize total MVM error.
Abstract（参考訳）: インメモリコンピューティング(IMC)は、メモリクロスバーアレイ内のアナログ行列ベクトル乗算(MVM)を計算することで、エネルギー効率の良いニューラルネットワーク推論を可能にする。本研究では,最小限の実装仮定でMVM結果を取得するN-aryクロスバーアーキテクチャのシミュレーションフレームワークを提案する。 XORとMNISTの分類タスクは、 (4x4) 4-states magnetic tunnel junctions (MTJ) の模擬クロスバーアレイを用いてうまく推測された。 MNISTの精度は94.48%(vs. 97.56%)に達した。 PCA次元の削減により,ソフトウェア・ハードウェアの性能ギャップはさらに小さくなった。重み量子化を主誤差源として同定し,その影響を系統的非理想性やランダムノイズとともに検討した。セル固有のランダムノイズは,アレーを平均化することにより,系統的な誤りよりも有害ではないことがわかった。最後に、MVMの総誤差を最小限に抑えるために、抵抗状態分解に対する量子化誤差のバランスをとるセル当たりの最適な状態数を示す。

関連論文リスト

HPD: Hybrid Projection Decomposition for Robust State Space Models on Analog CIM Hardware [4.727184737671133]
ステートスペースモデル(SSM)は、伝統的なシーケンスモデルに代わる効率的な代替品である。その行列乗法への依存は、計算メモリアーキテクチャ(CIM)に理想的である。我々は,最後の出力射影層に対するハイブリッド射影分解戦略であるHPDを提案する。
論文参考訳（メタデータ） (2025-08-16T06:34:14Z)
Up-sampling-only and Adaptive Mesh-based GNN for Simulating Physical Systems [7.384641647468888]
本稿では,UA-MGNと呼ばれる新しい階層型メッシュグラフネットワークを開発し,効率的な機械シミュレーションを行う。 2つの合成データセットと1つの実データセットの評価は、UA-MGNの優位性を示している。
論文参考訳（メタデータ） (2024-09-07T07:09:58Z)
LQ-LoRA: Low-rank Plus Quantized Matrix Decomposition for Efficient Language Model Finetuning [66.85589263870702]
提案手法では,事前学習した行列を高精度の低ランク成分とメモリ効率の量子化成分に分解するために反復アルゴリズムを用いる。微調整されたRoBERTaとLLaMA-2の実験は、我々の低ランク+量子化行列分解法(LQ-LoRA)が強いQLoRAおよびGPTQ-LoRAベースラインより優れていることを示した。
論文参考訳（メタデータ） (2023-11-20T18:57:41Z)
MemSE: Fast MSE Prediction for Noisy Memristor-Based DNN Accelerators [5.553959304125023]
我々は,行列ベクトル乗算(MVM)を計算するためにmemristorを用いたDNNの平均二乗誤差を理論的に解析する。 DNNモデルのサイズを小さくする必要性から量子化ノイズと、中間値のプログラミングにおける可変性から生じるプログラミングノイズの両方を考慮に入れている。提案手法はモンテカルロシミュレーションよりも約2桁高速であり, 与えられた電力制約に対して最小限の誤差を達成するために, 実装パラメータを最適化することができる。
論文参考訳（メタデータ） (2022-05-03T18:10:43Z)
MCUNetV2: Memory-Efficient Patch-based Inference for Tiny Deep Learning [72.80896338009579]
メモリボトルネックは畳み込みニューラルネットワーク(CNN)の設計における不均衡なメモリ分布に起因する。本稿では,ピークメモリを大幅に削減するパッチ・バイ・パッチ・推論スケジューリングを提案する。ニューラルアーキテクチャサーチによるプロセスを自動化し、ニューラルアーキテクチャと推論スケジューリングを共同で最適化し、MCUNetV2に導いた。
論文参考訳（メタデータ） (2021-10-28T17:58:45Z)
Estimating Average Treatment Effects with Support Vector Machines [77.34726150561087]
サポートベクターマシン(SVM)は、機械学習文献で最も人気のある分類アルゴリズムの1つです。我々はsvmをカーネルベースの重み付け手順として適用し,治療群と制御群の最大平均差を最小化する。このトレードオフから生じる因果効果推定のバイアスを特徴づけ、提案されたSVM手順と既存のカーネルバランシング手法を結びつけます。
論文参考訳（メタデータ） (2021-02-23T20:22:56Z)
Non-Volatile Memory Array Based Quantization- and Noise-Resilient LSTM Neural Networks [1.5332481598232224]
本稿では,LSTMモデルへの量子化対応学習アルゴリズムの適用に焦点を当てる。 4ビットのNVM重みと4ビットのADC/DACしか必要とせず、浮動小数点点のベースラインとして同等のLSTMネットワーク性能が得られることを示した。提案したLSTM加速器のベンチマーク解析により、従来のデジタル手法に比べて少なくとも2.4倍の計算効率と40倍の面積効率が得られた。
論文参考訳（メタデータ） (2020-02-25T02:59:45Z)
SYMOG: learning symmetric mixture of Gaussian modes for improved fixed-point quantization [25.328005340524825]
ディープニューラルネットワーク(DNN)は、いくつかの機械学習ベンチマークで古典的な手法より優れていることが証明されている。低ビット固定点量子化によるDNNの複雑性を著しく低減するSYMOGを提案する。我々は,CIFAR-10では5.71%,CIFAR-100では27.65%の誤差率で,優れた結果と2ビットの最先端性能を達成した。
論文参考訳（メタデータ） (2020-02-19T14:17:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。