論文の概要: Efficient Calibration for RRAM-based In-Memory Computing using DoRA
- arxiv url: http://arxiv.org/abs/2504.03763v1
- Date: Wed, 02 Apr 2025 11:58:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:13:23.441990
- Title: Efficient Calibration for RRAM-based In-Memory Computing using DoRA
- Title(参考訳): DoRAを用いたRRAMベースのインメモリコンピューティングの効率的な校正
- Authors: Weirong Dong, Kai Zhou, Zhen Kong, Quan Cheng, Junkai Huang, Zhengke Yang, Masanori Hashimoto, Longyang Lin,
- Abstract要約: Resistive In-Memory Computing (RIMC)はエッジAIのための超効率的な計算機能を提供する。
従来のリトレーニング手法は、RRAMの高エネルギー消費、書き込み遅延、耐久性の制約によって制限される。
最小限のキャリブレーションパラメータを格納した影響重みを補償することにより精度を回復するDoRAベースのキャリブレーションフレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.379509715003623
- License:
- Abstract: Resistive In-Memory Computing (RIMC) offers ultra-efficient computation for edge AI but faces accuracy degradation due to RRAM conductance drift over time. Traditional retraining methods are limited by RRAM's high energy consumption, write latency, and endurance constraints. We propose a DoRA-based calibration framework that restores accuracy by compensating influential weights with minimal calibration parameters stored in SRAM, leaving RRAM weights untouched. This eliminates in-field RRAM writes, ensuring energy-efficient, fast, and reliable calibration. Experiments on RIMC-based ResNet50 (ImageNet-1K) demonstrate 69.53% accuracy restoration using just 10 calibration samples while updating only 2.34% of parameters.
- Abstract(参考訳): Resistive In-Memory Computing (RIMC)はエッジAIの超効率的な計算を提供するが、RRAMコンダクタンスドリフトによる精度低下に直面している。
従来のリトレーニング手法は、RRAMの高エネルギー消費、書き込み遅延、耐久性の制約によって制限されている。
本稿では,SRAM に格納される最小限のキャリブレーションパラメータで影響重みを補正し,RRAM の重みをそのまま残して精度を回復する DoRA ベースのキャリブレーションフレームワークを提案する。
これにより、フィールド内のRRAM書き込みが排除され、エネルギー効率が良く、高速で、信頼性の高いキャリブレーションが保証される。
RIMCベースのResNet50(ImageNet-1K)の実験では、わずか10のキャリブレーションサンプルを使用して69.53%の精度を復元し、パラメータの2.34%を更新した。
関連論文リスト
- Low-power Spike-based Wearable Analytics on RRAM Crossbars [9.842647727009924]
本研究では、RRAMクロスバーに基づくインメモリコンピューティングエンジン上にデプロイされたスパイキングニューラルネットワーク(SNN)を利用したスパイクベースのウェアラブル分析システムを導入する。
従来のバックプロパゲーション(BP)に対する直接フィードバックアライメント(DFA)を用いた事前学習SNNのオンライン適応を提案する。
論文 参考訳(メタデータ) (2025-02-10T18:00:05Z) - LoRA Done RITE: Robust Invariant Transformation Equilibration for LoRA Optimization [78.93425154518705]
低ランク適応 (LoRA) は、メモリ要求を低減し、LLMのパラメータ効率の高い微調整法である。
本稿では,LoRA最適化のための適応行列プレコンディショニング手法であるLoRA-RITEを紹介する。
論文 参考訳(メタデータ) (2024-10-27T22:57:12Z) - Q-GaLore: Quantized GaLore with INT4 Projection and Layer-Adaptive Low-Rank Gradients [86.40635601953446]
量子化と低ランク投影を組み合わせることでメモリ使用量を大幅に削減する新しい手法であるQ-Galoreを導入する。
本稿では,Q-Galoreがメモリ効率に優れた競合性能を実現することを実証する。
論文 参考訳(メタデータ) (2024-07-11T08:42:58Z) - Multi-level, Forming Free, Bulk Switching Trilayer RRAM for Neuromorphic
Computing at the Edge [0.0]
我々は三層金属酸化物スタックをベースとした成形・バルク切替RRAM技術を開発した。
我々は三層バルクRRAMクロスバーに基づくニューロモルフィック・コンピューティング・イン・メモリプラットフォームを開発した。
我々の研究は、厳格なサイズ、重み、パワー制約の下で、エッジでのニューロモルフィックコンピューティングの道を開いた。
論文 参考訳(メタデータ) (2023-10-20T22:37:46Z) - Evaluation of STT-MRAM as a Scratchpad for Training in ML Accelerators [9.877596714655096]
深層ニューラルネットワーク(DNN)のトレーニングは非常にメモリ集約的なプロセスである。
Spin-Transfer-Torque MRAM (STT-MRAM) は、加速器の訓練に望ましいいくつかの特性を提供する。
MRAMはシステムレベルのエネルギーを最大15-22倍改善することを示す。
論文 参考訳(メタデータ) (2023-08-03T20:36:48Z) - The Combination of Metal Oxides as Oxide Layers for RRAM and Artificial
Intelligence [0.0]
金属酸化物をベースとしたRRAMとAIの組み合わせの概要について概説する。
我々は、RRAMデバイスの性能向上のためのAIの使用と、AIを駆動するRRAMの使用について論じる。
この分野における重要な課題に対処し、今後の研究方向性に関する洞察を提供する。
論文 参考訳(メタデータ) (2023-04-29T04:15:50Z) - Quantized Neural Networks for Low-Precision Accumulation with Guaranteed
Overflow Avoidance [68.8204255655161]
本稿では,推定時のアキュムレータの精度を下げる際に,数値オーバーフローを回避する量子化学習アルゴリズムを提案する。
本手法は,浮動小数点点ベースラインに対するモデル精度を維持しつつ,アキュムレータの精度を低減できることを示す。
論文 参考訳(メタデータ) (2023-01-31T02:46:57Z) - Predicting Surface Texture in Steel Manufacturing at Speed [81.90215579427463]
亜鉛めっきおよび熱間圧延過程における鋼板の表面テクスチャの制御は,顧客要求を満たすために不可欠である。
本稿では,インラインレーザ反射計測から表面特性予測への変換精度向上のための機械学習の利用を提案する。
論文 参考訳(メタデータ) (2023-01-20T12:11:03Z) - SreaMRAK a Streaming Multi-Resolution Adaptive Kernel Algorithm [60.61943386819384]
既存のKRRの実装では、すべてのデータがメインメモリに格納される必要がある。
KRRのストリーミング版であるStreaMRAKを提案する。
本稿では,2つの合成問題と2重振り子の軌道予測について紹介する。
論文 参考訳(メタデータ) (2021-08-23T21:03:09Z) - Improving Inference Lifetime of Neuromorphic Systems via Intelligent
Synapse Mapping [0.2578242050187029]
RRAMセルは、コンテンツを一定回数読み込んだ後に状態を切り替えることができる。
本稿では,RRAMに基づくニューロモルフィックシステムの可読性向上のためのアーキテクチャ手法を提案する。
論文 参考訳(メタデータ) (2021-06-16T20:12:47Z) - SmartDeal: Re-Modeling Deep Network Weights for Efficient Inference and
Training [82.35376405568975]
ディープニューラルネットワーク(DNN)は重いパラメータ化を伴い、ストレージ用の外部動的ランダムアクセスメモリ(DRAM)につながります。
We present SmartDeal (SD), a algorithm framework to trade high-cost memory storage/ access for lower-cost compute。
SDは貯蔵および訓練エネルギーの10.56xそして4.48x減少、最先端の訓練のベースラインと比較される無視可能な正確さの損失をもたらすことを示します。
論文 参考訳(メタデータ) (2021-01-04T18:54:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。