論文の概要: Row-Column Hybrid Grouping for Fault-Resilient Multi-Bit Weight Representation on IMC Arrays
- arxiv url: http://arxiv.org/abs/2508.15685v1
- Date: Thu, 21 Aug 2025 16:05:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.400047
- Title: Row-Column Hybrid Grouping for Fault-Resilient Multi-Bit Weight Representation on IMC Arrays
- Title(参考訳): IMCアレイ上での耐故障性マルチビット重み表現のためのロウカラムハイブリッドグルーピング
- Authors: Kang Eun Jeon, Sangheum Yeon, Jinhee Kim, Hyeonsu Bang, Johnny Rhe, Jong Hwan Ko,
- Abstract要約: 本稿では, 停止故障(SAF)による計算の不確実性と, 故障除去アルゴリズムの高いコンパイルオーバーヘッド, すなわちFault-Free(FF)について論じる。
まず,従来の列と列の両方に冗長性を導入することで,従来の列群を一般化する,列列ハイブリッドグループと呼ばれる新しいマルチビット重み表現手法を提案する。
第二に,欠陥認識の重み分解問題をアナログ線形プログラミング(ILP)タスクとして再構成するコンパイラを設計し,既製の解法による高速でスケーラブルなコンパイルを実現する。
- 参考スコア(独自算出の注目度): 8.430588029181136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses two critical challenges in analog In-Memory Computing (IMC) systems that limit their scalability and deployability: the computational unreliability caused by stuck-at faults (SAFs) and the high compilation overhead of existing fault-mitigation algorithms, namely Fault-Free (FF). To overcome these limitations, we first propose a novel multi-bit weight representation technique, termed row-column hybrid grouping, which generalizes conventional column grouping by introducing redundancy across both rows and columns. This structural redundancy enhances fault tolerance and can be effectively combined with existing fault-mitigation solutions. Second, we design a compiler pipeline that reformulates the fault-aware weight decomposition problem as an Integer Linear Programming (ILP) task, enabling fast and scalable compilation through off-the-shelf solvers. Further acceleration is achieved through theoretical insights that identify fault patterns amenable to trivial solutions, significantly reducing computation. Experimental results on convolutional networks and small language models demonstrate the effectiveness of our approach, achieving up to 8%p improvement in accuracy, 150x faster compilation, and 2x energy efficiency gain compared to existing baselines.
- Abstract(参考訳): 本稿では,そのスケーラビリティとデプロイ性を制限するアナログメモリ・コンピューティング(IMC)システムにおける2つの重要な課題について論じる。
これらの制約を克服するために,まず,従来の列と列の冗長性を導入し,従来の列群を一般化する,列列ハイブリッドグループと呼ばれる新しいマルチビット重み表現手法を提案する。
この構造的冗長性はフォールトトレランスを高め、既存のフォールト緩和ソリューションと効果的に組み合わせることができる。
Integer Linear Programming (ILP) タスクとしてフォールト・アウェア・ウェイト分解問題を再構成するコンパイラ・パイプラインを設計し,既製の解法による高速でスケーラブルなコンパイルを実現する。
さらなる加速は、自明な解に相応しい断層パターンを同定し、計算を著しく減少させる理論的な洞察によって達成される。
畳み込みネットワークと小言語モデルによる実験結果から,既存のベースラインに比べて最大8%の精度向上,150倍高速コンパイル,2倍のエネルギー効率向上を実現した。
関連論文リスト
- Inexact Column Generation for Bayesian Network Structure Learning via Difference-of-Submodular Optimization [3.802887999217352]
最先端のBNSLIPの定式化は、指数関数的に多くの変数と制約に悩まされる。
このような課題に対処するためのIPの標準的なアプローチは、行と列の生成テクニックを採用することである。
我々の行と列の生成アプローチは、最先端のスコアベースアプローチよりも高い品質のソリューションが得られることを示す。
論文 参考訳(メタデータ) (2025-05-16T10:23:19Z) - CLCR: Contrastive Learning-based Constraint Reordering for Efficient MILP Solving [34.127805466651864]
制約順序付けは、MILP(Mixed-Integer Linear Programming)ソルバの効率において重要な役割を果たす。
CLCR(Contrastive Learning-based Constraint Reordering)は,制約順序を体系的に最適化し,MILP解決を高速化する新しいフレームワークである。
ベンチマーク実験により、CLCRは解の精度を犠牲にすることなく、解の時間を30%削減し、LPイテレーションを25%削減した。
論文 参考訳(メタデータ) (2025-03-23T05:01:43Z) - Scalable First-order Method for Certifying Optimal k-Sparse GLMs [9.613635592922174]
そこで本研究では,BnBフレームワークの視点緩和を解くために,一階近位勾配アルゴリズムを提案する。
提案手法は双有界計算を著しく高速化し,大規模問題に対する最適性証明の提供に極めて有効であることを示す。
論文 参考訳(メタデータ) (2025-02-13T17:14:18Z) - Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based? [89.05848771674773]
MISO (Multiple-input Single-output) フレームワークを提案する。
それは複数の導波路で構成されており、多数の低コストアンテナ(PA)を備えている。
PAの位置は、大規模パスと空間の両方にまたがるように再構成することができる。
論文 参考訳(メタデータ) (2025-02-12T18:54:10Z) - Zero-Space Cost Fault Tolerance for Transformer-based Language Models on
ReRAM [27.354689865791638]
Resistive Random Access Memory (ReRAM)は、ディープニューラルネットワーク(DNN)のための有望なプラットフォームとして登場した。
フォールト欠陥などのハードウェア障害は、モデル推論中に重大な予測エラーを引き起こす可能性がある。
空間コストをゼロにするフォールトプロテクション機構を提案する。
論文 参考訳(メタデータ) (2024-01-22T02:50:38Z) - CBQ: Cross-Block Quantization for Large Language Models [66.82132832702895]
ポストトレーニング量子化(PTQ)は、超低コストで大規模言語モデル(LLM)を圧縮する上で重要な役割を果たしている。
LLMのためのクロスブロック再構成に基づくPTQ手法CBQを提案する。
CBQはリコンストラクションスキームを使用してクロスブロック依存関係を採用し、エラーの蓄積を最小限に抑えるために複数のブロックにまたがる長距離依存関係を確立する。
論文 参考訳(メタデータ) (2023-12-13T07:56:27Z) - Efficient Micro-Structured Weight Unification and Pruning for Neural
Network Compression [56.83861738731913]
ディープニューラルネットワーク(DNN)モデルは、特にリソース制限されたデバイスにおいて、実用的なアプリケーションに不可欠である。
既往の非構造的あるいは構造化された重量刈り法は、推論を真に加速することはほとんど不可能である。
ハードウェア互換のマイクロ構造レベルでの一般化された重み統一フレームワークを提案し,高い圧縮と加速度を実現する。
論文 参考訳(メタデータ) (2021-06-15T17:22:59Z) - Fully Quantized Image Super-Resolution Networks [81.75002888152159]
効率と精度を両立させるためのフル量子化画像超解像フレームワーク(FQSR)を提案する。
我々は、SRResNet、SRGAN、EDSRを含む複数の主流超解像アーキテクチャに量子化スキームを適用した。
低ビット量子化を用いたFQSRは、5つのベンチマークデータセットの完全精度と比較すると、パー性能で実現できる。
論文 参考訳(メタデータ) (2020-11-29T03:53:49Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。