論文の概要: A System Level Performance Evaluation for Superconducting Digital Systems
- arxiv url: http://arxiv.org/abs/2411.08645v1
- Date: Wed, 13 Nov 2024 14:36:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-14 16:10:17.289361
- Title: A System Level Performance Evaluation for Superconducting Digital Systems
- Title(参考訳): 超電導デジタルシステムのシステムレベル性能評価
- Authors: Joyjit Kundu, Debjyoti Bhattacharjee, Nathan Josephsen, Ankit Pokhrel, Udara De Silva, Wenzhe Guo, Steven Van Winckel, Steven Brebels, Manu Perumkunnil, Quentin Herr, Anna Herr,
- Abstract要約: 超伝導デジタル(SCD)技術は、次世代の大規模計算ワークロードのパフォーマンスを向上させる大きな可能性を提供する。
高度なリソグラフィと300mmプラットフォームを利用することで、SCDデバイスはエネルギー消費を削減し、計算能力を向上させることができる。
- 参考スコア(独自算出の注目度): 0.7228151006868625
- License:
- Abstract: Superconducting Digital (SCD) technology offers significant potential for enhancing the performance of next generation large scale compute workloads. By leveraging advanced lithography and a 300 mm platform, SCD devices can reduce energy consumption and boost computational power. This paper presents a cross-layer modeling approach to evaluate the system-level performance benefits of SCD architectures for Large Language Model (LLM) training and inference. Our findings, based on experimental data and Pulse Conserving Logic (PCL) design principles, demonstrate substantial performance gain in both training and inference. We are, thus, able to convincingly show that the SCD technology can address memory and interconnect limitations of present day solutions for next-generation compute systems.
- Abstract(参考訳): 超伝導デジタル(SCD)技術は、次世代の大規模計算ワークロードのパフォーマンスを向上させる重要な可能性を提供する。
高度なリソグラフィと300mmプラットフォームを利用することで、SCDデバイスはエネルギー消費を削減し、計算能力を向上させることができる。
本稿では,Large Language Model (LLM) トレーニングと推論のためのSCDアーキテクチャのシステムレベルの性能特性を評価するための層間モデリング手法を提案する。
実験データとPulse Conserving Logic (PCL) 設計原則に基づいて, トレーニングと推論の両方において, かなりの性能向上を示した。
したがって、次世代のコンピュータシステムにおいて、SCD技術が現在のソリューションのメモリと相互接続の限界に対処できることを示すことができる。
関連論文リスト
- An Event-Based Digital Compute-In-Memory Accelerator with Flexible Operand Resolution and Layer-Wise Weight/Output Stationarity [0.11522790873450185]
ニューラルネットワーク(SNN)をスパイクするためのCIMアクセラレータは、エッジビジョンアプリケーションにおいて、$mu$sレベルの推論レイテンシと超低エネルギーを可能にする、有望なソリューションである。
本稿では,任意のオペランド解像度と形状をサポートするデジタルCIMマクロを提案する。
我々のアプローチは、IBM DVSジェスチャデータセットで最先端の分類精度95.8%に達しながら、大規模システムで最大90%のエネルギーを節約できる。
論文 参考訳(メタデータ) (2024-10-30T14:55:13Z) - Design Space Exploration of Approximate Computing Techniques with a
Reinforcement Learning Approach [49.42371633618761]
精度劣化と消費電力と計算時間短縮のバランスをとるアプリケーションの近似バージョンを見つけるためのRLベースの戦略を提案する。
実験結果から,いくつかのベンチマークにおいて,精度劣化と消費電力減少と計算時間との良好なトレードオフが示された。
論文 参考訳(メタデータ) (2023-12-29T09:10:40Z) - Random resistive memory-based deep extreme point learning machine for
unified visual processing [67.51600474104171]
ハードウェア・ソフトウェア共同設計型, ランダム抵抗型メモリベース深部極点学習マシン(DEPLM)を提案する。
我々の共同設計システムは,従来のシステムと比較して,エネルギー効率の大幅な向上とトレーニングコストの削減を実現している。
論文 参考訳(メタデータ) (2023-12-14T09:46:16Z) - Exploration of superconducting multi-mode cavity architectures for
quantum computing [44.99833362998488]
トランスモン回路に結合した超伝導無線周波数(SRF)キャビティは、高コヒーレンスな量子情報プロセッサを構築する上で有望なプラットフォームであることが証明されている。
本稿では,多セルSRF空洞の設計最適化プロセスについて述べる。
論文 参考訳(メタデータ) (2023-08-22T19:02:23Z) - Efficient Neural PDE-Solvers using Quantization Aware Training [71.0934372968972]
量子化は、性能を維持しながら推論の計算コストを下げることができることを示す。
4つの標準PDEデータセットと3つのネットワークアーキテクチャの結果、量子化対応のトレーニングは、設定と3桁のFLOPで機能することがわかった。
論文 参考訳(メタデータ) (2023-08-14T09:21:19Z) - High-performance real-world optical computing trained by in situ model-free optimization [2.2407602847819827]
モンテカルロ勾配推定アルゴリズムに基づく勾配に基づくモデルフリー最適化(G-MFO)手法を提案する。
G-MFOは、光学計算システムをブラックボックスとして扱い、光学計算重みの確率分布に直接損失をバックプロパガンダする。
G-MFO は MNIST と FMNIST のハイブリッドトレーニングより優れていることを示す。
論文 参考訳(メタデータ) (2023-07-22T01:56:58Z) - Robustness and Generalization Performance of Deep Learning Models on
Cyber-Physical Systems: A Comparative Study [71.84852429039881]
調査は、センサーの故障やノイズなど、様々な摂動を扱うモデルの能力に焦点を当てている。
我々は,これらのモデルの一般化と伝達学習能力を,アウト・オブ・ディストリビューション(OOD)サンプルに公開することによって検証する。
論文 参考訳(メタデータ) (2023-06-13T12:43:59Z) - Data augmentation for learning predictive models on EEG: a systematic
comparison [79.84079335042456]
脳波(EEG)分類タスクの深層学習は、ここ数年急速に増加している。
EEG分類タスクのディープラーニングは、比較的小さなEEGデータセットによって制限されている。
データ拡張は、コンピュータビジョンや音声などのアプリケーションにまたがる最先端のパフォーマンスを得るために重要な要素となっている。
論文 参考訳(メタデータ) (2022-06-29T09:18:15Z) - Reservoir Computing with Superconducting Electronics [0.0]
超伝導回路は、単純な伝送線ジオメトリでソリトンのようなダイナミクスを示す。
本稿では,100Gb/sに近い速度で高次パリティ計算とチャネル等化を行う上で,これらの回路の有効性を示す。
論文 参考訳(メタデータ) (2021-03-03T16:51:46Z) - Large-scale neuromorphic optoelectronic computing with a reconfigurable
diffractive processing unit [38.898230519968116]
回折処理ユニットを構築することにより、光電子再構成可能な計算パラダイムを提案する。
異なるニューラルネットワークを効率的にサポートし、数百万のニューロンで高いモデル複雑性を達成することができる。
市販の光電子部品を用いたプロトタイプシステムは,最先端のグラフィックス処理ユニットの性能を超越している。
論文 参考訳(メタデータ) (2020-08-26T16:34:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。