論文の概要: HEANA: A Hybrid Time-Amplitude Analog Optical Accelerator with Flexible
Dataflows for Energy-Efficient CNN Inference
- arxiv url: http://arxiv.org/abs/2402.03247v2
- Date: Fri, 9 Feb 2024 12:56:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-12 19:30:15.267799
- Title: HEANA: A Hybrid Time-Amplitude Analog Optical Accelerator with Flexible
Dataflows for Energy-Efficient CNN Inference
- Title(参考訳): heana: エネルギー効率のよいcnn推論のためのフレキシブルデータフローを備えたハイブリッド時間振幅アナログ光加速器
- Authors: Sairam Sri Vatsavai, Venkata Sai Praneeth Karempudi, and Ishan Thakkar
- Abstract要約: 本稿では、HEANAと呼ばれる新しいハイブリッドTimE Amplitude aNalog光加速器を提案する。
HEANAは、複数のデータフローをサポートするためのHEANAの柔軟性を高めるために、ハイブリッド時間振幅アナログ光乗算器(TAOM)を採用している。
現代CNNの4つの評価から, HEANAはFPS(F frames-per-second)とFPS/W(エネルギー効率)において最大66倍, 84倍の改善を実現していることが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Several photonic microring resonators (MRRs) based analog accelerators have
been proposed to accelerate the inference of integer-quantized CNNs with
remarkably higher throughput and energy efficiency compared to their electronic
counterparts. However, the existing analog photonic accelerators suffer from
three shortcomings: (i) severe hampering of wavelength parallelism due to
various crosstalk effects, (ii) inflexibility of supporting various dataflows
other than the weight-stationary dataflow, and (iii) failure in fully
leveraging the ability of photodetectors to perform in-situ accumulations.
These shortcomings collectively hamper the performance and energy efficiency of
prior accelerators. To tackle these shortcomings, we present a novel Hybrid
timE Amplitude aNalog optical Accelerator, called HEANA. HEANA employs hybrid
time-amplitude analog optical multipliers (TAOMs) that increase the flexibility
of HEANA to support multiple dataflows. A spectrally hitless arrangement of
TAOMs significantly reduces the crosstalk effects, thereby increasing the
wavelength parallelism in HEANA. Moreover, HEANA employs our invented balanced
photo-charge accumulators (BPCAs) that enable buffer-less, in-situ, temporal
accumulations to eliminate the need to use reduction networks in HEANA,
relieving it from related latency and energy overheads. Our evaluation for the
inference of four modern CNNs indicates that HEANA provides improvements of
atleast 66x and 84x in frames-per-second (FPS) and FPS/W (energy-efficiency),
respectively, for equal-area comparisons, on gmean over two MRR-based analog
CNN accelerators from prior work.
- Abstract(参考訳): いくつかのフォトニックマイクロリング共振器(MRR)をベースとしたアナログ加速器は、電子回路に比べて非常に高いスループットとエネルギー効率で整数量子化CNNの推論を高速化するために提案されている。
しかし、既存のアナログフォトニック加速器には3つの欠点がある。
(i)様々なクロストーク効果による波長並列性の深刻な障害
二 重量定常データフロー以外の各種データフローを支持できないこと、及び
(iii)光検出器がその場で蓄積する能力を完全に活用できないこと。
これらの欠点は、従来の加速器の性能とエネルギー効率を損なう。
これらの欠点に対処するため,Hybrid timE Amplitude aNalog optical Accelerator(HEANA)を提案する。
HEANAは、複数のデータフローをサポートするためのHEANAの柔軟性を高めるために、ハイブリッド時間振幅アナログ光乗算器(TAOM)を採用している。
TAOMのスペクトル的ヒットレス配置はクロストーク効果を著しく低減し、HEANAの波長並列性を高める。
さらに, HEANAでは, バッファレス, その場, 時間的蓄積が可能な平衡光電荷蓄積器 (BPCA) を用いて, HEANAの低減ネットワークを不要にし, 関連する遅延やエネルギーオーバーヘッドを軽減している。
近年の4つのCNNを推定すると、HEANAはフレーム毎秒(FPS)とFPS/W(エネルギ効率)において最大66倍と84倍の改善を提供しており、それぞれが等価領域の比較を行う。
関連論文リスト
- Neuromorphic Wireless Split Computing with Multi-Level Spikes [69.73249913506042]
ニューロモルフィックコンピューティングでは、スパイクニューラルネットワーク(SNN)が推論タスクを実行し、シーケンシャルデータを含むワークロードの大幅な効率向上を提供する。
ハードウェアとソフトウェアの最近の進歩は、スパイクニューロン間で交換された各スパイクに数ビットのペイロードを埋め込むことにより、推論精度をさらに高めることを示した。
本稿では,マルチレベルSNNを用いた無線ニューロモルフィック分割計算アーキテクチャについて検討する。
論文 参考訳(メタデータ) (2024-11-07T14:08:35Z) - OFDM-Standard Compatible SC-NOFS Waveforms for Low-Latency and Jitter-Tolerance Industrial IoT Communications [53.398544571833135]
この研究は、スペクトル的に効率的な不規則なSinc (irSinc) 整形法を提案し、1924年に従来のSincを再考した。
irSincは、誤差性能を犠牲にすることなくスペクトル効率が向上した信号を生成する。
我々の信号は、5G標準信号構成により、同じスペクトル帯域内で高速なデータ伝送を実現する。
論文 参考訳(メタデータ) (2024-06-07T09:20:30Z) - TeMPO: Efficient Time-Multiplexed Dynamic Photonic Tensor Core for Edge
AI with Compact Slow-Light Electro-Optic Modulator [44.74560543672329]
我々は,TMPOと呼ばれる時間多重化動的フォトニックテンソルアクセラレータを,クロス層デバイス/回路/アーキテクチャのカスタマイズにより提案する。
我々は,368.6TOPSピーク性能,22.3TOPS/Wエネルギー効率,1.2TOPS/mm$2$計算密度を実現した。
この研究は、多層共設計とドメイン固有のカスタマイズの力を示し、将来の電子フォトニクス加速器への道を開く。
論文 参考訳(メタデータ) (2024-02-12T03:40:32Z) - Multiagent Reinforcement Learning with an Attention Mechanism for
Improving Energy Efficiency in LoRa Networks [52.96907334080273]
ネットワーク規模が大きくなるにつれて、パケット衝突によるLoRaネットワークのエネルギー効率は急激に低下する。
マルチエージェント強化学習(MALoRa)に基づく伝送パラメータ割り当てアルゴリズムを提案する。
シミュレーションの結果,MALoRaはベースラインアルゴリズムと比較してシステムEEを著しく改善することがわかった。
論文 参考訳(メタデータ) (2023-09-16T11:37:23Z) - Analysis of Optical Loss and Crosstalk Noise in MZI-based Coherent
Photonic Neural Networks [8.930237478906266]
シリコンフォトニックベースのニューラルネットワーク(SP-NN)アクセラレーターは、電子加速器に代わる有望な代替品として登場した。
本稿ではボトムアップ手法を用いて,光損失とクロストークノイズを包括的にモデル化する。
異なるスケールのSP-NNに対して,高出力のペナルティと破滅的推論精度が最大84%低下することを示す。
論文 参考訳(メタデータ) (2023-08-07T02:01:18Z) - Long-term Wind Power Forecasting with Hierarchical Spatial-Temporal
Transformer [112.12271800369741]
風力発電は、再生可能、汚染のないその他の利点により、世界中の注目を集めている。
正確な風力発電予測(WPF)は、電力系統の運用における電力変動を効果的に低減することができる。
既存の手法は主に短期的な予測のために設計されており、効果的な時空間的特徴増強が欠如している。
論文 参考訳(メタデータ) (2023-05-30T04:03:15Z) - Hybrid Parallel Imaging and Compressed Sensing MRI Reconstruction with
GRAPPA Integrated Multi-loss Supervised GAN [2.7110495144693374]
本稿では, 再構成画像のデエイリアスのために, マルチモーダルな損失を抑える新しいGAN(Generative Adversarial Network)を提案する。
提案手法は, 画像品質の向上に寄与し, 5倍, 10倍の高速化を実現した。
論文 参考訳(メタデータ) (2022-09-19T07:26:45Z) - Neural-PIM: Efficient Processing-In-Memory with Neural Approximation of
Peripherals [11.31429464715989]
本稿では,ディープラーニングタスクを効率的に高速化する新しいPIMアーキテクチャを提案する。
アナログ集積回路とニューラル近似周辺回路で必要となるA/D変換を最小化する。
異なるベンチマークによる評価では、Neural-PIMはエネルギー効率を5.36x (1.73x)向上し、スループットを3.43x (1.59x)向上する。
論文 参考訳(メタデータ) (2022-01-30T16:14:49Z) - ATTACC the Quadratic Bottleneck of Attention Layers [3.2741800634280245]
本稿では、ディープニューラルネットワーク(DNN)アクセラレーターのための新しいアテンション調整データフローであるFLATを紹介する。
高帯域幅で低容量のオンチップバッファを効率的に利用することで、効果的なメモリ帯域幅を増大させる。
評価では,ATTACCは最先端エッジやクラウドアクセラレータと比較して1.94倍,1.76倍,49%,42%のエネルギー削減を達成した。
論文 参考訳(メタデータ) (2021-07-13T22:23:40Z) - Energy-Efficient Model Compression and Splitting for Collaborative
Inference Over Time-Varying Channels [52.60092598312894]
本稿では,エッジノードとリモートノード間のモデル圧縮と時間変化モデル分割を利用して,エッジデバイスにおける総エネルギーコストを削減する手法を提案する。
提案手法は, 検討されたベースラインと比較して, エネルギー消費が最小限であり, 排出コストが$CO$となる。
論文 参考訳(メタデータ) (2021-06-02T07:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。