論文の概要: TeMPO: Efficient Time-Multiplexed Dynamic Photonic Tensor Core for Edge
AI with Compact Slow-Light Electro-Optic Modulator
- arxiv url: http://arxiv.org/abs/2402.07393v1
- Date: Mon, 12 Feb 2024 03:40:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 15:42:47.117985
- Title: TeMPO: Efficient Time-Multiplexed Dynamic Photonic Tensor Core for Edge
AI with Compact Slow-Light Electro-Optic Modulator
- Title(参考訳): TeMPO: 小型スロー光電気光学変調器を用いたエッジAIのための効率的な時間多重動的フォトニックテンソルコア
- Authors: Meng Zhang, Dennis Yin, Nicholas Gangi, Amir Begovi\'c, Alexander
Chen, Zhaoran Rena Huang, Jiaqi Gu
- Abstract要約: 我々は,TMPOと呼ばれる時間多重化動的フォトニックテンソルアクセラレータを,クロス層デバイス/回路/アーキテクチャのカスタマイズにより提案する。
我々は,368.6TOPSピーク性能,22.3TOPS/Wエネルギー効率,1.2TOPS/mm$2$計算密度を実現した。
この研究は、多層共設計とドメイン固有のカスタマイズの力を示し、将来の電子フォトニクス加速器への道を開く。
- 参考スコア(独自算出の注目度): 44.74560543672329
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electronic-photonic computing systems offer immense potential in
energy-efficient artificial intelligence (AI) acceleration tasks due to the
superior computing speed and efficiency of optics, especially for real-time,
low-energy deep neural network (DNN) inference tasks on resource-restricted
edge platforms. However, current optical neural accelerators based on
foundry-available devices and conventional system architecture still encounter
a performance gap compared to highly customized electronic counterparts. To
bridge the performance gap due to lack of domain specialization, we present a
time-multiplexed dynamic photonic tensor accelerator, dubbed TeMPO, with
cross-layer device/circuit/architecture customization. At the device level, we
present foundry-compatible, customized photonic devices, including a slow-light
electro-optic modulator with experimental demonstration, optical splitters, and
phase shifters that significantly reduce the footprint and power in input
encoding and dot-product calculation. At the circuit level, partial products
are hierarchically accumulated via parallel photocurrent aggregation,
lightweight capacitive temporal integration, and sequential digital summation,
considerably relieving the analog-to-digital conversion bottleneck. We also
employ a multi-tile, multi-core architecture to maximize hardware sharing for
higher efficiency. Across diverse edge AI workloads, TeMPO delivers
digital-comparable task accuracy with superior quantization/noise tolerance. We
achieve a 368.6 TOPS peak performance, 22.3 TOPS/W energy efficiency, and 1.2
TOPS/mm$^2$ compute density, pushing the Pareto frontier in edge AI hardware.
This work signifies the power of cross-layer co-design and domain-specific
customization, paving the way for future electronic-photonic accelerators with
even greater performance and efficiency.
- Abstract(参考訳): 電子フォトニックコンピューティングシステムは、特にリソース制限されたエッジプラットフォーム上のリアルタイムで低エネルギーのディープニューラルネットワーク(DNN)推論タスクにおいて、光学の優れた計算速度と効率のために、エネルギー効率のよい人工知能(AI)加速タスクにおいて大きなポテンシャルを提供する。
しかし、鋳造可能なデバイスと従来のシステムアーキテクチャに基づく現在の光ニューラルアクセラレーションは、高度にカスタマイズされた電子アクセラレーションと比較して、依然として性能のギャップに遭遇している。
ドメイン特殊化の欠如による性能ギャップを埋めるため,TMPOと呼ばれる時間多重化動的フォトニックテンソルアクセラレータを,クロス層デバイス/回路/アーキテクチャのカスタマイズにより提案する。
デバイスレベルでは、試験的なデモンストレーション、光スプリッター、および入力エンコーディングとドット製品計算におけるフットプリントと電力を大幅に削減する位相シフト器を備えた、低光電気光学変調器を含む、ファウンデーション互換でカスタマイズされたフォトニックデバイスを提供する。
回路レベルでは、部分積は並列光電流アグリゲーション、軽量容量時間積分、シーケンシャルデジタル和によって階層的に蓄積され、アナログ-デジタル変換ボトルネックをかなり軽減する。
また、高速なハードウェア共有を最大化するマルチタイルマルチコアアーキテクチャも採用しています。
さまざまなエッジaiワークロードにまたがって、tempoはデジタル比較可能なタスク精度と優れた量子化/ノイズ耐性を提供します。
368.6 TOPSのピーク性能、22.3 TOPS/Wエネルギー効率、1.2 TOPS/mm$^2$計算密度を実現し、エッジAIハードウェアにおけるParetoフロンティアを推し進める。
この研究は、クロスレイヤーのコデザインとドメイン固有のカスタマイズの力を示し、将来の電子フォトニック加速器にさらなる性能と効率をもたらす道を開く。
関連論文リスト
- Multi-Dimensional Reconfigurable, Physically Composable Hybrid Diffractive Optical Neural Network [15.804251049405584]
物理的に構成可能なハイブリッド拡散型ONNシステム(MDR-HDONN)を導入する。
フルシステムの学習性を活用することで、MDR-HDONNは固定化された光学ハードウェアを再利用し、指数関数的に拡張された機能を実現し、タスク適応性を向上させる。
MDR-HDONNは、74倍高速で194倍低エネルギーの様々なタスク適応に対してデジタル比較可能な精度を持つ。
論文 参考訳(メタデータ) (2024-11-08T18:08:49Z) - Optical training of large-scale Transformers and deep neural networks with direct feedback alignment [48.90869997343841]
我々は,ハイブリッド電子フォトニックプラットフォーム上で,ダイレクトフィードバックアライメントと呼ばれる多目的でスケーラブルなトレーニングアルゴリズムを実験的に実装した。
光処理ユニットは、このアルゴリズムの中央動作である大規模ランダム行列乗算を最大1500テラOpsで行う。
我々は、ハイブリッド光アプローチの計算スケーリングについて検討し、超深度・広帯域ニューラルネットワークの潜在的な利点を実証する。
論文 参考訳(メタデータ) (2024-09-01T12:48:47Z) - SCATTER: Algorithm-Circuit Co-Sparse Photonic Accelerator with Thermal-Tolerant, Power-Efficient In-situ Light Redistribution [7.378742476019604]
フォトニックコンピューティングは、計算集約人工知能(AI)ワークロードを加速するための有望なソリューションとして登場した。
しかし、リコンフィグアビリティの制限、高電気光学変換コスト、サーマル感度は、現在の光学アナログコンピューティングエンジンの展開を制限し、大規模に電力制限されたパフォーマンスに敏感なAIワークロードをサポートする。
SCATTERは、耐熱性、高効率な光再分配、パワーゲーティングによる動的再構成可能な信号経路を特徴とする、新しいアルゴリズム・回路共分散フォトニックアクセラレータである。
論文 参考訳(メタデータ) (2024-07-07T22:57:44Z) - Random resistive memory-based deep extreme point learning machine for
unified visual processing [67.51600474104171]
ハードウェア・ソフトウェア共同設計型, ランダム抵抗型メモリベース深部極点学習マシン(DEPLM)を提案する。
我々の共同設計システムは,従来のシステムと比較して,エネルギー効率の大幅な向上とトレーニングコストの削減を実現している。
論文 参考訳(メタデータ) (2023-12-14T09:46:16Z) - Integrated multi-operand optical neurons for scalable and
hardware-efficient deep learning [10.157562103034]
この研究は、カスタマイズされたマルチオペランドフォトニックデバイスに基づくスケーラブルで効率的な光学ドット生成エンジンを提案する。
画像認識におけるマルチオペランドMach-Zehnder-Interferometer (MOMZI) を用いたMOONの有用性を実験的に実証した。
論文 参考訳(メタデータ) (2023-05-31T06:25:39Z) - High-Speed and Energy-Efficient Non-Binary Computing with Polymorphic
Electro-Optic Circuits and Architectures [0.0]
ポリモルフィックE-O回路は、異なる論理と算術関数を実装するために動的にプログラムできる。
回路は、非バイナリフォーマットでデータのエネルギー効率の高い処理をサポートすることができる。
回路は、二項化および整数量子化畳み込みニューラルネットワークを処理するためのE-O計算アクセラレータアーキテクチャを可能にする。
論文 参考訳(メタデータ) (2023-04-15T18:20:56Z) - Data-Model-Circuit Tri-Design for Ultra-Light Video Intelligence on Edge
Devices [90.30316433184414]
本稿では,HDビデオストリーム上での高スループット,低コスト,高精度MOTのためのデータモデル・ハードウエア・トリデザイン・フレームワークを提案する。
現状のMOTベースラインと比較して、我々の三設計アプローチは12.5倍の遅延低減、20.9倍のフレームレート改善、5.83倍の低消費電力、9.78倍のエネルギー効率を実現でき、精度は低下しない。
論文 参考訳(メタデータ) (2022-10-16T16:21:40Z) - Single-Shot Optical Neural Network [55.41644538483948]
深層ニューラルネットワークに必要な計算資源を削減するために,「重定常」アナログ光学・電子ハードウェアが提案されている。
我々は、スケーラブルで1層当たり単発の重み付き光学プロセッサを提案する。
論文 参考訳(メタデータ) (2022-05-18T17:49:49Z) - EdgeBERT: Sentence-Level Energy Optimizations for Latency-Aware
Multi-Task NLP Inference [82.1584439276834]
BERTのようなトランスフォーマーベースの言語モデルでは、自然言語処理(NLP)タスクの精度が大幅に向上する。
We present EdgeBERT, a in-deepth algorithm- hardware co-design for latency-aware energy optimization for multi-task NLP。
論文 参考訳(メタデータ) (2020-11-28T19:21:47Z) - Photonic tensor cores for machine learning [0.0]
本稿では,行列ベクトルの乗算と和を行うためのフォトニクスベースのTPUを提案する。
この8ビットフォトニックTPUの性能は、同様のチップ領域を特徴とする電気的TPUよりも2~3桁高い。
この研究は、フォトニック特化プロセッサが電子システムを増強する可能性を示し、5Gネットワークを略奪するネットワークエッジデバイスで異常によく機能する可能性があることを示している。
論文 参考訳(メタデータ) (2020-02-01T14:11:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。