論文の概要: A Comparative Analysis of Microrings Based Incoherent Photonic GEMM
Accelerators
- arxiv url: http://arxiv.org/abs/2402.03149v3
- Date: Fri, 16 Feb 2024 19:38:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 02:55:36.476679
- Title: A Comparative Analysis of Microrings Based Incoherent Photonic GEMM
Accelerators
- Title(参考訳): マイクロリングを用いたフォトニックGEMM加速器の比較解析
- Authors: Sairam Sri Vatsavai, Venkata Sai Praneeth Karempudi, Oluwaseun
Adewunmi Alo, and Ishan Thakkar
- Abstract要約: MRRに基づくアナログフォトニックアーキテクチャは、ディープニューラルネットワークにおける行列行列行列乗法を加速するために提案されている。
GEMM関数を実装するために、これらのMRRベースのアーキテクチャは5つの異なる方法で光学信号を操作する。
これらの組織は、異なる大きさのクロストークノイズと光信号損失に影響を及ぼすことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Several microring resonator (MRR) based analog photonic architectures have
been proposed to accelerate general matrix-matrix multiplications (GEMMs) in
deep neural networks with exceptional throughput and energy efficiency. To
implement GEMM functions, these MRR-based architectures, in general, manipulate
optical signals in five different ways: (i) Splitting (copying) of multiple
optical signals to achieve a certain fan-out, (ii) Aggregation (multiplexing)
of multiple optical signals to achieve a certain fan-in, (iii) Modulation of
optical signals to imprint input values onto analog signal amplitude, (iv)
Weighting of modulated optical signals to achieve analog input-weight
multiplication, (v) Summation of optical signals. The MRR-based GEMM
accelerators undertake the first four ways of signal manipulation in an
arbitrary order ignoring the possible impact of the order of these
manipulations on their performance. In this paper, we conduct a detailed
analysis of accelerator organizations with three different orders of these
manipulations: (1) Modulation-Aggregation-Splitting-Weighting (MASW), (2)
Aggregation-Splitting-Modulation-Weighting (ASMW), and (3)
Splitting-Modulation-Weighting-Aggregation (SMWA). We show that these
organizations affect the crosstalk noise and optical signal losses in different
magnitudes, which renders these organizations with different levels of
processing parallelism at the circuit level, and different magnitudes of
throughput and energy-area efficiency at the system level. Our evaluation
results for four CNN models show that SMWA organization achieves up to
4.4$\times$, 5$\times$, and 5.2$\times$ better throughput, energy efficiency,
and area-energy efficiency, respectively, compared to ASMW and MASW
organizations on average.
- Abstract(参考訳): いくつかのマイクロリング共振器(mrr)ベースのアナログフォトニックアーキテクチャは、ディープニューラルネットワークにおける一般行列行列乗算(gemm)を非常にスループットとエネルギー効率で加速するために提案されている。
GEMM関数を実装するために、これらのMRRベースのアーキテクチャは、一般的に5つの異なる方法で光学信号を操作する。
(i)特定のファンアウトを達成するために複数の光信号の分割(コピー)
二 特定のファンインを達成するための複数の光信号の集約(多重化)
(iii)アナログ信号振幅に入力値をインプリントする光信号の変調
(iv)アナログ入力重み乗算を実現するための変調光信号の重み付け
(v)光信号の総和。
MRRベースのGEMMアクセラレータは、これらの操作の順序がパフォーマンスに与える影響を無視して、任意の順序で信号操作の最初の4つの方法を実行する。
本稿では,(1)masw,(2)asmw,(3)smwaの3種類の命令による加速器機構の詳細な分析を行った。
これらの組織は、異なる大きさのクロストークノイズと光信号損失に影響を及ぼし、回路レベルで異なるレベルの処理並列性、およびシステムレベルでのスループットとエネルギー平均効率に影響を及ぼすことを示す。
CNNの4つのモデルに対する評価結果は,ASMWやMASWに比べ,SMWAの組織がそれぞれ4.4$\times$,5$\times$,5.2$\times$のスループット,エネルギー効率,地域エネルギー効率を実現していることを示している。
関連論文リスト
- Freqformer: Frequency-Domain Transformer for 3-D Visualization and Quantification of Human Retinal Circulation [0.9487097819140653]
Freqformerはトランスフォーマーベースのアーキテクチャで、単一のスキャンから人間の網膜循環を3Dで高解像度で可視化するように設計されている。
提案手法は,最先端の畳み込みニューラルネットワーク(CNN)およびトランスフォーマーモデルより優れる。
Freqformerは網膜循環の理解と特性を著しく改善し、潜在的な臨床応用を提供する。
論文 参考訳(メタデータ) (2024-11-17T22:38:39Z) - Mode hitching in traveling-wave optical parametric amplification [0.0]
本研究は,信号とアイドラービームの古典的横方向ダイナミクスに着目した。
固定された分離を維持しながら、ビームが共伝播する傾向を示し、これはヒッチングと呼ばれる現象である。
その結果,マルチ空間モード励起光の量子イメージングへの応用が示唆された。
論文 参考訳(メタデータ) (2024-09-15T18:24:04Z) - Function Approximation for Reinforcement Learning Controller for Energy from Spread Waves [69.9104427437916]
マルチジェネレータ・ウェーブ・エナジー・コンバータ(WEC)は、スプレッド・ウェーブと呼ばれる異なる方向から来る複数の同時波を処理しなければならない。
これらの複雑な装置は、エネルギー捕獲効率、維持を制限する構造的ストレスの低減、高波に対する積極的な保護という複数の目的を持つコントローラを必要とする。
本稿では,システム力学のシーケンシャルな性質をモデル化する上で,ポリシーと批判ネットワークの異なる機能近似について検討する。
論文 参考訳(メタデータ) (2024-04-17T02:04:10Z) - Deep Learning Assisted Multiuser MIMO Load Modulated Systems for
Enhanced Downlink mmWave Communications [68.96633803796003]
本稿では, マルチユーザ負荷変調アレイ (MU-LMA) に着目し, マイクロウェーブ (mmWave) マルチインプット・マルチアウトプット (MIMO) システムにおいて, マルチユーザ負荷変調アレイ (MU-LMA) の小型化とコスト削減を図っている。
ダウンリンクMU-LMAの既存のプリコーディングアルゴリズムは、自由度と複雑なシステム構成の低下に悩まされるサブアレイ構造化(SAS)送信機に依存している。
本稿では,FAS (Full-array Structured) 送信機を用いたMU-LMAシステムを提案し,それに応じて2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-11-08T08:54:56Z) - Multiagent Reinforcement Learning with an Attention Mechanism for
Improving Energy Efficiency in LoRa Networks [52.96907334080273]
ネットワーク規模が大きくなるにつれて、パケット衝突によるLoRaネットワークのエネルギー効率は急激に低下する。
マルチエージェント強化学習(MALoRa)に基づく伝送パラメータ割り当てアルゴリズムを提案する。
シミュレーションの結果,MALoRaはベースラインアルゴリズムと比較してシステムEEを著しく改善することがわかった。
論文 参考訳(メタデータ) (2023-09-16T11:37:23Z) - An ML-assisted OTFS vs. OFDM adaptable modem [1.8492669447784602]
OTFSおよびOFDM波形は、レガシーアーキテクチャの再利用、レシーバ設計の単純さ、低複雑さ検出の利点を享受する。
本稿では,送信機におけるOTFSまたはOFDM信号処理チェーンと受信機とを切り替えて,平均二乗誤差(MSE)性能を最適化するディープニューラルネットワーク(DNN)に基づく適応方式を提案する。
論文 参考訳(メタデータ) (2023-09-04T02:33:44Z) - Resource Allocation in Multicore Elastic Optical Networks: A Deep
Reinforcement Learning Approach [47.187609203210705]
新しい環境はOpenAIのGymと互換性がある。
ネットワーク状態と物理層関連の側面を考慮してエージェントアクションを処理する。
ベストパフォーマンス剤は、ブロッキング確率の4倍の低下を達成する。
論文 参考訳(メタデータ) (2022-07-05T14:24:21Z) - A Machine Learning Based Algorithm for Joint Improvement of Power
Control, link adaptation, and Capacity in Beyond 5G Communication systems [4.649999862713524]
本稿では,5世代以上の無線通信システムの性能向上を目的とした,機械学習に基づく新しいアルゴリズムを提案する。
提案アルゴリズムは,eNodeB接続の総消費電力を削減し,合計容量を増大させる。
論文 参考訳(メタデータ) (2022-01-08T18:12:13Z) - Blind Modulation Classification via Combined Machine Learning and Signal
Feature Extraction [5.873416857161077]
低信号パワーから雑音比(SNR)における多彩な変調の認識には,機械傾きと信号特徴抽出の組み合わせが有効である
SNR=-4.2 dB では 4-QAM、SNR=2.1 dB では 4-FSK を %99 の成功率で認識できる。
論文 参考訳(メタデータ) (2021-01-12T07:58:33Z) - Performance Indicator in Multilinear Compressive Learning [106.12874293597754]
マルチリニア圧縮学習(MCL)フレームワークは,多次元信号を扱う際の知覚と学習のステップを効率的に最適化するために提案された。
本稿では,入力信号の分解能,圧縮された測定値数,MCLの学習性能の関係を解析する。
論文 参考訳(メタデータ) (2020-09-22T11:27:50Z) - Massive MIMO As an Extreme Learning Machine [83.12538841141892]
低分解能アナログ・デジタルコンバータ(ADC)を用いたMIMOシステムによる自然極端学習機械(ELM)の試作
受信した信号にランダムなバイアスを加え、ELM出力の重みを最適化することにより、システムはハードウェアの障害に効果的に取り組むことができる。
論文 参考訳(メタデータ) (2020-07-01T04:15:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。