論文の概要: Towards Topology-Aware Very Large-Scale Photonic AI Accelerators
- arxiv url: http://arxiv.org/abs/2604.26966v1
- Date: Thu, 16 Apr 2026 22:38:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.251942
- Title: Towards Topology-Aware Very Large-Scale Photonic AI Accelerators
- Title(参考訳): トポロジーを意識した大規模フォトニックAI加速器を目指して
- Authors: Belal Jahannia, Abdolah Amirany, Hamed Dalir,
- Abstract要約: フォトニック加速器は、その固有の並列性と高速マトリックス演算のために、魅力的な代替手段を提供する。
4X4フォトニックテンソルコアユニットを用いたモジュラースケールアウトパラダイムに基づくスケーラブルなフォトニックアクセルアーキテクチャを提案する。
我々は、対称トポロジが線形構成に比べて最大6倍のメモリアクセスを40%以上削減し、利用率を向上させることを実証するシンメトリ・グリッド・ルールを確立した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid growth of deep neural networks (DNNs) has exposed fundamental limitations in electronic accelerators, where data movement dominates energy consumption, commonly referred to as the memory wall. Photonic accelerators offer a compelling alternative due to their inherent parallelism and high-speed matrix operations. However, existing research largely focuses on device-level innovations, leaving system-level scalability insufficiently explored. In this paper, we present a scalable photonic accelerator architecture based on a modular scale-out paradigm using 4 X 4 photonic tensor core units. We perform a systematic architectural analysis that incorporates the practical scaling limits of photonic hardware, including insertion loss, fanout penalties, and laser power limits, which restrict monolithic photonic scaling. Through evaluation on representative DNN workloads (GoogleNet, ResNet-18, MobileNet, and AlphaGo Zero) with up to 1024 processing elements, we identify a topology-dominated scaling bottleneck in the photonic domain, termed the Utilization Wall, where performance is governed by grid topology rather than hardware size. We further establish the Symmetric Grid Rule, demonstrating that symmetric topologies improve utilization by up to 6X while reducing memory access by over 40% compared to linear configurations, which reveal that topology-aware scaling is essential for achieving energy-efficient and high-performance photonic AI accelerators.
- Abstract(参考訳): ディープニューラルネットワーク(DNN)の急速な成長により、データ移動がエネルギー消費を支配している電子加速器の基本的限界が明らかになった。
フォトニック加速器は、その固有の並列性と高速マトリックス演算のために、魅力的な代替手段を提供する。
しかし、既存の研究は主にデバイスレベルの革新に焦点を当てており、システムレベルのスケーラビリティは十分に調査されていない。
本稿では,4X 4光子テンソルコアユニットを用いたモジュラースケールアウトパラダイムに基づくスケーラブルなフォトニックアクセラアーキテクチャを提案する。
我々は、挿入損失、ファンアウトペナルティ、およびモノリシックフォトニックスケーリングを制限するレーザーパワー制限を含む、フォトニックハードウェアの実用的なスケーリング限界を組み込んだアーキテクチャ解析を行う。
代表的なDNNワークロード(GoogleNet、ResNet-18、MobileNet、AlphaGo Zero)を最大1024の処理要素で評価することにより、フォトニック領域におけるトポロジに支配的なスケーリングボトルネックを特定します。
さらに、対称トポロジが線形構成に比べて最大6倍のメモリアクセスを40%以上削減できることを示し、エネルギー効率と高性能なフォトニックAIアクセラレータを実現するためにはトポロジ対応のスケーリングが不可欠であることを示した。
関連論文リスト
- Evolutionary Mapping of Neural Networks to Spatial Accelerators [64.13809409887254]
ニューロモルフィック加速器のための最初の進化的ハードウェア・イン・ザ・ループマッピングフレームワークを紹介する。
我々は,2次元メッシュに152コアを配置した空間加速器であるIntel Loihi 2のアプローチを評価した。
提案手法は,2つのスパース多層パーセプトロンネットワーク上でのデフォルトコアと比較して,最大35%のレイテンシ削減を実現している。
論文 参考訳(メタデータ) (2026-02-04T16:28:08Z) - LuxIA: A Lightweight Unitary matriX-based Framework Built on an Iterative Algorithm for Photonic Neural Network Training [36.03523572070848]
アートPNNシミュレーションツールの現状は,大規模PNNのトレーニングにおいて,大きなスケーラビリティ上の課題に直面している。
バックプロパゲーションに適合する効率的な転送行列計算手法であるスライシング法を提案する。
スライシング方式はメモリ使用量と実行時間を大幅に削減し、大規模PNNのスケーラブルなシミュレーションとトレーニングを可能にする。
論文 参考訳(メタデータ) (2025-12-24T17:31:51Z) - What Is Next for LLMs? Next-Generation AI Computing Hardware Using Photonic Chips [34.52960723566363]
大規模言語モデル(LLM)は、現代のコンピューティングハードウェアの限界を急速に押し上げている。
このレビューでは、次世代世代AIコンピューティングに最適化された新興フォトニックハードウェアについて調査する。
論文 参考訳(メタデータ) (2025-05-09T05:19:14Z) - Hardware-Efficient Photonic Tensor Core: Accelerating Deep Neural Networks with Structured Compression [15.665630650382226]
本稿では,構造圧縮型光ニューラルネットワーク(StrC-ONN)アーキテクチャのためのブロック循環型フォトニックテンソルコアを提案する。
この研究は、実用的でスケーラブルなONNへの新たな道筋を探求し、将来の計算効率の課題に対処するための有望な道筋を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-02-01T17:03:45Z) - Streamlined optical training of large-scale modern deep learning architectures with direct feedback alignment [48.90869997343841]
我々は,ハイブリッド電子フォトニックプラットフォーム上で,ダイレクトフィードバックアライメントと呼ばれる多目的でスケーラブルなトレーニングアルゴリズムを実験的に実装した。
光処理ユニットは、30ワット以下の1500テラオプスで大規模なランダム行列乗算を行う。
トレーニング時間のスケーリングについて検討し、超深度・広帯域ニューラルネットワークに対するハイブリッド光電子アプローチの潜在的な利点を実証する。
論文 参考訳(メタデータ) (2024-09-01T12:48:47Z) - Random resistive memory-based deep extreme point learning machine for
unified visual processing [67.51600474104171]
ハードウェア・ソフトウェア共同設計型, ランダム抵抗型メモリベース深部極点学習マシン(DEPLM)を提案する。
我々の共同設計システムは,従来のシステムと比較して,エネルギー効率の大幅な向上とトレーニングコストの削減を実現している。
論文 参考訳(メタデータ) (2023-12-14T09:46:16Z) - All-optical graph representation learning using integrated diffractive
photonic computing units [51.15389025760809]
フォトニックニューラルネットワークは、電子の代わりに光子を用いて脳にインスパイアされた計算を行う。
我々は、DGNN(diffractive graph neural network)と呼ばれる全光グラフ表現学習アーキテクチャを提案する。
ベンチマークデータベースを用いたノードおよびグラフレベルの分類タスクにおけるDGNN抽出機能の利用を実演し、優れた性能を実現する。
論文 参考訳(メタデータ) (2022-04-23T02:29:48Z) - FPGA-optimized Hardware acceleration for Spiking Neural Networks [69.49429223251178]
本研究は,画像認識タスクに適用したオフライントレーニングによるSNN用ハードウェアアクセラレータの開発について述べる。
この設計はXilinx Artix-7 FPGAをターゲットにしており、利用可能なハードウェアリソースの40%を合計で使用している。
分類時間を3桁に短縮し、ソフトウェアと比較すると精度にわずか4.5%の影響を与えている。
論文 参考訳(メタデータ) (2022-01-18T13:59:22Z) - Silicon photonic subspace neural chip for hardware-efficient deep
learning [11.374005508708995]
光ニューラルネットワーク(ONN)は次世代のニューロコンピューティングの候補として期待されている。
ハードウェア効率の良いフォトニックサブスペースニューラルネットワークアーキテクチャを考案する。
我々は,バタフライ型プログラマブルシリコンフォトニック集積回路上でPSNNを実験的に実証した。
論文 参考訳(メタデータ) (2021-11-11T06:34:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。