論文の概要: DarwinWafer: A Wafer-Scale Neuromorphic Chip
- arxiv url: http://arxiv.org/abs/2509.16213v1
- Date: Sat, 30 Aug 2025 00:22:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-28 15:30:14.330738
- Title: DarwinWafer: A Wafer-Scale Neuromorphic Chip
- Title(参考訳): ダーウィン・ワファー:ワハスケールのニューロモルフィックチップ
- Authors: Xiaolei Zhu, Xiaofei Jin, Ziyang Kang, Chonghui Sun, Junjie Feng, Dingwen Hu, Zengyi Wang, Hanyue Zhuang, Qian Zheng, Huajin Tang, Shi Gu, Xin Du, De Ma, Gang Pan,
- Abstract要約: 我々は,300mmシリコンインターポーサ上に64個のDarwin3チップレットを高密度に統合し,オフチップ配線をウェハスケールで置き換えるハイパースケールシステム・オン・ウェハを提案する。
各チップレット内のGALS NoCと階層的な時間ステップ同期を備えたAERベースの非同期ウエハファブリックは、ウエハをまたいだ低レイテンシでコヒーレントな動作を提供する。
DarwinWaferは100Wを消費し、64TSOPSピークスループット(0.64TSOPS/W)で4.9pJ/SOPを達成する。
- 参考スコア(独自算出の注目度): 43.876109856399886
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neuromorphic computing promises brain-like efficiency, yet today's multi-chip systems scale over PCBs and incur orders-of-magnitude penalties in bandwidth, latency, and energy, undermining biological algorithms and system efficiency. We present DarwinWafer, a hyperscale system-on-wafer that replaces off-chip interconnects with wafer-scale, high-density integration of 64 Darwin3 chiplets on a 300 mm silicon interposer. A GALS NoC within each chiplet and an AER-based asynchronous wafer fabric with hierarchical time-step synchronization provide low-latency, coherent operation across the wafer. Each chiplet implements 2.35 M neurons and 0.1 B synapses, yielding 0.15 B neurons and 6.4 B synapses per wafer.At 333 MHz and 0.8 V, DarwinWafer consumes ~100 W and achieves 4.9 pJ/SOP, with 64 TSOPS peak throughput (0.64 TSOPS/W). Realization is enabled by a holistic chiplet-interposer co-design flow (including an in-house interposer-bump planner with early SI/PI and electro-thermal closure) and a warpage-tolerant assembly that fans out I/O via PCBlets and compliant pogo-pin connections, enabling robust, demountable wafer-to-board integration. Measurements confirm 10 mV supply droop and a uniform thermal profile (34-36 {\deg}C) under ~100 W. Application studies demonstrate whole-brain simulations: two zebrafish brains per chiplet with high connectivity fidelity (Spearman r = 0.896) and a mouse brain mapped across 32 chiplets (r = 0.645). To our knowledge, DarwinWafer represents a pioneering demonstration of wafer-scale neuromorphic computing, establishing a viable and scalable path toward large-scale, brain-like computation on silicon by replacing PCB-level interconnects with high-density, on-wafer integration.
- Abstract(参考訳): ニューロモルフィックコンピューティングは脳のような効率を約束するが、今日のマルチチップシステムはPCBを超越し、帯域幅、レイテンシ、エネルギーの大量命令を課し、生物学的アルゴリズムとシステムの効率を損なう。
我々は,300mmシリコンインターポーサ上に64個のDarwin3チップレットを高密度に統合した,オフチップ配線を置き換える超スケールシステム・オン・ウェハであるDarwinWaferを提案する。
各チップレット内のGALS NoCと階層的な時間ステップ同期を備えたAERベースの非同期ウエハファブリックは、ウエハをまたいだ低レイテンシでコヒーレントな動作を提供する。
それぞれのチップレットは2.35Mのニューロンと0.1Bのシナプスを実装し、0.15Bのニューロンと6.4Bのシナプスを持つ。
ソリスティックなチップレット-インターポーラ共設計フロー(内部のインターポーラ-バンププランナと初期のSI/PIと電気サーマルクロージャを含む)と、PCBletsを介してI/Oと準拠するポゴピン接続をファンリングするワーフページ-耐性アセンブリによって実現され、堅牢で取外し可能なウェハ-ボード統合が実現される。
応用研究では、高接続率のゼブラフィッシュ1個当たりの2つの脳(Spearman r = 0.896)と32個のチップレット(r = 0.645)にマッピングされたマウス脳(r = 0.645)のシミュレーションが示される。
私たちの知る限り、DarwinWaferはウェーハスケールのニューロモルフィックコンピューティングの先駆的な実証であり、PCBレベルの相互接続を高密度のオンウェーハ統合に置き換えることで、シリコン上の大規模で脳に似た計算への、実用的でスケーラブルなパスを確立しています。
関連論文リスト
- Ultracoherent superconducting cavity-based multiqudit platform with error-resilient control [27.481637966670217]
超伝導無線周波数(SRF)キャビティは量子コンピューティングのための有望なプラットフォームを提供する。
本稿では,2セルの楕円形SRF空洞を用いた多モード量子システムについて報告する。
我々は2つのモードで20.6msと15.6msの単光子寿命を達成する。
論文 参考訳(メタデータ) (2025-06-03T18:18:46Z) - Performance Characterization of a Multi-Module Quantum Processor with Static Inter-Chip Couplers [63.42120407991982]
フリップチップボンディングのような3次元統合技術は、大規模超伝導量子プロセッサを実現するための鍵となる前提条件である。
1つのキャリアチップと4つのキュービットモジュールからなるマルチチップモジュールの設計を提案する。
2つのキュービットを測定し,平均3レベル状態割当誤差を200 nsで9倍10~3ドルとした。
ランダム化ベンチマークから抽出した7×10〜3$の誤差で100 nsの制御Z2量子ゲートを実演する。
論文 参考訳(メタデータ) (2025-03-16T18:32:44Z) - Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based? [89.05848771674773]
MISO (Multiple-input Single-output) フレームワークを提案する。
それは複数の導波路で構成されており、多数の低コストアンテナ(PA)を備えている。
PAの位置は、大規模パスと空間の両方にまたがるように再構成することができる。
論文 参考訳(メタデータ) (2025-02-12T18:54:10Z) - InfiniteHBD: Building Datacenter-Scale High-Bandwidth Domain for LLM with Optical Circuit Switching Transceivers [37.89954553921228]
HBD(High-Bandwidth Domains)は、並列処理のような通信集約型並列処理において重要である。
スイッチ中心のHBDはスケールコストを禁ずるが、GPU中心のHBDは深刻な障害伝播に悩まされる。
本稿では,トランシーバレベルにおける接続性と動的スイッチングを統合した,トランシーバ中心のHBDアーキテクチャであるInfiniteHBDを提案する。
論文 参考訳(メタデータ) (2025-02-06T09:01:24Z) - Scaling Up 3D Kernels with Bayesian Frequency Re-parameterization for
Medical Image Segmentation [25.62587471067468]
RepUX-Netは、単純な大きなカーネルブロック設計を持つ純粋なCNNアーキテクチャである。
人間の視覚系における空間周波数にインスパイアされ、カーネル収束を要素的設定に変化させるよう拡張する。
論文 参考訳(メタデータ) (2023-03-10T08:38:34Z) - Improving Efficiency in Large-Scale Decentralized Distributed Training [58.80224380923698]
通信コストを最小化しつつ、スペクトルギャップを改善して(A)D-PSGDに基づくトレーニングを加速する手法を提案する。
提案手法の有効性を示すために,2000時間Switchboard音声認識タスクとImageNetコンピュータビジョンタスクの実験を行った。
論文 参考訳(メタデータ) (2020-02-04T04:29:09Z) - Near-degenerate quadrature-squeezed vacuum generation on a
silicon-nitride chip [54.87128096861778]
本報告では, 小型プリントシリコン窒化ケイ素マイクロ共振器と2重励起4波混合方式を用いて, 高周波キャリアサイドバンドの4相圧縮状態の生成を実証する。
このシステムでは, ポンプの非線形挙動を考慮し, 発生可能なスクイーズを適切に予測することが重要である。
論文 参考訳(メタデータ) (2020-02-04T01:41:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。