論文の概要: Physics-inspired Ising Computing with Ring Oscillator Activated p-bits
- arxiv url: http://arxiv.org/abs/2205.07402v1
- Date: Sun, 15 May 2022 23:46:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-13 02:07:58.894650
- Title: Physics-inspired Ising Computing with Ring Oscillator Activated p-bits
- Title(参考訳): リングオシレータ活性化pビットを用いた物理インスピレーションイジング計算
- Authors: Navid Anjum Aadit, Andrea Grimaldi, Giovanni Finocchio, and Kerem Y.
Camsari
- Abstract要約: 我々は800pビットの真に非同期で中規模のpコンピュータを設計・実装する。
我々は,非同期アーキテクチャの性能を,理想的な同期設計と比較した。
我々の結果は、何百万ものフリーランニングpビットを持つ大規模pビットコンピュータの可能性を浮き彫りにしている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The nearing end of Moore's Law has been driving the development of
domain-specific hardware tailored to solve a special set of problems. Along
these lines, probabilistic computing with inherently stochastic building blocks
(p-bits) have shown significant promise, particularly in the context of hard
optimization and statistical sampling problems. p-bits have been proposed and
demonstrated in different hardware substrates ranging from small-scale
stochastic magnetic tunnel junctions (sMTJs) in asynchronous architectures to
large-scale CMOS in synchronous architectures. Here, we design and implement a
truly asynchronous and medium-scale p-computer (with $\approx$ 800 p-bits) that
closely emulates the asynchronous dynamics of sMTJs in Field Programmable Gate
Arrays (FPGAs). Using hard instances of the planted Ising glass problem on the
Chimera lattice, we evaluate the performance of the asynchronous architecture
against an ideal, synchronous design that performs parallelized (chromatic)
exact Gibbs sampling. We find that despite the lack of any careful
synchronization, the asynchronous design achieves parallelism with comparable
algorithmic scaling in the ideal, carefully tuned and parallelized synchronous
design. Our results highlight the promise of massively scaled p-computers with
millions of free-running p-bits made out of nanoscale building blocks such as
stochastic magnetic tunnel junctions.
- Abstract(参考訳): ムーアの法則の終わりに近づき、特殊な問題の解決に適したドメイン固有のハードウェアの開発が進められている。
これらの線に沿って、本質的に確率的構造ブロック (p-bits) を持つ確率論的計算は、特にハード最適化や統計的サンプリング問題において有望であることを示した。
p-bitが提案され、非同期アーキテクチャにおける小規模確率磁気トンネル接合(sMTJ)から同期アーキテクチャにおける大規模CMOSまで、様々なハードウェア基板で実証されている。
そこで我々は、フィールドプログラマブルゲートアレイ(FPGA)におけるsMTJの非同期ダイナミクスを密にエミュレートした、真に非同期で中規模なp-コンピュータ($\approx$800 p-bits)を設計、実装する。
キメラ格子上の植え付けられたイジングガラス問題のハードインスタンスを用いて,並列化(色的)正確なギブスサンプリングを行う理想的な同期設計に対して,非同期アーキテクチャの性能を評価する。
注意深い同期の欠如にもかかわらず、非同期設計は理想的かつ注意深く調整され、並列化された同期設計において、同等のアルゴリズムスケーリングで並列性を達成する。
以上の結果から,確率的磁気トンネル接合などナノスケールの建築ブロックで作られた数百万のフリーランニングpビットを用いた大規模p-コンピュータの実現が示唆された。
関連論文リスト
- MindFlayer: Efficient Asynchronous Parallel SGD in the Presence of Heterogeneous and Random Worker Compute Times [49.1574468325115]
並列作業者の助けを借りてスムーズな非関数の期待を最小化する問題について検討する。
本稿では,ノイズの重み付けを行う新しい非同期SGD手法であるMindlayer SGDを提案する。
我々の理論は、ノイズが重く尾行されている場合に、Mindlayer SGDの優位性を実証するものである。
論文 参考訳(メタデータ) (2024-10-05T21:11:32Z) - Freya PAGE: First Optimal Time Complexity for Large-Scale Nonconvex Finite-Sum Optimization with Heterogeneous Asynchronous Computations [92.1840862558718]
実用的な分散システムでは、労働者は概して均質ではなく、非常に多様な処理時間を持つ。
本稿では、任意に遅い計算を扱うための新しい並列手法Freyaを提案する。
Freyaは従来の手法と比較して,複雑性の保証が大幅に向上していることを示す。
論文 参考訳(メタデータ) (2024-05-24T13:33:30Z) - Scalable Parity Architecture With a Shuttling-Based Spin Qubit Processor [0.32985979395737786]
本稿では、Parity Quantum Approximate Optimization Algorithm (QAOA)を実装したスピンシャットリングと量子ゲートのシーケンスを示す。
本稿では,Parity Architectureのハードウェア固有の解析のための詳細なエラーモデルを開発する。
その結果,高忠実度スピンシャットリングでは,スピン量子ビットの性能は競争力があり,トランスモンの結果を超えていることがわかった。
論文 参考訳(メタデータ) (2024-03-14T17:06:50Z) - Parallelized Spatiotemporal Binding [47.67393266882402]
逐次入力のための最初の時間並列化可能なスロット学習アーキテクチャであるPSB(Parallelizable Spatiotemporal Binder)を導入する。
従来のRNNベースのアプローチとは異なり、PSBは全ての時間ステップを並列に、スロットとして知られるオブジェクト中心の表現を生成する。
現状と比較して、我々のアーキテクチャはより長いシーケンスで安定したトレーニングを行い、トレーニング速度が60%向上する並列化を実現し、教師なしの2Dおよび3Dオブジェクト中心のシーン分解と理解に匹敵する性能を得る。
論文 参考訳(メタデータ) (2024-02-26T23:16:34Z) - Robust Fully-Asynchronous Methods for Distributed Training over General Architecture [11.480605289411807]
分散機械学習問題における完全な同期は、レイテンシ、パッケージの損失、ストラグラーの存在のため、非効率であり、不可能である。
本稿では,R-FAST (Fully-Asynchronous Gradient Tracking Method) を提案する。
論文 参考訳(メタデータ) (2023-07-21T14:36:40Z) - Biologically Plausible Learning on Neuromorphic Hardware Architectures [27.138481022472]
ニューロモルフィックコンピューティング(Neuromorphic Computing)は、アナログメモリの計算によってこの不均衡に直面している新興パラダイムである。
この研究は、異なる学習アルゴリズムがCompute-In-Memoryベースのハードウェアに与える影響を初めて比較し、その逆も行った。
論文 参考訳(メタデータ) (2022-12-29T15:10:59Z) - Model-Architecture Co-Design for High Performance Temporal GNN Inference
on FPGA [5.575293536755127]
実世界のアプリケーションは、リアルタイムストリーミング動的グラフに対して高いパフォーマンスの推論を必要とする。
本稿では,FPGA上でのメモリベースTGNNの推論のための新しいモデルアーキテクチャ共設計を提案する。
我々は、知識蒸留を用いて単純化されたモデルを訓練し、元のモデルと同じような精度でビザビザビザビザを保証します。
論文 参考訳(メタデータ) (2022-03-10T00:24:47Z) - Scaling Quantum Approximate Optimization on Near-term Hardware [49.94954584453379]
我々は、様々なレベルの接続性を持つハードウェアアーキテクチャのための最適化回路により、期待されるリソース要求のスケーリングを定量化する。
問題の大きさと問題グラフの次数で指数関数的に増大する。
これらの問題は、ハードウェア接続性の向上や、より少ない回路層で高い性能を達成するQAOAの変更によって緩和される可能性がある。
論文 参考訳(メタデータ) (2022-01-06T21:02:30Z) - Adaptive Fourier Neural Operators: Efficient Token Mixers for
Transformers [55.90468016961356]
本稿では,Fourierドメインのミキシングを学習する効率的なトークンミキサーを提案する。
AFNOは、演算子学習の原則的基礎に基づいている。
65kのシーケンスサイズを処理でき、他の効率的な自己認識機構より優れている。
論文 参考訳(メタデータ) (2021-11-24T05:44:31Z) - Distributed stochastic optimization with large delays [59.95552973784946]
大規模最適化問題を解決する最も広く使われている手法の1つは、分散非同期勾配勾配(DASGD)である。
DASGDは同じ遅延仮定の下で大域的最適実装モデルに収束することを示す。
論文 参考訳(メタデータ) (2021-07-06T21:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。