論文の概要: Lifetime-based Optimization for Simulating Quantum Circuits on a New
Sunway Supercomputer
- arxiv url: http://arxiv.org/abs/2205.00393v2
- Date: Wed, 7 Dec 2022 07:58:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-14 23:11:46.880400
- Title: Lifetime-based Optimization for Simulating Quantum Circuits on a New
Sunway Supercomputer
- Title(参考訳): 新しいサンウェイスーパーコンピュータ上での量子回路シミュレーションのためのライフタイムベース最適化
- Authors: Yaojian Chen, Yong Liu, Xinmin Shi, Jiawei Song, Xin Liu, Lin Gan, Chu
Guo, Haohuan Fu, Jie Gao, Dexun Chen, Guangwen Yang
- Abstract要約: 本稿では,スライシングオーバーヘッドを低減し,計算効率を向上させる新しい手法を提案する。
結果のシミュレーション時間は、Sycamore量子プロセッサRQCの89.1秒に短縮される。
- 参考スコア(独自算出の注目度): 18.42903358326628
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-performance classical simulator for quantum circuits, in particular the
tensor network contraction algorithm, has become an important tool for the
validation of noisy quantum computing. In order to address the memory
limitations, the slicing technique is used to reduce the tensor dimensions, but
it could also lead to additional computation overhead that greatly slows down
the overall performance. This paper proposes novel lifetime-based methods to
reduce the slicing overhead and improve the computing efficiency, including, an
interpretation method to deal with slicing overhead, an inplace slicing
strategy to find the smallest slicing set and an adaptive tensor network
contraction path refiner customized for Sunway architecture. Experiments show
that in most cases the slicing overhead with our inplace slicing strategy would
be less than the Cotengra , which is the most used graph path optimization
software at present. Finally, the resulting simulation time is reduced to 89.1s
for the Sycamore quantum processor RQC, with a sustainable single-precision
performance of 308.6Pflops using over 41M cores to generate 1M correlated
samples, which is more than 5 times performance improvement compared to 60.4
Pflops in 2021 Gordon Bell Prize work.
- Abstract(参考訳): 量子回路の高性能な古典的シミュレータ、特にテンソルネットワーク縮小アルゴリズムは、ノイズ量子コンピューティングの検証において重要なツールとなっている。
メモリ制限に対処するために、スライシング技術はテンソル次元を減らすために使用されるが、全体的なパフォーマンスを著しく低下させる計算オーバーヘッドを増加させる可能性がある。
本論文では,スライスオーバを削減し,スライスオーバを扱う解釈手法,最小スライスセットを見つけるためのインプレーススライス戦略,サンウェイアーキテクチャ用にカスタマイズされた適応テンソルネットワーク収縮パスリファクタなど,スライスオーバを削減し,計算効率を向上させるための新しいライフスライス手法を提案する。
実験によると、ほとんどの場合、インプレーススライシング戦略によるスライシングオーバーヘッドは、現在最も使われているグラフパス最適化ソフトウェアであるCotengraよりも小さい。
最後に、シカモア量子プロセッサRQCのシミュレーション時間は89.1秒に短縮され、41Mコア以上の1M相関サンプルを生成するために、持続的な単精度性能は308.6Pflopsであり、2021年のゴードンベル賞の60.4Pflopsに比べて5倍以上の性能向上である。
関連論文リスト
- Quantum-Classical Computing via Tensor Networks [0.6086160084025234]
テンソルネットワークを用いたスケーラブルなハイブリッド量子古典処理のためのフレームワークであるqTPUを紹介する。
ハイブリッド量子回路の収縮法を利用して、回路実行をハイブリッドテンソルネットワーク(h-TN)の収縮として表現する。
qTPUコンパイラは効率的なh-TN生成を自動化し、推定エラーと後処理オーバーヘッドのバランスを最適化する。
論文 参考訳(メタデータ) (2024-10-19T11:57:05Z) - Graph-based identification of qubit network (GidNET) for qubit reuse [9.435498822573734]
GidNETは量子回路における量子ビットの再利用を最適化するためのアルゴリズムである。
回路幅の低減において、Qiskitを一貫して上回る。
量子コンピュータの量子ビット数に制限のある解を提供する。
論文 参考訳(メタデータ) (2024-10-11T14:00:11Z) - Fast, Scalable, Warm-Start Semidefinite Programming with Spectral
Bundling and Sketching [53.91395791840179]
我々は、大規模なSDPを解くための、証明可能な正確で高速でスケーラブルなアルゴリズムであるUnified Spectral Bundling with Sketching (USBS)を提案する。
USBSは、20億以上の決定変数を持つインスタンス上で、最先端のスケーラブルなSDP解決器よりも500倍のスピードアップを提供する。
論文 参考訳(メタデータ) (2023-12-19T02:27:22Z) - Efficient Quantum Circuit Simulation by Tensor Network Methods on Modern GPUs [11.87665112550076]
量子ハードウェアでは、一次シミュレーション法は状態ベクトルとテンソルネットワークに基づいている。
量子ビットと量子ゲートの数が増加するにつれて、ヒルベルト空間の圧倒的な大きさと広範な絡み合いにより、従来の状態ベクトルベースの量子回路シミュレーション手法は不十分であることが証明される。
本研究では,計算効率と精度の2つの側面から最適化手法を提案する。
論文 参考訳(メタデータ) (2023-10-06T02:24:05Z) - Tensor Slicing and Optimization for Multicore NPUs [2.670309629218727]
本稿では,Slicing Optimization (TSO) と呼ばれるマルチコアNPUに対するコンパイラ最適化パスを提案する。
TSOは、一連のCNNモデルの実行時間を最小化する最高のテンソルスライシングを特定する。
その結果、TSOは一連のCNNモデルの実行時間を最小化する最適なテンソルスライシングを識別できることがわかった。
論文 参考訳(メタデータ) (2023-04-06T12:03:03Z) - Towards Memory- and Time-Efficient Backpropagation for Training Spiking
Neural Networks [70.75043144299168]
スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックコンピューティングのためのエネルギー効率の高いモデルである。
本研究では,学習効率を大幅に向上させつつ,高い性能を達成できる空間学習時間(SLTT)法を提案する。
BPTTと比較して, メモリコストとトレーニング時間は, それぞれ70%以上, 50%以上削減されている。
論文 参考訳(メタデータ) (2023-02-28T05:01:01Z) - Quantized Neural Networks for Low-Precision Accumulation with Guaranteed
Overflow Avoidance [68.8204255655161]
本稿では,推定時のアキュムレータの精度を下げる際に,数値オーバーフローを回避する量子化学習アルゴリズムを提案する。
本手法は,浮動小数点点ベースラインに対するモデル精度を維持しつつ,アキュムレータの精度を低減できることを示す。
論文 参考訳(メタデータ) (2023-01-31T02:46:57Z) - Efficient Dataset Distillation Using Random Feature Approximation [109.07737733329019]
本稿では,ニューラルネットワークガウス過程(NNGP)カーネルのランダム特徴近似(RFA)を用いた新しいアルゴリズムを提案する。
我々のアルゴリズムは、KIP上で少なくとも100倍のスピードアップを提供し、1つのGPUで実行できる。
RFA蒸留 (RFAD) と呼ばれる本手法は, 大規模データセットの精度において, KIP や他のデータセット凝縮アルゴリズムと競合して動作する。
論文 参考訳(メタデータ) (2022-10-21T15:56:13Z) - Closing the "Quantum Supremacy" Gap: Achieving Real-Time Simulation of a
Random Quantum Circuit Using a New Sunway Supercomputer [8.314468031947694]
我々は,新しいサンウェイスーパーコンピュータ上でランダム量子回路(RQC)のための高性能テンソルベースシミュレータを開発した。
主なイノベーションは,(1) ほぼ最適スライシングスキーム,(2) 複雑度と計算密度の両方を考慮したパス最適化戦略,(2) 約4200万コアにスケールする3レベル並列化スキーム,(3) 幅広いテンソル収縮シナリオの計算効率を向上させる融合置換および乗算設計である。
論文 参考訳(メタデータ) (2021-10-27T15:14:59Z) - Ps and Qs: Quantization-aware pruning for efficient low latency neural
network inference [56.24109486973292]
超低遅延アプリケーションのためのニューラルネットワークのトレーニング中の分級と量子化の相互作用を研究します。
量子化アウェアプルーニングは,タスクのプルーニングや量子化のみよりも計算効率のよいモデルであることが判明した。
論文 参考訳(メタデータ) (2021-02-22T19:00:05Z) - Non-Parametric Adaptive Network Pruning [125.4414216272874]
アルゴリズム設計を簡略化するノンパラメトリックモデリングを導入。
顔認識コミュニティに触発されて,メッセージパッシングアルゴリズムを用いて,適応的な例示数を求める。
EPrunerは「重要」フィルタを決定する際にトレーニングデータへの依存を壊します。
論文 参考訳(メタデータ) (2021-01-20T06:18:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。