論文の概要: Performance Evaluation and Acceleration of the QTensor Quantum Circuit
Simulator on GPUs
- arxiv url: http://arxiv.org/abs/2204.06045v1
- Date: Tue, 12 Apr 2022 19:03:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-17 05:15:42.563641
- Title: Performance Evaluation and Acceleration of the QTensor Quantum Circuit
Simulator on GPUs
- Title(参考訳): GPUを用いたQTensor量子回路シミュレータの性能評価と高速化
- Authors: Danylo Lykov, Angela Chen, Huaxuan Chen, Kristopher Keipert, Zheng
Zhang, Tom Gibbs, Yuri Alexeev
- Abstract要約: 我々は、NumPy、PyTorch、CuPyのバックエンドを実装し、ベンチマークを行い、CPUまたはGPUにテンソルシミュレーションの最適な割り当てを見つける。
ベンチマークしたQAOA回路のCPU上のNumPyベースライン上でのGPUの高速化により,MaxCut問題を解く。
- 参考スコア(独自算出の注目度): 6.141912076989479
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work studies the porting and optimization of the tensor network
simulator QTensor on GPUs, with the ultimate goal of simulating quantum
circuits efficiently at scale on large GPU supercomputers. We implement NumPy,
PyTorch, and CuPy backends and benchmark the codes to find the optimal
allocation of tensor simulations to either a CPU or a GPU. We also present a
dynamic mixed backend to achieve optimal performance. To demonstrate the
performance, we simulate QAOA circuits for computing the MaxCut energy
expectation. Our method achieves $176\times$ speedup on a GPU over the NumPy
baseline on a CPU for the benchmarked QAOA circuits to solve MaxCut problem on
a 3-regular graph of size 30 with depth $p=4$.
- Abstract(参考訳): 本研究は,大規模GPUスーパーコンピュータ上での量子回路の高速化を目標として,テンソルネットワークシミュレータQTensorのGPUへの移植と最適化について検討する。
我々は、NumPy、PyTorch、CuPyのバックエンドを実装し、ベンチマークを行い、CPUまたはGPUにテンソルシミュレーションの最適な割り当てを見つける。
また,最適な性能を実現するために動的混合バックエンドを提案する。
この性能を示すために、MaxCutエネルギー期待値を計算するためのQAOA回路をシミュレートする。
提案手法は,ベンチマークしたQAOA回路のCPU上のNumPyベースライン上のGPU上での176\times$の高速化を実現し,深さ$p=4$の3正規グラフ上でMaxCut問題を解決する。
関連論文リスト
- GPU-accelerated Effective Hamiltonian Calculator [70.12254823574538]
本研究では,非摂動解析対角化法(NPAD)とマグナス拡大法に着想を得た数値解析手法を提案する。
私たちの数値技術は、オープンソースPythonパッケージとして、$rm qCH_eff$で利用可能です。
論文 参考訳(メタデータ) (2024-11-15T06:33:40Z) - Atlas: Hierarchical Partitioning for Quantum Circuit Simulation on GPUs (Extended Version) [9.483321080040131]
本稿では,理論的,実用的,スケーラブルな量子回路シミュレーションのための手法を提案する。
我々のアプローチでは、量子回路をサブ回路の階層に分割し、マルチノードGPU上でサブ回路をシミュレートする。
通信コストを最小限に抑えるため,ニアバイゲートのシミュレーションを「ニアバイ」に報いる線形プログラムを定式化する。
スループットを最大化するために、動的プログラミングアルゴリズムを用いて、各カーネルがGPUでシミュレーションしたサブ回路を計算する。
論文 参考訳(メタデータ) (2024-08-17T00:34:43Z) - Fully-fused Multi-Layer Perceptrons on Intel Data Center GPUs [3.7101665559244874]
本稿では,Intel Data Center GPU Max 1550用のMulti-formedLayer Perceptrons(MLP)の実装について述べる。
これにより算術強度が大幅に向上し,特に推論性能が向上することを示す。
論文 参考訳(メタデータ) (2024-03-26T11:38:39Z) - Hybrid quantum programming with PennyLane Lightning on HPC platforms [0.0]
PennyLaneのLightningスイートは、CPU、GPU、HPCネイティブアーキテクチャとワークロードをターゲットにした高性能なステートベクタシミュレータのコレクションである。
QAOA、VQE、合成ワークロードなどの量子アプリケーションは、サポート対象の古典的コンピューティングアーキテクチャを実証するために実装されている。
論文 参考訳(メタデータ) (2024-03-04T22:01:03Z) - Fast Simulation of High-Depth QAOA Circuits [10.778538580079365]
量子近似最適化アルゴリズム(QAOA)のシミュレータを提案する。
本シミュレータはQAOAパラメータ最適化の計算コストを削減することを目的として設計されている。
cuQuantumをベースとした最先端のGPU量子回路シミュレータと比較して,典型的なQAOAパラメータ最適化の時間を,$n = 26$ qubitsで11倍に短縮する。
論文 参考訳(メタデータ) (2023-09-09T17:01:29Z) - QCLAB++: Simulating Quantum Circuits on GPUs [0.0]
我々は、GPU加速量子回路シミュレーションのための軽量で完全に測定されたC++パッケージであるqclab++を紹介する。
qclab++は高度に最適化されたゲートシミュレーションアルゴリズムによって性能と数値安定性を設計する。
また、qclab++を模倣した構文を持つMatlab用の量子回路ツールボックスであるqclabを紹介する。
論文 参考訳(メタデータ) (2023-02-28T22:56:48Z) - Batch-efficient EigenDecomposition for Small and Medium Matrices [65.67315418971688]
EigenDecomposition (ED)は多くのコンピュータビジョンアルゴリズムとアプリケーションの中心にある。
本稿では,コンピュータビジョンの応用シナリオに特化したQRベースのED手法を提案する。
論文 参考訳(メタデータ) (2022-07-09T09:14:12Z) - TensorLy-Quantum: Quantum Machine Learning with Tensor Methods [67.29221827422164]
PyTorch APIを採用した量子回路シミュレーションのためのPythonライブラリを作成します。
Ly-Quantumは、単一のGPU上で数百のキュービット、複数のGPU上で数千のキュービットにスケールすることができる。
論文 参考訳(メタデータ) (2021-12-19T19:26:17Z) - Adaptive Elastic Training for Sparse Deep Learning on Heterogeneous
Multi-GPU Servers [65.60007071024629]
本稿では,Adaptive SGDが4つの最先端ソリューションよりも精度が高いことを示す。
本稿では,Adaptive SGDが時間と精度で4つの最先端ソリューションより優れていることを示す。
論文 参考訳(メタデータ) (2021-10-13T20:58:15Z) - Fast quantum circuit simulation using hardware accelerated general
purpose libraries [69.43216268165402]
CuPyは、GPUベースの量子回路向けに開発された汎用ライブラリ(線形代数)である。
上位回路の場合、スピードアップは約2倍、量子乗算器の場合、最先端のC++ベースのシミュレータと比べて約22倍である。
論文 参考訳(メタデータ) (2021-06-26T10:41:43Z) - Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。
最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。
ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文 参考訳(メタデータ) (2020-06-18T08:16:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。