Fugu-MT 論文翻訳(概要): Performance Evaluation and Acceleration of the QTensor Quantum Circuit Simulator on GPUs

論文の概要: Performance Evaluation and Acceleration of the QTensor Quantum Circuit Simulator on GPUs

arxiv url: http://arxiv.org/abs/2204.06045v1
Date: Tue, 12 Apr 2022 19:03:44 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-17 05:15:42.563641
Title: Performance Evaluation and Acceleration of the QTensor Quantum Circuit Simulator on GPUs
Title（参考訳）: GPUを用いたQTensor量子回路シミュレータの性能評価と高速化
Authors: Danylo Lykov, Angela Chen, Huaxuan Chen, Kristopher Keipert, Zheng Zhang, Tom Gibbs, Yuri Alexeev
Abstract要約: 我々は、NumPy、PyTorch、CuPyのバックエンドを実装し、ベンチマークを行い、CPUまたはGPUにテンソルシミュレーションの最適な割り当てを見つける。ベンチマークしたQAOA回路のCPU上のNumPyベースライン上でのGPUの高速化により,MaxCut問題を解く。
参考スコア（独自算出の注目度）: 6.141912076989479
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This work studies the porting and optimization of the tensor network simulator QTensor on GPUs, with the ultimate goal of simulating quantum circuits efficiently at scale on large GPU supercomputers. We implement NumPy, PyTorch, and CuPy backends and benchmark the codes to find the optimal allocation of tensor simulations to either a CPU or a GPU. We also present a dynamic mixed backend to achieve optimal performance. To demonstrate the performance, we simulate QAOA circuits for computing the MaxCut energy expectation. Our method achieves $176\times$ speedup on a GPU over the NumPy baseline on a CPU for the benchmarked QAOA circuits to solve MaxCut problem on a 3-regular graph of size 30 with depth $p=4$.
Abstract（参考訳）: 本研究は,大規模GPUスーパーコンピュータ上での量子回路の高速化を目標として,テンソルネットワークシミュレータQTensorのGPUへの移植と最適化について検討する。我々は、NumPy、PyTorch、CuPyのバックエンドを実装し、ベンチマークを行い、CPUまたはGPUにテンソルシミュレーションの最適な割り当てを見つける。また,最適な性能を実現するために動的混合バックエンドを提案する。この性能を示すために、MaxCutエネルギー期待値を計算するためのQAOA回路をシミュレートする。提案手法は,ベンチマークしたQAOA回路のCPU上のNumPyベースライン上のGPU上での176\times$の高速化を実現し,深さ$p=4$の3正規グラフ上でMaxCut問題を解決する。

関連論文リスト

Graph Random Features for Scalable Gaussian Processes [52.89901965157282]
離散入力空間上のスケーラブルなガウス過程へのグラフランダム特徴(GRF)の適用について検討する。我々は、(穏やかな仮定の下で) GRF に対するベイズ的推論が、正確なカーネルに対して$O(N3)$のノード数に対して$O(N3/2)$の時間複雑性を楽しむことを証明した。
論文参考訳（メタデータ） (2025-09-03T20:13:23Z)
GPU Benchmark through QPE Emulator with cuQuantum for Practical Quantum Applications [0.0]
入力と出力はHDF5で処理され、可能な限り容易に処理できるようになった。開発されたアプリケーションはGPU能力を最大限に活用することができる。
論文参考訳（メタデータ） (2025-07-23T03:42:30Z)
Q-GEAR: Improving quantum simulation framework [0.28402080392117757]
本稿では,Qiskit量子回路をCuda-Qカーネルに変換するソフトウェアフレームワークであるQ-Gearを紹介する。 Q-GearはCPUとGPUベースのシミュレーションをそれぞれ、最小のコーディング労力で2桁と10倍に高速化する。
論文参考訳（メタデータ） (2025-04-04T22:17:51Z)
GPU-accelerated Effective Hamiltonian Calculator [70.12254823574538]
本研究では,非摂動解析対角化法(NPAD)とマグナス拡大法に着想を得た数値解析手法を提案する。私たちの数値技術は、オープンソースPythonパッケージとして、$rm qCH_eff$で利用可能です。
論文参考訳（メタデータ） (2024-11-15T06:33:40Z)
Atlas: Hierarchical Partitioning for Quantum Circuit Simulation on GPUs (Extended Version) [9.483321080040131]
本稿では,理論的,実用的,スケーラブルな量子回路シミュレーションのための手法を提案する。我々のアプローチでは、量子回路をサブ回路の階層に分割し、マルチノードGPU上でサブ回路をシミュレートする。通信コストを最小限に抑えるため,ニアバイゲートのシミュレーションを「ニアバイ」に報いる線形プログラムを定式化する。スループットを最大化するために、動的プログラミングアルゴリズムを用いて、各カーネルがGPUでシミュレーションしたサブ回路を計算する。
論文参考訳（メタデータ） (2024-08-17T00:34:43Z)
Fully-fused Multi-Layer Perceptrons on Intel Data Center GPUs [3.7101665559244874]
本稿では,Intel Data Center GPU Max 1550用のMulti-formedLayer Perceptrons(MLP)の実装について述べる。これにより算術強度が大幅に向上し,特に推論性能が向上することを示す。
論文参考訳（メタデータ） (2024-03-26T11:38:39Z)
Hybrid quantum programming with PennyLane Lightning on HPC platforms [0.0]
PennyLaneのLightningスイートは、CPU、GPU、HPCネイティブアーキテクチャとワークロードをターゲットにした高性能なステートベクタシミュレータのコレクションである。 QAOA、VQE、合成ワークロードなどの量子アプリケーションは、サポート対象の古典的コンピューティングアーキテクチャを実証するために実装されている。
論文参考訳（メタデータ） (2024-03-04T22:01:03Z)
Fast Simulation of High-Depth QAOA Circuits [10.778538580079365]
量子近似最適化アルゴリズム(QAOA)のシミュレータを提案する。本シミュレータはQAOAパラメータ最適化の計算コストを削減することを目的として設計されている。 cuQuantumをベースとした最先端のGPU量子回路シミュレータと比較して,典型的なQAOAパラメータ最適化の時間を,$n = 26$ qubitsで11倍に短縮する。
論文参考訳（メタデータ） (2023-09-09T17:01:29Z)
QCLAB++: Simulating Quantum Circuits on GPUs [0.0]
我々は、GPU加速量子回路シミュレーションのための軽量で完全に測定されたC++パッケージであるqclab++を紹介する。 qclab++は高度に最適化されたゲートシミュレーションアルゴリズムによって性能と数値安定性を設計する。また、qclab++を模倣した構文を持つMatlab用の量子回路ツールボックスであるqclabを紹介する。
論文参考訳（メタデータ） (2023-02-28T22:56:48Z)
Batch-efficient EigenDecomposition for Small and Medium Matrices [65.67315418971688]
EigenDecomposition (ED)は多くのコンピュータビジョンアルゴリズムとアプリケーションの中心にある。本稿では,コンピュータビジョンの応用シナリオに特化したQRベースのED手法を提案する。
論文参考訳（メタデータ） (2022-07-09T09:14:12Z)
TensorLy-Quantum: Quantum Machine Learning with Tensor Methods [67.29221827422164]
PyTorch APIを採用した量子回路シミュレーションのためのPythonライブラリを作成します。 Ly-Quantumは、単一のGPU上で数百のキュービット、複数のGPU上で数千のキュービットにスケールすることができる。
論文参考訳（メタデータ） (2021-12-19T19:26:17Z)
Adaptive Elastic Training for Sparse Deep Learning on Heterogeneous Multi-GPU Servers [65.60007071024629]
本稿では,Adaptive SGDが4つの最先端ソリューションよりも精度が高いことを示す。本稿では,Adaptive SGDが時間と精度で4つの最先端ソリューションより優れていることを示す。
論文参考訳（メタデータ） (2021-10-13T20:58:15Z)
Fast quantum circuit simulation using hardware accelerated general purpose libraries [69.43216268165402]
CuPyは、GPUベースの量子回路向けに開発された汎用ライブラリ(線形代数)である。上位回路の場合、スピードアップは約2倍、量子乗算器の場合、最先端のC++ベースのシミュレータと比べて約22倍である。
論文参考訳（メタデータ） (2021-06-26T10:41:43Z)
Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文参考訳（メタデータ） (2020-06-18T08:16:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。