論文の概要: Hybrid quantum programming with PennyLane Lightning on HPC platforms
- arxiv url: http://arxiv.org/abs/2403.02512v1
- Date: Mon, 4 Mar 2024 22:01:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 16:48:03.506413
- Title: Hybrid quantum programming with PennyLane Lightning on HPC platforms
- Title(参考訳): HPCプラットフォーム上でのPennyLane Lightningによるハイブリッド量子プログラミング
- Authors: Ali Asadi, Amintor Dusko, Chae-Yeun Park, Vincent Michaud-Rioux,
Isidor Schoch, Shuli Shu, Trevor Vincent, Lee James O'Riordan
- Abstract要約: PennyLaneのLightningスイートは、CPU、GPU、HPCネイティブアーキテクチャとワークロードをターゲットにした高性能なステートベクタシミュレータのコレクションである。
QAOA、VQE、合成ワークロードなどの量子アプリケーションは、サポート対象の古典的コンピューティングアーキテクチャを実証するために実装されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce PennyLane's Lightning suite, a collection of high-performance
state-vector simulators targeting CPU, GPU, and HPC-native architectures and
workloads. Quantum applications such as QAOA, VQE, and synthetic workloads are
implemented to demonstrate the supported classical computing architectures and
showcase the scale of problems that can be simulated using our tooling. We
benchmark the performance of Lightning with backends supporting CPUs, as well
as NVidia and AMD GPUs, and compare the results to other commonly used
high-performance simulator packages, demonstrating where Lightning's
implementations give performance leads. We show improved CPU performance by
employing explicit SIMD intrinsics and multi-threading, batched task-based
execution across multiple GPUs, and distributed forward and gradient-based
quantum circuit executions across multiple nodes. Our data shows we can
comfortably simulate a variety of circuits, giving examples with up to 30
qubits on a single device or node, and up to 41 qubits using multiple nodes.
- Abstract(参考訳): 我々は,cpu,gpu,hpcネイティブアーキテクチャとワークロードを対象とした高性能状態ベクトルシミュレータのコレクションであるpennylaneのlightning suiteを紹介する。
qaoa、vqe、synthetic workloadsのような量子アプリケーションは、サポート対象の古典的コンピューティングアーキテクチャを実証し、ツールを使ってシミュレートできる問題のスケールを示すために実装されています。
我々はLightningのパフォーマンスを、NVidiaやAMD GPUと同様にCPUをサポートするバックエンドでベンチマークし、その結果を他の一般的な高性能シミュレータパッケージと比較し、Lightningの実装がパフォーマンスをリードする場所を示す。
我々は、明示的なSIMDとマルチスレッド、複数のGPUでバッチ化されたタスクベースの実行、複数のノードで分散前方および勾配ベースの量子回路の実行によるCPU性能の向上を示す。
我々のデータによると、さまざまな回路を快適にシミュレートでき、1つのデバイスまたはノードで最大30キュービット、複数のノードで最大41キュービットの例が得られる。
関連論文リスト
- Multi-GPU RI-HF Energies and Analytic Gradients $-$ Towards High Throughput Ab Initio Molecular Dynamics [0.0]
本稿では,複数グラフィクス処理ユニット(GPU)を用いた高次ハートリー・フォックエネルギーと解析勾配の解法を最適化したアルゴリズムと実装を提案する。
このアルゴリズムは特に、中小分子(10-100原子)の高スループット初期分子動力学シミュレーションのために設計されている。
論文 参考訳(メタデータ) (2024-07-29T00:14:10Z) - INR-Arch: A Dataflow Architecture and Compiler for Arbitrary-Order
Gradient Computations in Implicit Neural Representation Processing [66.00729477511219]
計算グラフとして表される関数を考えると、従来のアーキテクチャはn階勾配を効率的に計算する上で困難に直面している。
InR-Archは,n階勾配の計算グラフをハードウェア最適化データフローアーキテクチャに変換するフレームワークである。
1.8-4.8x と 1.5-3.6x の高速化を CPU と GPU のベースラインと比較した結果を示す。
論文 参考訳(メタデータ) (2023-08-11T04:24:39Z) - Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。
1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。
我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-25T05:04:44Z) - QCLAB++: Simulating Quantum Circuits on GPUs [0.0]
我々は、GPU加速量子回路シミュレーションのための軽量で完全に測定されたC++パッケージであるqclab++を紹介する。
qclab++は高度に最適化されたゲートシミュレーションアルゴリズムによって性能と数値安定性を設計する。
また、qclab++を模倣した構文を持つMatlab用の量子回路ツールボックスであるqclabを紹介する。
論文 参考訳(メタデータ) (2023-02-28T22:56:48Z) - Enabling Multi-threading in Heterogeneous Quantum-Classical Programming
Models [53.937052213390736]
量子カーネルの並列実行を可能にするために,C++ベースの並列コンストラクトを導入する。
予備的な性能の結果は、カーネル毎に12スレッドのベルカーネルを2回実行し、カーネルを次々に実行する並列性能が向上したことを示している。
論文 参考訳(メタデータ) (2023-01-27T06:48:37Z) - Performance Evaluation and Acceleration of the QTensor Quantum Circuit
Simulator on GPUs [6.141912076989479]
我々は、NumPy、PyTorch、CuPyのバックエンドを実装し、ベンチマークを行い、CPUまたはGPUにテンソルシミュレーションの最適な割り当てを見つける。
ベンチマークしたQAOA回路のCPU上のNumPyベースライン上でのGPUの高速化により,MaxCut問題を解く。
論文 参考訳(メタデータ) (2022-04-12T19:03:44Z) - PLSSVM: A (multi-)GPGPU-accelerated Least Squares Support Vector Machine [68.8204255655161]
Support Vector Machines (SVM) は機械学習で広く使われている。
しかし、現代的で最適化された実装でさえ、最先端ハードウェア上の大きな非自明な高密度データセットにはうまくスケールしない。
PLSSVMはLVMのドロップイン代替として使用できる。
論文 参考訳(メタデータ) (2022-02-25T13:24:23Z) - Accelerating Training and Inference of Graph Neural Networks with Fast
Sampling and Pipelining [58.10436813430554]
グラフニューラルネットワーク(GNN)のミニバッチトレーニングには、多くの計算とデータ移動が必要である。
我々は,分散マルチGPU環境において,近傍サンプリングを用いたミニバッチトレーニングを行うことを支持する。
本稿では,これらのボトルネックを緩和する一連の改良点について述べる。
また,サンプリングによる推論を支援する実験分析を行い,試験精度が実質的に損なわれていないことを示す。
論文 参考訳(メタデータ) (2021-10-16T02:41:35Z) - Fast quantum circuit simulation using hardware accelerated general
purpose libraries [69.43216268165402]
CuPyは、GPUベースの量子回路向けに開発された汎用ライブラリ(線形代数)である。
上位回路の場合、スピードアップは約2倍、量子乗算器の場合、最先端のC++ベースのシミュレータと比べて約22倍である。
論文 参考訳(メタデータ) (2021-06-26T10:41:43Z) - Quantum Fan-out: Circuit Optimizations and Technology Modeling [3.4827330067784295]
NISQワークロードの回路合成を最適化するために,同時ファンアウトプリミティブを導入する。
ファンアウトに基づく新しい量子メモリアーキテクチャも導入する。
超伝導量子ビットを用いたファンアウトの概念実証実験を行った。
論文 参考訳(メタデータ) (2020-07-08T16:38:07Z) - Intel Quantum Simulator: A cloud-ready high-performance simulator of
quantum circuits [0.0]
我々は、qHiPSTERとして知られていたIntel Quantum Simulator(IQS)の最新リリースを紹介する。
このソフトウェアの高性能コンピューティング能力により、ユーザーは利用可能なハードウェアリソースを活用できる。
IQSは計算資源を分割し、関連する回路のプールを並列にシミュレートする。
論文 参考訳(メタデータ) (2020-01-28T19:00:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。