Fugu-MT 論文翻訳(概要): Hybrid quantum programming with PennyLane Lightning on HPC platforms

論文の概要: Hybrid quantum programming with PennyLane Lightning on HPC platforms

arxiv url: http://arxiv.org/abs/2403.02512v1
Date: Mon, 4 Mar 2024 22:01:03 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-06 16:48:03.506413
Title: Hybrid quantum programming with PennyLane Lightning on HPC platforms
Title（参考訳）: HPCプラットフォーム上でのPennyLane Lightningによるハイブリッド量子プログラミング
Authors: Ali Asadi, Amintor Dusko, Chae-Yeun Park, Vincent Michaud-Rioux, Isidor Schoch, Shuli Shu, Trevor Vincent, Lee James O'Riordan
Abstract要約: PennyLaneのLightningスイートは、CPU、GPU、HPCネイティブアーキテクチャとワークロードをターゲットにした高性能なステートベクタシミュレータのコレクションである。 QAOA、VQE、合成ワークロードなどの量子アプリケーションは、サポート対象の古典的コンピューティングアーキテクチャを実証するために実装されている。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce PennyLane's Lightning suite, a collection of high-performance state-vector simulators targeting CPU, GPU, and HPC-native architectures and workloads. Quantum applications such as QAOA, VQE, and synthetic workloads are implemented to demonstrate the supported classical computing architectures and showcase the scale of problems that can be simulated using our tooling. We benchmark the performance of Lightning with backends supporting CPUs, as well as NVidia and AMD GPUs, and compare the results to other commonly used high-performance simulator packages, demonstrating where Lightning's implementations give performance leads. We show improved CPU performance by employing explicit SIMD intrinsics and multi-threading, batched task-based execution across multiple GPUs, and distributed forward and gradient-based quantum circuit executions across multiple nodes. Our data shows we can comfortably simulate a variety of circuits, giving examples with up to 30 qubits on a single device or node, and up to 41 qubits using multiple nodes.
Abstract（参考訳）: 我々は,cpu,gpu,hpcネイティブアーキテクチャとワークロードを対象とした高性能状態ベクトルシミュレータのコレクションであるpennylaneのlightning suiteを紹介する。 qaoa、vqe、synthetic workloadsのような量子アプリケーションは、サポート対象の古典的コンピューティングアーキテクチャを実証し、ツールを使ってシミュレートできる問題のスケールを示すために実装されています。我々はLightningのパフォーマンスを、NVidiaやAMD GPUと同様にCPUをサポートするバックエンドでベンチマークし、その結果を他の一般的な高性能シミュレータパッケージと比較し、Lightningの実装がパフォーマンスをリードする場所を示す。我々は、明示的なSIMDとマルチスレッド、複数のGPUでバッチ化されたタスクベースの実行、複数のノードで分散前方および勾配ベースの量子回路の実行によるCPU性能の向上を示す。我々のデータによると、さまざまな回路を快適にシミュレートでき、1つのデバイスまたはノードで最大30キュービット、複数のノードで最大41キュービットの例が得られる。

関連論文リスト

Multi-GPU Quantum Circuit Simulation and the Impact of Network Performance [0.7340017786387767]
我々は、HPCシステム上でのベンチマークを容易にするため、QED-C Application-Oriented BenchmarksにMPIを導入する。我々は最近のNVIDIA Grace Blackwell NVL72アーキテクチャを含む様々な相互接続パスを用いてベンチマークを行った。 GPUアーキテクチャの改善は4.5倍以上のスピードアップにつながったが、相互接続性能の進歩は16倍以上のパフォーマンス改善によるソリューションのソリューション化に大きな影響を与えている。
論文参考訳（メタデータ） (2025-11-18T17:04:28Z)
Towards Closing the Performance Gap for Cryptographic Kernels Between CPUs and Specialized Hardware [0.07646713951724009]
我々は,x86 CPU用暗号カーネルをコア単位で最適化した実装を開発する。マルチワード拡張(MQX)と呼ばれる小型AVX-512拡張を提案する。 MQXはASICに対するスローダウンを1つのCPUコアで35倍に削減する。
論文参考訳（メタデータ） (2025-09-15T22:35:00Z)
Q-GEAR: Improving quantum simulation framework [0.28402080392117757]
本稿では,Qiskit量子回路をCuda-Qカーネルに変換するソフトウェアフレームワークであるQ-Gearを紹介する。 Q-GearはCPUとGPUベースのシミュレーションをそれぞれ、最小のコーディング労力で2桁と10倍に高速化する。
論文参考訳（メタデータ） (2025-04-04T22:17:51Z)
Versatile Cross-platform Compilation Toolchain for Schrödinger-style Quantum Circuit Simulation [15.448800194552705]
CAST(Cross-platform Adaptive Schr"odiner-style Simulation Toolchain)は,クロスプラットフォーム(CPUとNvidia GPU)最適化と高性能バックエンドサポートを備えた,新しいコンパイルツールチェーンである。 Castは、ターゲットとするハードウェアプラットフォームに対して、最良の融合戦略とバックエンド設定を自動的に選択する、新しいスペーサリティ対応のゲート融合アルゴリズムを利用している。我々は、IBM Qiskit、Google QSimCirq、Nvidia cuQuantumバックエンド、その他の高性能シミュレータに対してCASTをベンチマークする。
論文参考訳（メタデータ） (2025-03-25T17:53:59Z)
Multi-GPU RI-HF Energies and Analytic Gradients $-$ Towards High Throughput Ab Initio Molecular Dynamics [0.0]
本稿では,複数グラフィクス処理ユニット(GPU)を用いた高次ハートリー・フォックエネルギーと解析勾配の解法を最適化したアルゴリズムと実装を提案する。このアルゴリズムは特に、中小分子(10-100原子)の高スループット初期分子動力学シミュレーションのために設計されている。
論文参考訳（メタデータ） (2024-07-29T00:14:10Z)
INR-Arch: A Dataflow Architecture and Compiler for Arbitrary-Order Gradient Computations in Implicit Neural Representation Processing [66.00729477511219]
計算グラフとして表される関数を考えると、従来のアーキテクチャはn階勾配を効率的に計算する上で困難に直面している。 InR-Archは,n階勾配の計算グラフをハードウェア最適化データフローアーキテクチャに変換するフレームワークである。 1.8-4.8x と 1.5-3.6x の高速化を CPU と GPU のベースラインと比較した結果を示す。
論文参考訳（メタデータ） (2023-08-11T04:24:39Z)
Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。 1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文参考訳（メタデータ） (2023-04-25T05:04:44Z)
QCLAB++: Simulating Quantum Circuits on GPUs [0.0]
我々は、GPU加速量子回路シミュレーションのための軽量で完全に測定されたC++パッケージであるqclab++を紹介する。 qclab++は高度に最適化されたゲートシミュレーションアルゴリズムによって性能と数値安定性を設計する。また、qclab++を模倣した構文を持つMatlab用の量子回路ツールボックスであるqclabを紹介する。
論文参考訳（メタデータ） (2023-02-28T22:56:48Z)
Enabling Multi-threading in Heterogeneous Quantum-Classical Programming Models [53.937052213390736]
量子カーネルの並列実行を可能にするために,C++ベースの並列コンストラクトを導入する。予備的な性能の結果は、カーネル毎に12スレッドのベルカーネルを2回実行し、カーネルを次々に実行する並列性能が向上したことを示している。
論文参考訳（メタデータ） (2023-01-27T06:48:37Z)
Performance Evaluation and Acceleration of the QTensor Quantum Circuit Simulator on GPUs [6.141912076989479]
我々は、NumPy、PyTorch、CuPyのバックエンドを実装し、ベンチマークを行い、CPUまたはGPUにテンソルシミュレーションの最適な割り当てを見つける。ベンチマークしたQAOA回路のCPU上のNumPyベースライン上でのGPUの高速化により,MaxCut問題を解く。
論文参考訳（メタデータ） (2022-04-12T19:03:44Z)
PLSSVM: A (multi-)GPGPU-accelerated Least Squares Support Vector Machine [68.8204255655161]
Support Vector Machines (SVM) は機械学習で広く使われている。しかし、現代的で最適化された実装でさえ、最先端ハードウェア上の大きな非自明な高密度データセットにはうまくスケールしない。 PLSSVMはLVMのドロップイン代替として使用できる。
論文参考訳（メタデータ） (2022-02-25T13:24:23Z)
Accelerating Training and Inference of Graph Neural Networks with Fast Sampling and Pipelining [58.10436813430554]
グラフニューラルネットワーク(GNN)のミニバッチトレーニングには、多くの計算とデータ移動が必要である。我々は,分散マルチGPU環境において,近傍サンプリングを用いたミニバッチトレーニングを行うことを支持する。本稿では,これらのボトルネックを緩和する一連の改良点について述べる。また,サンプリングによる推論を支援する実験分析を行い,試験精度が実質的に損なわれていないことを示す。
論文参考訳（メタデータ） (2021-10-16T02:41:35Z)
Fast quantum circuit simulation using hardware accelerated general purpose libraries [69.43216268165402]
CuPyは、GPUベースの量子回路向けに開発された汎用ライブラリ(線形代数)である。上位回路の場合、スピードアップは約2倍、量子乗算器の場合、最先端のC++ベースのシミュレータと比べて約22倍である。
論文参考訳（メタデータ） (2021-06-26T10:41:43Z)
Quantum Fan-out: Circuit Optimizations and Technology Modeling [3.4827330067784295]
NISQワークロードの回路合成を最適化するために,同時ファンアウトプリミティブを導入する。ファンアウトに基づく新しい量子メモリアーキテクチャも導入する。超伝導量子ビットを用いたファンアウトの概念実証実験を行った。
論文参考訳（メタデータ） (2020-07-08T16:38:07Z)
Intel Quantum Simulator: A cloud-ready high-performance simulator of quantum circuits [0.0]
我々は、qHiPSTERとして知られていたIntel Quantum Simulator(IQS)の最新リリースを紹介する。このソフトウェアの高性能コンピューティング能力により、ユーザーは利用可能なハードウェアリソースを活用できる。 IQSは計算資源を分割し、関連する回路のプールを並列にシミュレートする。
論文参考訳（メタデータ） (2020-01-28T19:00:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。