論文の概要: Benchmarking Quantum Red TEA on CPUs, GPUs, and TPUs
- arxiv url: http://arxiv.org/abs/2409.03818v1
- Date: Thu, 5 Sep 2024 18:00:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-09 17:40:07.744498
- Title: Benchmarking Quantum Red TEA on CPUs, GPUs, and TPUs
- Title(参考訳): CPU、GPU、TPU上での量子Red TEAのベンチマーク
- Authors: Daniel Jaschke, Marco Ballarin, Nora Reinić, Luka Pavešić, Simone Montangero,
- Abstract要約: 異なる線形代数バックエンド(例えば、numpy と torch, jax, tensorflow ライブラリ)を比較し、対象ハードウェアに対して混合精度に着想を得たアプローチと最適化を行う。
我々は、CPU上でパラメータをチューニングする際の34の係数の高速化と、GPUに移行する際の最高のCPU設定上の2.76の要素を得る方法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We benchmark simulations of many-body quantum systems on heterogeneous hardware platforms using CPUs, GPUs, and TPUs. We compare different linear algebra backends, e.g., numpy versus the torch, jax, or tensorflow library, as well as a mixed-precision-inspired approach and optimizations for the target hardware. Quantum red TEA out of the Quantum TEA library specifically addresses handling tensors with different libraries or hardware, where the tensors are the building block of tensor network algorithms. The benchmark problem is a variational search of a ground state in an interacting model. This is a ubiquitous problem in quantum many-body physics, which we solve using tensor network methods. This approximate state-of-the-art method compresses quantum correlations which is key to overcoming the exponential growth of the Hilbert space as a function of the number of particles. We present a way to obtain speedups of a factor of 34 when tuning parameters on the CPU, and an additional factor of 2.76 on top of the best CPU setup when migrating to GPUs.
- Abstract(参考訳): 我々は、CPU、GPU、TPUを用いた異種ハードウェアプラットフォーム上での多体量子システムのシミュレーションをベンチマークした。
我々は、異なる線形代数バックエンド、例えば、numpyとトーチ、jax、テンソルフローライブラリを比較し、ターゲットハードウェアに対する混合精度に着想を得たアプローチと最適化を比較した。
Quantum TEAライブラリの量子赤TEAは、テンソルがテンソルネットワークアルゴリズムの構築ブロックである、異なるライブラリやハードウェアでテンソルを扱うことに特化している。
ベンチマーク問題は、相互作用モデルにおける基底状態の変動探索である。
これは量子多体物理学におけるユビキタス問題であり、テンソルネットワーク法を用いて解く。
この近似的最先端法は、粒子数の関数としてヒルベルト空間の指数的成長を克服する鍵となる量子相関を圧縮する。
我々は、CPU上でパラメータをチューニングする際の34の係数の高速化と、GPUに移行する際の最高のCPU設定上の2.76の要素を得る方法を提案する。
関連論文リスト
- 3D-QAE: Fully Quantum Auto-Encoding of 3D Point Clouds [71.39129855825402]
既存の3D表現の学習方法は、古典的なハードウェアでトレーニングされ、テストされるディープニューラルネットワークである。
本稿では3次元点雲のための最初の量子オートエンコーダを紹介する。
論文 参考訳(メタデータ) (2023-11-09T18:58:33Z) - TeD-Q: a tensor network enhanced distributed hybrid quantum machine
learning framework [59.07246314484875]
TeD-Qは、量子機械学習のためのオープンソースのソフトウェアフレームワークである。
古典的な機械学習ライブラリと量子シミュレータをシームレスに統合する。
量子回路とトレーニングの進捗をリアルタイムで視覚化できるグラフィカルモードを提供する。
論文 参考訳(メタデータ) (2023-01-13T09:35:05Z) - Performance Evaluation and Acceleration of the QTensor Quantum Circuit
Simulator on GPUs [6.141912076989479]
我々は、NumPy、PyTorch、CuPyのバックエンドを実装し、ベンチマークを行い、CPUまたはGPUにテンソルシミュレーションの最適な割り当てを見つける。
ベンチマークしたQAOA回路のCPU上のNumPyベースライン上でのGPUの高速化により,MaxCut問題を解く。
論文 参考訳(メタデータ) (2022-04-12T19:03:44Z) - RosneT: A Block Tensor Algebra Library for Out-of-Core Quantum Computing
Simulation [0.18472148461613155]
本稿では,分散ブロックテンソル代数のためのライブラリRosneTを提案する。
我々はPyCOMPSsプログラミングモデルを用いてテンソル演算をComposランタイムが処理するタスクの集合に変換する。
本稿では, 最大53量子ビットの量子回路シミュレーションにおいて, 優れたスケーラビリティを示す手法を検証した。
論文 参考訳(メタデータ) (2022-01-17T20:35:40Z) - TensorLy-Quantum: Quantum Machine Learning with Tensor Methods [67.29221827422164]
PyTorch APIを採用した量子回路シミュレーションのためのPythonライブラリを作成します。
Ly-Quantumは、単一のGPU上で数百のキュービット、複数のGPU上で数千のキュービットにスケールすることができる。
論文 参考訳(メタデータ) (2021-12-19T19:26:17Z) - Simulation of quantum many-body dynamics with Tensor Processing Units:
Floquet prethermalization [0.3078264203938486]
長い時間スケールでの量子多体ダイナミクスの超並列古典シミュレーションにおけるTPUの利用を実証する。
数百万の2量子ゲートを持つ回路に対応するL=34量子ビットを105ドル以上のフロケ時間でシミュレーションする。
我々の研究は、TPUが量子多体力学の最先端のシミュレーションに大きな利点をもたらすことを実証している。
論文 参考訳(メタデータ) (2021-11-15T19:02:54Z) - Adaptive Elastic Training for Sparse Deep Learning on Heterogeneous
Multi-GPU Servers [65.60007071024629]
本稿では,Adaptive SGDが4つの最先端ソリューションよりも精度が高いことを示す。
本稿では,Adaptive SGDが時間と精度で4つの最先端ソリューションより優れていることを示す。
論文 参考訳(メタデータ) (2021-10-13T20:58:15Z) - Fast quantum circuit simulation using hardware accelerated general
purpose libraries [69.43216268165402]
CuPyは、GPUベースの量子回路向けに開発された汎用ライブラリ(線形代数)である。
上位回路の場合、スピードアップは約2倍、量子乗算器の場合、最先端のC++ベースのシミュレータと比べて約22倍である。
論文 参考訳(メタデータ) (2021-06-26T10:41:43Z) - Hybrid Models for Learning to Branch [81.93868699246214]
我々はCPUマシン上で効率的な分岐を行うための新しいハイブリッドアーキテクチャを提案する。
提案アーキテクチャは,GNNの表現力と分岐処理のための計算コストの低い多層パーセプトロン(MLP)を組み合わせる。
論文 参考訳(メタデータ) (2020-06-26T21:03:45Z) - Kernel Operations on the GPU, with Autodiff, without Memory Overflows [5.669790037378094]
KeOpsライブラリは、数学的公式によってエントリが与えられるテンソルに対して、高速でメモリ効率のよいGPUサポートを提供する。
KeOpsは、カーネルおよび幾何学的アプリケーションのためのテンソル中心ライブラリの大きなボトルネックであるメモリ消費を緩和する。
KeOpsは、最適化されたC++/CUDAスキームと、Python(NumpyとPyTorch)、Matlab、Rのバインダーを組み合わせる。
論文 参考訳(メタデータ) (2020-03-27T08:54:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。