論文の概要: Quantum Circuit Simulation by SGEMM Emulation on Tensor Cores and
Automatic Precision Selection
- arxiv url: http://arxiv.org/abs/2303.08989v2
- Date: Mon, 10 Jul 2023 12:02:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-11 22:17:17.620113
- Title: Quantum Circuit Simulation by SGEMM Emulation on Tensor Cores and
Automatic Precision Selection
- Title(参考訳): テンソルコア上のSGEMMエミュレーションによる量子回路シミュレーションと自動精密選択
- Authors: Hiroyuki Ootomo, Hidetaka Manabe, Kenji Harada, Rio Yokota
- Abstract要約: 入力テンソル要素のレンジ統計を用いて、GEMM操作に使用するコアを選択する。
我々は,Sycamoreの量子回路を含むランダム回路サンプリング(RCS)において,スループットが最大1.86倍であることを示す。
- 参考スコア(独自算出の注目度): 2.9385229328767988
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quantum circuit simulation provides the foundation for the development of
quantum algorithms and the verification of quantum supremacy. Among the various
methods for quantum circuit simulation, tensor network contraction has been
increasing in popularity due to its ability to simulate a larger number of
qubits. During tensor contraction, the input tensors are reshaped to matrices
and computed by a GEMM operation, where these GEMM operations could reach up to
90\% of the total calculation time. GEMM throughput can be improved by
utilizing mixed-precision hardware such as Tensor Cores, but straightforward
implementation results in insufficient fidelity for deep and large quantum
circuits. Prior work has demonstrated that compensated summation with special
care of the rounding mode can fully recover the FP32 precision of SGEMM even
when using TF32 or FP16 Tensor Cores. The exponent range is a critical issue
when applying such techniques to quantum circuit simulation. While TF32
supports almost the same exponent range as FP32, FP16 supports a much smaller
exponent range. In this work, we use the exponent range statistics of input
tensor elements to select which Tensor Cores we use for the GEMM. We evaluate
our method on Random Circuit Sampling (RCS), including Sycamore's quantum
circuit, and show that the throughput is 1.86 times higher at maximum while
maintaining accuracy.
- Abstract(参考訳): 量子回路シミュレーションは、量子アルゴリズムの開発と量子超越性の検証の基礎を提供する。
量子回路シミュレーションの様々な方法のうち、テンソルネットワークの縮小は、より多くの量子ビットをシミュレートする能力により、人気が高まっている。
テンソル収縮中、入力テンソルは行列に変換され、GEMM演算によって計算される。
GEMMスループットはTensor Coresのような混合精度のハードウェアを利用することで向上できるが、実装が簡単で、深い量子回路や大規模な量子回路では不十分である。
TF32 や FP16 Tensor Core を用いても、ラウンドモードを特別に扱った補償和が、SGEMM の FP32 精度を完全に回復できることを示した。
このような手法を量子回路シミュレーションに適用する場合、指数範囲は重要な問題である。
TF32はFP32とほぼ同じ指数域をサポートしているが、FP16はより小さい指数域をサポートしている。
本研究では、入力テンソル要素の指数範囲統計を用いて、GEMMに使用するテンソルコアを選択する。
我々は,Sycamoreの量子回路を含むランダム回路サンプリング(RCS)において,スループットが精度を維持しながら最大1.86倍であることを示す。
関連論文リスト
- Quantum multi-output Gaussian Processes based Machine Learning for Line Parameter Estimation in Electrical Grids [0.0848210898747543]
我々は、よく知られたHHLと呼ばれる量子アルゴリズムを実装することで、多出力ガウス過程(QGP)の量子バージョンを開発する。
電力網の線パラメータを推定する実世界の問題に対するQGPの適用について述べる。
論文 参考訳(メタデータ) (2024-11-14T01:44:39Z) - Quantum Circuit Optimization with AlphaTensor [47.9303833600197]
我々は,所定の回路を実装するために必要なTゲート数を最小化する手法であるAlphaTensor-Quantumを開発した。
Tカウント最適化の既存の方法とは異なり、AlphaTensor-Quantumは量子計算に関するドメイン固有の知識を取り入れ、ガジェットを活用することができる。
注目すべきは、有限体における乗法であるカラツバの手法に似た効率的なアルゴリズムを発見することである。
論文 参考訳(メタデータ) (2024-02-22T09:20:54Z) - Simulator Demonstration of Large Scale Variational Quantum Algorithm on HPC Cluster [0.0]
本研究は,2つの新しい手法を用いて量子シミュレーションを高速化することを目的とする。
VQEシミュレーションの200倍の高速化を実現し,32kbitsの地中エネルギー計算を許容時間で実証した。
論文 参考訳(メタデータ) (2024-02-19T06:34:01Z) - State of practice: evaluating GPU performance of state vector and tensor
network methods [2.7930955543692817]
本稿では,8種類の量子サブルーチンを用いたテストベンチにおける現状シミュレーション手法の限界について検討する。
我々は,最大1桁のスピードアップを達成し,最適なシミュレーション戦略を選択する方法について強調する。
論文 参考訳(メタデータ) (2024-01-11T09:22:21Z) - Efficient Quantum Circuit Simulation by Tensor Network Methods on Modern GPUs [11.87665112550076]
量子ハードウェアでは、一次シミュレーション法は状態ベクトルとテンソルネットワークに基づいている。
量子ビットと量子ゲートの数が増加するにつれて、ヒルベルト空間の圧倒的な大きさと広範な絡み合いにより、従来の状態ベクトルベースの量子回路シミュレーション手法は不十分であることが証明される。
本研究では,計算効率と精度の2つの側面から最適化手法を提案する。
論文 参考訳(メタデータ) (2023-10-06T02:24:05Z) - Majorization-based benchmark of the complexity of quantum processors [105.54048699217668]
我々は、様々な量子プロセッサの動作を数値的にシミュレートし、特徴付ける。
我々は,各デバイスの性能をベンチマークラインと比較することにより,量子複雑性を同定し,評価する。
我々は、回路の出力状態が平均して高い純度である限り、偏化ベースのベンチマークが成り立つことを発見した。
論文 参考訳(メタデータ) (2023-04-10T23:01:10Z) - Decomposition of Matrix Product States into Shallow Quantum Circuits [62.5210028594015]
テンソルネットワーク(TN)アルゴリズムは、パラメタライズド量子回路(PQC)にマッピングできる
本稿では,現実的な量子回路を用いてTN状態を近似する新しいプロトコルを提案する。
その結果、量子回路の逐次的な成長と最適化を含む1つの特定のプロトコルが、他の全ての手法より優れていることが明らかとなった。
論文 参考訳(メタデータ) (2022-09-01T17:08:41Z) - Tensor Ring Parametrized Variational Quantum Circuits for Large Scale
Quantum Machine Learning [28.026962110693695]
本稿では,テンソルリング表現を用いて回路内の量子状態を圧縮するアルゴリズムを提案する。
ストレージと計算時間は、正確なシミュレーションアルゴリズムによる指数的な増加と比較して、キュービット数とレイヤー数で線形に増加する。
We achieve a test accuracy of 83.33% on Iris dataset and a maximum of 99.30% and 76.31% on binary and ternary classification of MNIST dataset。
論文 参考訳(メタデータ) (2022-01-21T19:54:57Z) - Fast Swapping in a Quantum Multiplier Modelled as a Queuing Network [64.1951227380212]
量子回路をキューネットワークとしてモデル化することを提案する。
提案手法はスケーラビリティが高く,大規模量子回路のコンパイルに必要となる潜在的な速度と精度を有する。
論文 参考訳(メタデータ) (2021-06-26T10:55:52Z) - Machine Learning Optimization of Quantum Circuit Layouts [63.55764634492974]
本稿では量子回路マッピングQXXとその機械学習バージョンQXX-MLPを紹介する。
後者は、レイアウトされた回路の深さが小さくなるように最適なQXXパラメータ値を自動的に推論する。
近似を用いてレイアウト法を学習可能な経験的証拠を提示する。
論文 参考訳(メタデータ) (2020-07-29T05:26:19Z) - Improving the Performance of Deep Quantum Optimization Algorithms with
Continuous Gate Sets [47.00474212574662]
変分量子アルゴリズムは計算的に難しい問題を解くのに有望であると考えられている。
本稿では,QAOAの回路深度依存性能について実験的に検討する。
この結果から, 連続ゲートセットの使用は, 短期量子コンピュータの影響を拡大する上で重要な要素である可能性が示唆された。
論文 参考訳(メタデータ) (2020-05-11T17:20:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。