論文の概要: Energy Efficiency of Quantum Statevector Simulation at Scale
- arxiv url: http://arxiv.org/abs/2308.07402v1
- Date: Mon, 14 Aug 2023 18:43:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 14:58:11.680560
- Title: Energy Efficiency of Quantum Statevector Simulation at Scale
- Title(参考訳): 量子状態ベクトルシミュレーションのスケールでのエネルギー効率
- Authors: Jakub Adamski and James Richings and Oliver Thomson Brown
- Abstract要約: 我々は,大規模な量子フーリエ変換(QFT)シミュレーションの性能とエネルギー消費をARCHER2上で行うことを検討する。
我々はCPUクロック周波数とノードメモリサイズを考慮に入れ、キャッシュブロッキングを用いて回路を再構成する。
その結果、4,096のARCHER2ノード上で44量子ビットシミュレーションを行い、40%高速なシミュレーションと35%の省エネを実現した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classical simulations are essential for the development of quantum computing,
and their exponential scaling can easily fill any modern supercomputer. In this
paper we consider the performance and energy consumption of large Quantum
Fourier Transform (QFT) simulations run on ARCHER2, the UK's National
Supercomputing Service, with QuEST toolkit. We take into account CPU clock
frequency and node memory size, and use cache-blocking to rearrange the
circuit, which minimises communications. We find that using 2.00GHz instead of
2.25GHz can save as much as 25% of energy at 5% increase in runtime. Higher
node memory also has the potential to be more efficient, and cost the user
fewer CUs, but at higher runtime penalty. Finally, we present a cache-blocking
QFT circuit, which halves the required communication. All our optimisations
combined result in 40% faster simulations and 35% energy savings in 44 qubit
simulations on 4,096 ARCHER2 nodes.
- Abstract(参考訳): 古典シミュレーションは量子コンピューティングの発展に不可欠であり、その指数関数的スケーリングは現代のスーパーコンピュータを簡単に満たすことができる。
本稿では,大容量量子フーリエ変換 (QFT) シミュレーションの性能とエネルギー消費を,QuEST ツールキットを用いたイギリスのスーパーコンピュータサービス ARCHER2 上で行うことを検討する。
cpuのクロック周波数とノードのメモリサイズを考慮し、キャッシュブロッキングを使って回路を再構成し、通信を最小化する。
2.25GHzの代わりに2.00GHzを使用すると、実行時の5%の増加で25%のエネルギーを節約できることがわかった。
高いノードメモリは、より効率が良く、ユーザがCUを少なくする可能性があるが、実行時のペナルティが高い。
最後に,必要な通信を必要としないキャッシュブロッキングqft回路を提案する。
その結果、4,096のARCHER2ノード上で44量子ビットシミュレーションを行い、40%高速なシミュレーションと35%の省エネを実現した。
関連論文リスト
- QServe: W4A8KV4 Quantization and System Co-design for Efficient LLM Serving [52.31791050376249]
量子化は大規模言語モデル(LLM)の推論を加速させる。
既存のINT4量子化メソッドは、重みや部分和を復号化する場合、実行時の大きなオーバーヘッドに悩まされる。
4ビット重み、8ビットアクティベーション、4ビットKVキャッシュを備えたW4A8KV4量子化アルゴリズムQoQを導入する。
QServeは、Llama-3-8BをA100で1.2倍、L40Sで1.4倍、Qwen-721.5BをA100で2.4倍、L40Sで3.5倍、達成可能な最大機能を改善する。
論文 参考訳(メタデータ) (2024-05-07T17:59:30Z) - QuantumSEA: In-Time Sparse Exploration for Noise Adaptive Quantum
Circuits [82.50620782471485]
QuantumSEAはノイズ適応型量子回路のインタイムスパース探索である。
1)トレーニング中の暗黙の回路容量と(2)雑音の頑健さの2つの主要な目標を達成することを目的としている。
提案手法は, 量子ゲート数の半減と回路実行の2倍の時間節約で, 最先端の計算結果を確立する。
論文 参考訳(メタデータ) (2024-01-10T22:33:00Z) - QUIK: Towards End-to-End 4-Bit Inference on Generative Large Language
Models [57.04178959678024]
重み付けとアクティベーションの両方を4ビットにキャストすることで、大きな生成モデルに対する推論計算の大部分が実行可能であることを示す。
これをQUIKと呼ばれるハイブリッド量子化戦略により実現し、重みとアクティベーションの大部分を4ビットに圧縮する。
我々は、QUIKフォーマットを高効率なレイヤワイドランタイムに適合させるGPUカーネルを提供し、これにより、エンドツーエンドのスループットが3.4倍に向上する。
論文 参考訳(メタデータ) (2023-10-13T17:15:05Z) - Fast Simulation of High-Depth QAOA Circuits [10.778538580079365]
量子近似最適化アルゴリズム(QAOA)のシミュレータを提案する。
本シミュレータはQAOAパラメータ最適化の計算コストを削減することを目的として設計されている。
cuQuantumをベースとした最先端のGPU量子回路シミュレータと比較して,典型的なQAOAパラメータ最適化の時間を,$n = 26$ qubitsで11倍に短縮する。
論文 参考訳(メタデータ) (2023-09-09T17:01:29Z) - Efficient and Equivariant Graph Networks for Predicting Quantum
Hamiltonian [72.57870177599492]
本稿では,効率と等価性を実現するSE(3)-equivariant Network,QHNetを提案する。
我々の重要な進歩はQHNetアーキテクチャの革新的な設計であり、基礎となる対称性に従うだけでなく、テンソル製品の数を92%削減できる。
実験結果から,我々のQHNetは最先端の手法に匹敵する性能を極めて高速に達成できることが示された。
論文 参考訳(メタデータ) (2023-06-08T03:47:33Z) - Parallelizing Quantum-Classical Workloads: Profiling the Impact of
Splitting Techniques [4.741651490006498]
我々はIBMのQuantum Cloud上で2つのワークロード分割手法を評価した。
その結果,(1)回路切断によるVQEは,アンカット版よりも基底状態推定が39%向上し,(2)データ並列化と特徴量削減を組み合わせたQSVMは,量子ワークロード実行時間の最大3倍向上することがわかった。
論文 参考訳(メタデータ) (2023-05-11T05:46:55Z) - Exact and approximate simulation of large quantum circuits on a single
GPU [0.46603287532620735]
最大27量子ビットのフーリエ変換回路の正確なシミュレーションのための競合実行時間を報告する。
また、54量子ビットに作用するランダム回路の全ての振幅を、平均忠実度が4%以上の7層で近似シミュレーションした。
論文 参考訳(メタデータ) (2023-04-28T16:45:28Z) - Iterative Qubits Management for Quantum Index Searching in a Hybrid
System [56.39703478198019]
IQuCSは、量子古典ハイブリッドシステムにおけるインデックス検索とカウントを目的としている。
我々はQiskitでIQuCSを実装し、集中的な実験を行う。
その結果、量子ビットの消費を最大66.2%削減できることが示されている。
論文 参考訳(メタデータ) (2022-09-22T21:54:28Z) - Quantum thermodynamic methods to purify a qubit on a quantum processing
unit [68.8204255655161]
我々は、同じ量子ビットを備えた量子処理ユニット上で量子ビットを浄化する量子熱力学法について報告する。
私たちの出発点は、よく知られた2つのキュービットスワップエンジンをエミュレートする3つのキュービット設計です。
使用可能な超伝導量子ビットベースのQPU上に実装し,200mKまでの浄化能を観測する。
論文 参考訳(メタデータ) (2022-01-31T16:13:57Z) - Cache Blocking Technique to Large Scale Quantum Computing Simulation on
Supercomputers [0.0]
我々は,スワップゲートを量子回路に挿入することで,データ移動を減らすキャッシュブロッキング手法を適用した。
我々はオープンソースのシミュレーションフレームワークであるQiskit Aerにこのテクニックを実装した。
論文 参考訳(メタデータ) (2021-02-05T02:03:44Z) - Quantum Fan-out: Circuit Optimizations and Technology Modeling [3.4827330067784295]
NISQワークロードの回路合成を最適化するために,同時ファンアウトプリミティブを導入する。
ファンアウトに基づく新しい量子メモリアーキテクチャも導入する。
超伝導量子ビットを用いたファンアウトの概念実証実験を行った。
論文 参考訳(メタデータ) (2020-07-08T16:38:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。