論文の概要: Energy Efficiency of Quantum Statevector Simulation at Scale
- arxiv url: http://arxiv.org/abs/2308.07402v2
- Date: Mon, 18 Sep 2023 14:25:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 22:36:44.166940
- Title: Energy Efficiency of Quantum Statevector Simulation at Scale
- Title(参考訳): 量子状態ベクトルシミュレーションのスケールでのエネルギー効率
- Authors: Jakub Adamski and James Peter Richings and Oliver Thomson Brown
- Abstract要約: 我々は,大規模な量子フーリエ変換(QFT)シミュレーションの性能とエネルギー消費をARCHER2上で行うことを検討する。
我々はCPUクロック周波数とノードメモリサイズを考慮に入れ、キャッシュブロッキングを用いて回路を再構成する。
その結果、4,096のARCHER2ノード上で44量子ビットシミュレーションを行い、40%高速なシミュレーションと35%の省エネを実現した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classical simulations are essential for the development of quantum computing,
and their exponential scaling can easily fill any modern supercomputer. In this
paper we consider the performance and energy consumption of large Quantum
Fourier Transform (QFT) simulations run on ARCHER2, the UK's National
Supercomputing Service, with QuEST toolkit. We take into account CPU clock
frequency and node memory size, and use cache-blocking to rearrange the
circuit, which minimises communications. We find that using 2.00GHz instead of
2.25GHz can save as much as 25% of energy at 5% increase in runtime. Higher
node memory also has the potential to be more efficient, and cost the user
fewer CUs, but at higher runtime penalty. Finally, we present a cache-blocking
QFT circuit, which halves the required communication. All our optimisations
combined result in 40% faster simulations and 35% energy savings in 44 qubit
simulations on 4,096 ARCHER2 nodes.
- Abstract(参考訳): 古典シミュレーションは量子コンピューティングの発展に不可欠であり、その指数関数的スケーリングは現代のスーパーコンピュータを簡単に満たすことができる。
本稿では,大容量量子フーリエ変換 (QFT) シミュレーションの性能とエネルギー消費を,QuEST ツールキットを用いたイギリスのスーパーコンピュータサービス ARCHER2 上で行うことを検討する。
cpuのクロック周波数とノードのメモリサイズを考慮し、キャッシュブロッキングを使って回路を再構成し、通信を最小化する。
2.25GHzの代わりに2.00GHzを使用すると、実行時の5%の増加で25%のエネルギーを節約できることがわかった。
高いノードメモリは、より効率が良く、ユーザがCUを少なくする可能性があるが、実行時のペナルティが高い。
最後に,必要な通信を必要としないキャッシュブロッキングqft回路を提案する。
その結果、4,096のARCHER2ノード上で44量子ビットシミュレーションを行い、40%高速なシミュレーションと35%の省エネを実現した。
関連論文リスト
- Mera: Memory Reduction and Acceleration for Quantum Circuit Simulation via Redundancy Exploration [4.271968023823568]
メモリ使用量の削減とシミュレーションの高速化を目的として,マルチレベル最適化,すなわちMeraを提案する。
多数のスパース量子ゲートに対して、低レベルフルステートシミュレーションのための2つの圧縮された構造を提案する。
実験により, 圧縮された構造では量子ビット数が17から35に増加し, QNNの6.9倍の加速が達成された。
論文 参考訳(メタデータ) (2024-11-22T20:07:31Z) - Achieving Energetic Superiority Through System-Level Quantum Circuit Simulation [38.413545516612025]
量子計算スーパーオリティは、高速な計算と高エネルギー効率を誇っている。
我々は,グローバル,ノード,デバイスレベルでの最適化を利用して,テンソルネットワークにおける前例のないスケーラビリティを実現する,画期的な大規模システム技術を提案する。
我々はエネルギー消費2.39kWhの14.22秒の解法を達成し、0.002の忠実度を達成し、最も顕著な結果は17.18秒の解法である。
論文 参考訳(メタデータ) (2024-06-30T17:14:59Z) - QuantumSEA: In-Time Sparse Exploration for Noise Adaptive Quantum
Circuits [82.50620782471485]
QuantumSEAはノイズ適応型量子回路のインタイムスパース探索である。
1)トレーニング中の暗黙の回路容量と(2)雑音の頑健さの2つの主要な目標を達成することを目的としている。
提案手法は, 量子ゲート数の半減と回路実行の2倍の時間節約で, 最先端の計算結果を確立する。
論文 参考訳(メタデータ) (2024-01-10T22:33:00Z) - QUIK: Towards End-to-End 4-Bit Inference on Generative Large Language
Models [57.04178959678024]
重み付けとアクティベーションの両方を4ビットにキャストすることで、大きな生成モデルに対する推論計算の大部分が実行可能であることを示す。
これをQUIKと呼ばれるハイブリッド量子化戦略により実現し、重みとアクティベーションの大部分を4ビットに圧縮する。
我々は、QUIKフォーマットを高効率なレイヤワイドランタイムに適合させるGPUカーネルを提供し、これにより、エンドツーエンドのスループットが3.4倍に向上する。
論文 参考訳(メタデータ) (2023-10-13T17:15:05Z) - Fast Simulation of High-Depth QAOA Circuits [10.778538580079365]
量子近似最適化アルゴリズム(QAOA)のシミュレータを提案する。
本シミュレータはQAOAパラメータ最適化の計算コストを削減することを目的として設計されている。
cuQuantumをベースとした最先端のGPU量子回路シミュレータと比較して,典型的なQAOAパラメータ最適化の時間を,$n = 26$ qubitsで11倍に短縮する。
論文 参考訳(メタデータ) (2023-09-09T17:01:29Z) - Efficient and Equivariant Graph Networks for Predicting Quantum
Hamiltonian [72.57870177599492]
本稿では,効率と等価性を実現するSE(3)-equivariant Network,QHNetを提案する。
我々の重要な進歩はQHNetアーキテクチャの革新的な設計であり、基礎となる対称性に従うだけでなく、テンソル製品の数を92%削減できる。
実験結果から,我々のQHNetは最先端の手法に匹敵する性能を極めて高速に達成できることが示された。
論文 参考訳(メタデータ) (2023-06-08T03:47:33Z) - EfficientViT: Memory Efficient Vision Transformer with Cascaded Group
Attention [44.148667664413004]
我々はEfficientViTという高速視覚変換器群を提案する。
既存のトランスモデルの速度は、一般にメモリ非効率な演算によって制限される。
この問題に対処するため,異なるスプリットのアテンションヘッドを刺激するグループアテンションモジュールを提案する。
論文 参考訳(メタデータ) (2023-05-11T17:59:41Z) - Exact and approximate simulation of large quantum circuits on a single
GPU [0.46603287532620735]
最大27量子ビットのフーリエ変換回路の正確なシミュレーションのための競合実行時間を報告する。
また、54量子ビットに作用するランダム回路の全ての振幅を、平均忠実度が4%以上の7層で近似シミュレーションした。
論文 参考訳(メタデータ) (2023-04-28T16:45:28Z) - Iterative Qubits Management for Quantum Index Searching in a Hybrid
System [56.39703478198019]
IQuCSは、量子古典ハイブリッドシステムにおけるインデックス検索とカウントを目的としている。
我々はQiskitでIQuCSを実装し、集中的な実験を行う。
その結果、量子ビットの消費を最大66.2%削減できることが示されている。
論文 参考訳(メタデータ) (2022-09-22T21:54:28Z) - Quantum thermodynamic methods to purify a qubit on a quantum processing
unit [68.8204255655161]
我々は、同じ量子ビットを備えた量子処理ユニット上で量子ビットを浄化する量子熱力学法について報告する。
私たちの出発点は、よく知られた2つのキュービットスワップエンジンをエミュレートする3つのキュービット設計です。
使用可能な超伝導量子ビットベースのQPU上に実装し,200mKまでの浄化能を観測する。
論文 参考訳(メタデータ) (2022-01-31T16:13:57Z) - Cache Blocking Technique to Large Scale Quantum Computing Simulation on
Supercomputers [0.0]
我々は,スワップゲートを量子回路に挿入することで,データ移動を減らすキャッシュブロッキング手法を適用した。
我々はオープンソースのシミュレーションフレームワークであるQiskit Aerにこのテクニックを実装した。
論文 参考訳(メタデータ) (2021-02-05T02:03:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。