論文の概要: GPU-accelerated Effective Hamiltonian Calculator
- arxiv url: http://arxiv.org/abs/2411.09982v1
- Date: Fri, 15 Nov 2024 06:33:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-18 15:37:55.332748
- Title: GPU-accelerated Effective Hamiltonian Calculator
- Title(参考訳): GPU加速効果ハミルトニアン電卓
- Authors: Abhishek Chakraborty, Taylor L. Patti, Brucek Khailany, Andrew N. Jordan, Anima Anandkumar,
- Abstract要約: 本研究では,非摂動解析対角化法(NPAD)とマグナス拡大法に着想を得た数値解析手法を提案する。
私たちの数値技術は、オープンソースPythonパッケージとして、$rm qCH_eff$で利用可能です。
- 参考スコア(独自算出の注目度): 70.12254823574538
- License:
- Abstract: Effective Hamiltonian calculations for large quantum systems can be both analytically intractable and numerically expensive using standard techniques. In this manuscript, we present numerical techniques inspired by Nonperturbative Analytical Diagonalization (NPAD) and the Magnus expansion for the efficient calculation of effective Hamiltonians. While these tools are appropriate for a wide array of applications, we here demonstrate their utility for models that can be realized in circuit-QED settings. Our numerical techniques are available as an open-source Python package, ${\rm qCH_{eff}}$ (https://github.com/NVlabs/qCHeff), which uses the CuPy library for GPU-acceleration. We report up to 15x speedup on GPU over CPU for NPAD, and up to 42x speedup for the Magnus expansion (compared to QuTiP), for large system sizes.
- Abstract(参考訳): 大規模量子系に対する効果的なハミルトニアン計算は、標準的な手法を用いて解析的に抽出可能であり、数値的に高価である。
本論文では,非摂動分析対角化法(NPAD)とマグナス拡大法に着想を得た数値的手法を用いて,ハミルトニアンの効率的な計算を行う。
これらのツールは広範囲のアプリケーションに適しているが,回路QED設定で実現可能なモデルに対して,それらの実用性を実証する。
当社の数値技術は,オープンソースPythonパッケージである${\rm qCH_{eff}}$ (https://github.com/NVlabs/qCHeff)として利用可能です。
NPADではCPU上のGPUの最大15倍のスピードアップを報告し、大規模なシステムサイズではMagnus拡張(QuTiPと比較)の最大42倍のスピードアップを報告した。
関連論文リスト
- Multi-GPU RI-HF Energies and Analytic Gradients $-$ Towards High Throughput Ab Initio Molecular Dynamics [0.0]
本稿では,複数グラフィクス処理ユニット(GPU)を用いた高次ハートリー・フォックエネルギーと解析勾配の解法を最適化したアルゴリズムと実装を提案する。
このアルゴリズムは特に、中小分子(10-100原子)の高スループット初期分子動力学シミュレーションのために設計されている。
論文 参考訳(メタデータ) (2024-07-29T00:14:10Z) - Introducing GPU-acceleration into the Python-based Simulations of Chemistry Framework [4.368931200886271]
我々はPySCFのメソッドのGPUアクセラレーションを提供するモジュールであるGPU4PySCFの最初のバージョンを紹介する。
ベンチマーク計算は、PySCFのマルチスレッドCPUHartree-Fockコードに対して、2桁の大幅な高速化を示している。
論文 参考訳(メタデータ) (2024-07-12T21:50:19Z) - GPU-accelerated Auxiliary-field quantum Monte Carlo with multi-Slater determinant trial states [11.514211053741338]
本稿では,グラフィック処理ユニットアクセラレーション ph-AFQMC の実装と応用について述べる。
マルチスレーター試行状態を用いて、ph-AFQMCは強い相関系を忠実に扱う可能性がある。
我々の研究はMSDAFQMC計算の効率を大幅に向上させる。
論文 参考訳(メタデータ) (2024-06-12T15:15:17Z) - Enhancing GPU-acceleration in the Python-based Simulations of Chemistry Framework [6.4347138500286665]
我々は、既存のオープンソースGPU4PySCFプロジェクトへの産業利害関係者として、当社の貢献を説明します。
我々は、密度汎関数理論(DFT)を含む他のPySCF機能にGPUアクセラレーションを統合した。
GPU4PySCFは32コアのCPUノード上で30倍のスピードアップを実現し、ほとんどのDFTタスクで約90%のコスト削減を実現している。
論文 参考訳(メタデータ) (2024-04-15T04:35:09Z) - QUIK: Towards End-to-End 4-Bit Inference on Generative Large Language
Models [57.04178959678024]
重み付けとアクティベーションの両方を4ビットにキャストすることで、大きな生成モデルに対する推論計算の大部分が実行可能であることを示す。
これをQUIKと呼ばれるハイブリッド量子化戦略により実現し、重みとアクティベーションの大部分を4ビットに圧縮する。
我々は、QUIKフォーマットを高効率なレイヤワイドランタイムに適合させるGPUカーネルを提供し、これにより、エンドツーエンドのスループットが3.4倍に向上する。
論文 参考訳(メタデータ) (2023-10-13T17:15:05Z) - Batch-efficient EigenDecomposition for Small and Medium Matrices [65.67315418971688]
EigenDecomposition (ED)は多くのコンピュータビジョンアルゴリズムとアプリケーションの中心にある。
本稿では,コンピュータビジョンの応用シナリオに特化したQRベースのED手法を提案する。
論文 参考訳(メタデータ) (2022-07-09T09:14:12Z) - Performance Evaluation and Acceleration of the QTensor Quantum Circuit
Simulator on GPUs [6.141912076989479]
我々は、NumPy、PyTorch、CuPyのバックエンドを実装し、ベンチマークを行い、CPUまたはGPUにテンソルシミュレーションの最適な割り当てを見つける。
ベンチマークしたQAOA回路のCPU上のNumPyベースライン上でのGPUの高速化により,MaxCut問題を解く。
論文 参考訳(メタデータ) (2022-04-12T19:03:44Z) - TensorLy-Quantum: Quantum Machine Learning with Tensor Methods [67.29221827422164]
PyTorch APIを採用した量子回路シミュレーションのためのPythonライブラリを作成します。
Ly-Quantumは、単一のGPU上で数百のキュービット、複数のGPU上で数千のキュービットにスケールすることができる。
論文 参考訳(メタデータ) (2021-12-19T19:26:17Z) - Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-05-25T15:55:14Z) - Hybrid Models for Learning to Branch [81.93868699246214]
我々はCPUマシン上で効率的な分岐を行うための新しいハイブリッドアーキテクチャを提案する。
提案アーキテクチャは,GNNの表現力と分岐処理のための計算コストの低い多層パーセプトロン(MLP)を組み合わせる。
論文 参考訳(メタデータ) (2020-06-26T21:03:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。