論文の概要: A distributed multi-GPU ab initio density matrix renormalization group
algorithm with applications to the P-cluster of nitrogenase
- arxiv url: http://arxiv.org/abs/2311.02854v1
- Date: Mon, 6 Nov 2023 04:01:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 15:23:35.576624
- Title: A distributed multi-GPU ab initio density matrix renormalization group
algorithm with applications to the P-cluster of nitrogenase
- Title(参考訳): 分散マルチgpu ab initio density matrix renormalization group algorithmとそのp-cluster of nitrogenaseへの応用
- Authors: Chunyang Xiang, Weile Jia, Wei-Hai Fang, Zhendong Li
- Abstract要約: ニトロゲナーゼ中の鉄-硫黄クラスターのような多核遷移金属化合物は、最先端の量子化学手法では困難である。
本稿では,最新の高性能コンピューティング基盤に適した分散マルチGPUab initio density matrix renormalization (DMRG)アルゴリズムを提案する。
我々は、活性宇宙模型の基底状態エネルギーに対して、前例のない精度(1ミリハーツリー/金属)に達することができる。
- 参考スコア(独自算出の注目度): 1.7444066202370399
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The presence of many degenerate $d/f$ orbitals makes polynuclear transition
metal compounds such as iron-sulfur clusters in nitrogenase challenging for
state-of-the-art quantum chemistry methods. To address this challenge, we
present the first distributed multi-GPU (Graphics Processing Unit) ab initio
density matrix renormalization (DMRG) algorithm, suitable for modern
high-performance computing (HPC) infrastructures. The central idea is to
parallelize the most computationally intensive part - the multiplication of
$O(K^2)$ operators with a trial wavefunction, where $K$ is the number of
spatial orbitals, by combining operator parallelism for distributing the
workload with a batched algorithm for performing contractions on GPU. With this
new implementation, we are able to reach an unprecedented accuracy (1
milli-Hartree per metal) for the ground-state energy of an active space model
(114 electrons in 73 active orbitals) of the P-cluster with a bond dimension
$D=14000$ on 48 GPUs (NVIDIA A100 80 GB SXM), which is nearly three times
larger than the bond dimensions reported in previous DMRG calculations for the
same system using only CPUs.
- Abstract(参考訳): 多くの縮退した$d/f$軌道の存在により、鉄-硫黄クラスターのような多核遷移金属化合物は、最先端の量子化学法に挑戦する。
この課題に対処するために、現代高性能コンピューティング(HPC)インフラに適した、最初の分散マルチGPU (Graphics Processing Unit) ab initio density matrix renormalization (DMRG)アルゴリズムを提案する。
中心となるアイデアは、最も計算集約的な部分である$o(k^2)$演算子と試行的な波動関数の乗算を並列化することであり、ここで$k$は空間軌道の数である。
この新しい実装により、Pクラスターの活性空間モデル(73個の活性軌道中の114電子)の基底状態エネルギーに対して、48個のGPU(NVIDIA A100 80 GB SXM)上の結合次元$D=14000$という前例のない精度(金属当たり1ミリハート)に達することができる。
関連論文リスト
- Design of an FPGA-Based Neutral Atom Rearrangement Accelerator for Quantum Computing [1.003635085077511]
ニュートラル原子は量子コンピュータを実装するための有望な技術として登場した。
本稿では,分割・対数戦略を応用し,複数の原子の同時移動を可能にする新しい四分法に基づく再配置アルゴリズムを提案する。
これは原子再構成のための最初のハードウェアアクセラレーションであり、処理時間を著しく短縮する。
論文 参考訳(メタデータ) (2024-11-19T10:38:21Z) - Neutron-nucleus dynamics simulations for quantum computers [49.369935809497214]
一般ポテンシャルを持つ中性子核シミュレーションのための新しい量子アルゴリズムを開発した。
耐雑音性トレーニング法により、ノイズの存在下でも許容される境界状態エネルギーを提供する。
距離群可換性(DGC)と呼ばれる新しい可換性スキームを導入し、その性能をよく知られたqubit-commutativityスキームと比較する。
論文 参考訳(メタデータ) (2024-02-22T16:33:48Z) - Two dimensional quantum lattice models via mode optimized hybrid CPU-GPU density matrix renormalization group method [0.0]
2つの空間次元量子格子モデル上で量子多体問題をシミュレートするためのハイブリッド数値計算手法を提案する。
本研究では, 2次元スピンレスフェルミオンモデルと, トーラス幾何学上のハバードモデルについて, 計算時間における数桁の大きさを節約できることを実証する。
論文 参考訳(メタデータ) (2023-11-23T17:07:47Z) - A Quadratic Speedup in Finding Nash Equilibria of Quantum Zero-Sum Games [102.46640028830441]
最適行列乗算重み更新(OMMWU)アルゴリズムを導入し,平均収束複雑性を$mathcalO(d/epsilon)$ to $epsilon$-Nash equilibriaとする。
この二次的なスピードアップは、量子ゼロサムゲームにおける$epsilon$-Nash平衡の計算のための新しいベンチマークを定めている。
論文 参考訳(メタデータ) (2023-11-17T20:38:38Z) - Boosting the effective performance of massively parallel tensor network
state algorithms on hybrid CPU-GPU based architectures via non-Abelian
symmetries [0.0]
Wigner-Eckhart定理に基づく非アベリア対称性関連テンソル代数は、従来のテンソルネットワーク層から完全に分離されている。
我々は、計算複雑性の観点からarXiv:2305.05581で報告された結果に対し、桁違いの性能向上を達成した。
提案手法の有効性能は250-500TFLOPSと推定される。
論文 参考訳(メタデータ) (2023-09-23T07:49:53Z) - On sampling determinantal and Pfaffian point processes on a quantum
computer [49.1574468325115]
DPPは1970年代の量子光学のモデルとしてマッキによって導入された。
ほとんどのアプリケーションはDPPからのサンプリングを必要としており、その量子起源を考えると、古典的なコンピュータでDPPをサンプリングするのは古典的なものよりも簡単かどうか疑問に思うのが自然である。
バニラサンプリングは、各コスト$mathcalO(N3)$と$mathcalO(Nr2)$の2つのステップから構成される。
論文 参考訳(メタデータ) (2023-05-25T08:43:11Z) - Quantum Clustering with k-Means: a Hybrid Approach [117.4705494502186]
我々は3つのハイブリッド量子k-Meansアルゴリズムを設計、実装、評価する。
我々は距離の計算を高速化するために量子現象を利用する。
我々は、我々のハイブリッド量子k-平均アルゴリズムが古典的バージョンよりも効率的であることを示す。
論文 参考訳(メタデータ) (2022-12-13T16:04:16Z) - Density Matrix Renormalization Group with Tensor Processing Units [0.0]
GoogleのProcessing Units(TPU)は、機械学習ワークロードの高速化とスケールアップに特化した集積回路である。
本研究では、局所量子多体ハミルトニアンの基底状態を計算するための強力な数値的アプローチである密度行列再正規化群(DMRG)の高速化とスケールアップにTPUを用いることを実証する。
論文 参考訳(メタデータ) (2022-04-12T10:40:14Z) - Realization of arbitrary doubly-controlled quantum phase gates [62.997667081978825]
本稿では,最適化問題における短期量子優位性の提案に着想を得た高忠実度ゲートセットを提案する。
3つのトランペット四重項のコヒーレントな多レベル制御を編成することにより、自然な3量子ビット計算ベースで作用する決定論的連続角量子位相ゲートの族を合成する。
論文 参考訳(メタデータ) (2021-08-03T17:49:09Z) - VersaGNN: a Versatile accelerator for Graph neural networks [81.1667080640009]
我々は,超効率的なサイストリックアレイベースの多用途ハードウェアアクセラレータである textitVersaGNN を提案する。
textitVersaGNNは平均3712$times$ speedup with 1301.25$times$ energy reduction on CPU、35.4$times$ speedup with 17.66$times$ energy reduction on GPUを達成している。
論文 参考訳(メタデータ) (2021-05-04T04:10:48Z) - Massively parallel quantum chemical density matrix renormalization group
method [0.0]
量子化学密度行列再正規化群 (QC-DMRG) 計算にスーパーコンピュータプラットフォームを利用する最初の試みである。
我々は,演算子と対称性セクターの並列性を組み合わせた,社内MPIグローバルメモリライブラリに基づく並列方式を開発した。
最も大きな計算では、76軌道の111個の電子と6000に等しい結合次元からなる活性空間を持つ窒素化物FeMo共ファクタークラスタが、我々の並列アプローチは、およそ2000個のCPUコアまでスケールする。
論文 参考訳(メタデータ) (2020-01-14T16:51:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。