Fugu-MT 論文翻訳(概要): Benchmarking Quantum Red TEA on CPUs, GPUs, and TPUs

論文の概要: Benchmarking Quantum Red TEA on CPUs, GPUs, and TPUs

arxiv url: http://arxiv.org/abs/2409.03818v1
Date: Thu, 5 Sep 2024 18:00:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-09 17:40:07.744498
Title: Benchmarking Quantum Red TEA on CPUs, GPUs, and TPUs
Title（参考訳）: CPU、GPU、TPU上での量子Red TEAのベンチマーク
Authors: Daniel Jaschke, Marco Ballarin, Nora Reinić, Luka Pavešić, Simone Montangero,
Abstract要約: 異なる線形代数バックエンド(例えば、numpy と torch, jax, tensorflow ライブラリ)を比較し、対象ハードウェアに対して混合精度に着想を得たアプローチと最適化を行う。我々は、CPU上でパラメータをチューニングする際の34の係数の高速化と、GPUに移行する際の最高のCPU設定上の2.76の要素を得る方法を提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We benchmark simulations of many-body quantum systems on heterogeneous hardware platforms using CPUs, GPUs, and TPUs. We compare different linear algebra backends, e.g., numpy versus the torch, jax, or tensorflow library, as well as a mixed-precision-inspired approach and optimizations for the target hardware. Quantum red TEA out of the Quantum TEA library specifically addresses handling tensors with different libraries or hardware, where the tensors are the building block of tensor network algorithms. The benchmark problem is a variational search of a ground state in an interacting model. This is a ubiquitous problem in quantum many-body physics, which we solve using tensor network methods. This approximate state-of-the-art method compresses quantum correlations which is key to overcoming the exponential growth of the Hilbert space as a function of the number of particles. We present a way to obtain speedups of a factor of 34 when tuning parameters on the CPU, and an additional factor of 2.76 on top of the best CPU setup when migrating to GPUs.
Abstract（参考訳）: 我々は、CPU、GPU、TPUを用いた異種ハードウェアプラットフォーム上での多体量子システムのシミュレーションをベンチマークした。我々は、異なる線形代数バックエンド、例えば、numpyとトーチ、jax、テンソルフローライブラリを比較し、ターゲットハードウェアに対する混合精度に着想を得たアプローチと最適化を比較した。 Quantum TEAライブラリの量子赤TEAは、テンソルがテンソルネットワークアルゴリズムの構築ブロックである、異なるライブラリやハードウェアでテンソルを扱うことに特化している。ベンチマーク問題は、相互作用モデルにおける基底状態の変動探索である。これは量子多体物理学におけるユビキタス問題であり、テンソルネットワーク法を用いて解く。この近似的最先端法は、粒子数の関数としてヒルベルト空間の指数的成長を克服する鍵となる量子相関を圧縮する。我々は、CPU上でパラメータをチューニングする際の34の係数の高速化と、GPUに移行する際の最高のCPU設定上の2.76の要素を得る方法を提案する。

関連論文リスト

Qiboml: towards the orchestration of quantum-classical machine learning [53.28668485072944]
本稿では,量子および古典的機械学習をオーケストレーションするオープンソースソフトウェアライブラリであるQibomlを紹介する。多様なシミュレーションオプション、ノイズ認識シミュレーション、リアルタイムエラー軽減とキャリブレーションなどの機能を紹介する。
論文参考訳（メタデータ） (2025-10-13T18:00:00Z)
Simulating and Sampling from Quantum Circuits with 2D Tensor Networks [0.0]
多体波動関数に対する2次元テンソルネットワークAns"atzeを用いて量子回路を古典的にシミュレートする。また,2次元離散時間ハイゼンベルクモデルにおける領域壁クエンチを,大きな重ヘックスおよび回転正方格子上で研究する。
論文参考訳（メタデータ） (2025-07-15T15:50:02Z)
TensorQC: Towards Scalable Distributed Quantum Computing via Tensor Networks [16.609478015737707]
量子処理ユニット(QPU)は、正確な結果を得るために、多数の高品質キュービットを含む必要がある。ほとんどの科学的および産業的な古典的な計算処理は分散システム上で並列に行われる。本稿では、スタンドアロンのQPUやそれ以前の回路切断技術には難易度の高いベンチマークを実行することを実証する。
論文参考訳（メタデータ） (2025-02-05T18:42:07Z)
GPU-accelerated Effective Hamiltonian Calculator [70.12254823574538]
本研究では,非摂動解析対角化法(NPAD)とマグナス拡大法に着想を得た数値解析手法を提案する。私たちの数値技術は、オープンソースPythonパッケージとして、$rm qCH_eff$で利用可能です。
論文参考訳（メタデータ） (2024-11-15T06:33:40Z)
3D-QAE: Fully Quantum Auto-Encoding of 3D Point Clouds [71.39129855825402]
既存の3D表現の学習方法は、古典的なハードウェアでトレーニングされ、テストされるディープニューラルネットワークである。本稿では3次元点雲のための最初の量子オートエンコーダを紹介する。
論文参考訳（メタデータ） (2023-11-09T18:58:33Z)
Majorization-based benchmark of the complexity of quantum processors [105.54048699217668]
我々は、様々な量子プロセッサの動作を数値的にシミュレートし、特徴付ける。我々は,各デバイスの性能をベンチマークラインと比較することにより,量子複雑性を同定し,評価する。我々は、回路の出力状態が平均して高い純度である限り、偏化ベースのベンチマークが成り立つことを発見した。
論文参考訳（メタデータ） (2023-04-10T23:01:10Z)
TeD-Q: a tensor network enhanced distributed hybrid quantum machine learning framework [59.07246314484875]
TeD-Qは、量子機械学習のためのオープンソースのソフトウェアフレームワークである。古典的な機械学習ライブラリと量子シミュレータをシームレスに統合する。量子回路とトレーニングの進捗をリアルタイムで視覚化できるグラフィカルモードを提供する。
論文参考訳（メタデータ） (2023-01-13T09:35:05Z)
Performance Evaluation and Acceleration of the QTensor Quantum Circuit Simulator on GPUs [6.141912076989479]
我々は、NumPy、PyTorch、CuPyのバックエンドを実装し、ベンチマークを行い、CPUまたはGPUにテンソルシミュレーションの最適な割り当てを見つける。ベンチマークしたQAOA回路のCPU上のNumPyベースライン上でのGPUの高速化により,MaxCut問題を解く。
論文参考訳（メタデータ） (2022-04-12T19:03:44Z)
RosneT: A Block Tensor Algebra Library for Out-of-Core Quantum Computing Simulation [0.18472148461613155]
本稿では,分散ブロックテンソル代数のためのライブラリRosneTを提案する。我々はPyCOMPSsプログラミングモデルを用いてテンソル演算をComposランタイムが処理するタスクの集合に変換する。本稿では, 最大53量子ビットの量子回路シミュレーションにおいて, 優れたスケーラビリティを示す手法を検証した。
論文参考訳（メタデータ） (2022-01-17T20:35:40Z)
TensorLy-Quantum: Quantum Machine Learning with Tensor Methods [67.29221827422164]
PyTorch APIを採用した量子回路シミュレーションのためのPythonライブラリを作成します。 Ly-Quantumは、単一のGPU上で数百のキュービット、複数のGPU上で数千のキュービットにスケールすることができる。
論文参考訳（メタデータ） (2021-12-19T19:26:17Z)
Simulation of quantum many-body dynamics with Tensor Processing Units: Floquet prethermalization [0.3078264203938486]
長い時間スケールでの量子多体ダイナミクスの超並列古典シミュレーションにおけるTPUの利用を実証する。数百万の2量子ゲートを持つ回路に対応するL=34量子ビットを105ドル以上のフロケ時間でシミュレーションする。我々の研究は、TPUが量子多体力学の最先端のシミュレーションに大きな利点をもたらすことを実証している。
論文参考訳（メタデータ） (2021-11-15T19:02:54Z)
Adaptive Elastic Training for Sparse Deep Learning on Heterogeneous Multi-GPU Servers [65.60007071024629]
本稿では,Adaptive SGDが4つの最先端ソリューションよりも精度が高いことを示す。本稿では,Adaptive SGDが時間と精度で4つの最先端ソリューションより優れていることを示す。
論文参考訳（メタデータ） (2021-10-13T20:58:15Z)
Fast quantum circuit simulation using hardware accelerated general purpose libraries [69.43216268165402]
CuPyは、GPUベースの量子回路向けに開発された汎用ライブラリ(線形代数)である。上位回路の場合、スピードアップは約2倍、量子乗算器の場合、最先端のC++ベースのシミュレータと比べて約22倍である。
論文参考訳（メタデータ） (2021-06-26T10:41:43Z)
Accelerating variational quantum algorithms with multiple quantum processors [78.36566711543476]
変分量子アルゴリズム(VQA)は、特定の計算上の利点を得るために、短期量子マシンを利用する可能性がある。現代のVQAは、巨大なデータを扱うために単独の量子プロセッサを使用するという伝統によって妨げられている、計算上のオーバーヘッドに悩まされている。ここでは、この問題に対処するため、効率的な分散最適化手法であるQUDIOを考案する。
論文参考訳（メタデータ） (2021-06-24T08:18:42Z)
Hybrid Models for Learning to Branch [81.93868699246214]
我々はCPUマシン上で効率的な分岐を行うための新しいハイブリッドアーキテクチャを提案する。提案アーキテクチャは,GNNの表現力と分岐処理のための計算コストの低い多層パーセプトロン(MLP)を組み合わせる。
論文参考訳（メタデータ） (2020-06-26T21:03:45Z)
Kernel Operations on the GPU, with Autodiff, without Memory Overflows [5.669790037378094]
KeOpsライブラリは、数学的公式によってエントリが与えられるテンソルに対して、高速でメモリ効率のよいGPUサポートを提供する。 KeOpsは、カーネルおよび幾何学的アプリケーションのためのテンソル中心ライブラリの大きなボトルネックであるメモリ消費を緩和する。 KeOpsは、最適化されたC++/CUDAスキームと、Python(NumpyとPyTorch)、Matlab、Rのバインダーを組み合わせる。
論文参考訳（メタデータ） (2020-03-27T08:54:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。