論文の概要: Distributed Variational Quantum Linear Solver
- arxiv url: http://arxiv.org/abs/2604.14435v1
- Date: Wed, 15 Apr 2026 21:27:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.620645
- Title: Distributed Variational Quantum Linear Solver
- Title(参考訳): 分散変分量子線形解法
- Authors: Chao Lu, Pooja Rao, Muralikrishnan Gopalakrishnan Meena, Kalyana Chakaravarthi Gottiparthi,
- Abstract要約: NVIDIA-Q上に構築された分散VQLSフレームワークにより,O(L2)コスト関数評価のスケーラブルな分散を実現する。
高速ウォルシュ・アダマール変換(英語版) (FWHT) によるパウリ分解はLCU項の指数関数的な成長を抑制し、L を n > 6 ビットで O(2n) から O(1) に還元する。
10ビットの3重対角トープリッツ系の場合、これは256倍減少し、99.99%以上の解忠実度を保っている。
- 参考スコア(独自算出の注目度): 2.7835589988032887
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The Variational Quantum Linear Solver (VQLS), a hybrid quantum-classical algorithm for solving linear systems, faces a practical scalability bottleneck: the Linear Combination of Unitaries (LCU) decomposition requires O(L^2) circuit evaluations per optimizer iteration, where $L$ can grow as 4^n for n-qubit systems for the worst case scenario. We address this computational bottleneck through two complementary strategies. First, we present a distributed VQLS (D-VQLS) framework, built on NVIDIA CUDA-Q, that enables asynchronous, scalable distribution of the O(L^2) cost-function evaluations. Second, a fast Walsh--Hadamard transform (FWHT)-based Pauli decomposition with 1% coefficient thresholding curbs the exponential growth of LCU terms, reducing L from O}(2^n) to O(1) for n > 6 qubits and compressing the per-iteration circuit complexity from O(n * 4^n) to O(n) for sparse, structured matrices. For a 10-qubit tridiagonal Toeplitz system, this yields a 256x reduction, from 23 million to 90,112 circuits per iteration, while preserving over $99.99\%$ solution fidelity. Additionally, to inform feasibility on early fault-tolerant QPUs, the paper provides resource estimates -- gate counts, qubit requirements, and circuit evaluations per iteration -- for VQLS applied to arbitrary matrices. The D-VQLS framework is validated on the NERSC Perlmutter supercomputer using multi-node, multi-GPU ideal state-vector simulations, achieving over 99.99% fidelity against classical solutions on tridiagonal Toeplitz and Hele--Shaw flow benchmarks, with near-ideal strong scaling up to 24 GPUs and 95.3% weak scaling efficiency at 96 GPUs processing 360,448 circuits per iteration for a 10-qubit system. Systematic profiling identifies the optimal resource allocation for distributed quantum circuit workloads, yielding a 2.52x speedup for the configurations studied.
- Abstract(参考訳): 線形系を解くためのハイブリッド量子古典的アルゴリズムである変分量子線形ソルバー(VQLS)は、現実的なスケーラビリティのボトルネックに直面している。 線形ユニタリ(LCU)分解はオプティマイザ反復毎にO(L^2)回路評価を必要とする。
この計算ボトルネックを2つの相補的戦略によって解決する。
まず,NVIDIA CUDA-Qをベースとした分散VQLS(D-VQLS)フレームワークを提案する。
第二に、1%の閾値閾値を持つ高速ウォルシュ・アダマール変換(FWHT)に基づくパウリ分解は、LCU項の指数的な成長を抑制し、LをO(2^n)からO(1)に減らし、n > 6 qubitsとし、スパースで構造化された行列に対してO(n * 4^n)からO(n)に圧縮する。
10ビットの3重対角トープリッツ系の場合、これは256倍の減少となり、1イテレーションあたり2300万から90,112回路となり、99.99\%以上の解の忠実さが保たれる。
さらに,早期フォールトトレラントQPUの実現可能性を明らかにするため,任意の行列に適用したVQLSに対して,ゲート数,キュービット要求,回路評価などのリソース推定を行う。
D-VQLSフレームワークは、NERSC Perlmutterスーパーコンピュータ上で、マルチノード、マルチGPUの理想的な状態ベクトルシミュレーションを用いて検証され、99.99%以上の忠実さをトリジタゴナルなToeplitzとHele-Shawフローベンチマークで達成した。
システマティックプロファイリングは、分散量子回路のワークロードに対して最適なリソース割り当てを特定し、研究された構成に対して2.52倍のスピードアップをもたらす。
関連論文リスト
- A Scalable Distributed Quantum Optimization Framework via Factor Graph Paradigm [46.08923284345648]
分散量子最適化のための構造認識フレームワークを提案する。
検索スペースが$N$の場合、我々のフレームワークはプロセッサやセパレータに依存した要素に対して$O(sqrtN)$クエリ複雑性を達成する。
構造を考慮した分解は、量子ネットワーク上でのスケーラブルな分散量子最適化に実践的な道をもたらすことを示す。
論文 参考訳(メタデータ) (2026-03-08T15:15:52Z) - Block encoding of sparse matrices with a periodic diagonal structure [67.45502291821956]
周期的な対角構造を持つスパース行列を符号化するための明示的な量子回路を提供する。
本手法の様々な応用は, 微分問題を解く文脈で論じる。
論文 参考訳(メタデータ) (2026-02-11T07:24:33Z) - BPDQ: Bit-Plane Decomposition Quantization on a Variable Grid for Large Language Models [56.504879072674015]
本稿では,ビットプレーンとスカラー係数による可変量子化グリッドを構成するビットプレーン分解量子化(BPDQ)を提案する。
BPDQは、1つのGTX 3090上でQwen2.5-72Bを83.85%のGSM8Kの精度で提供できる(ただし16ビットでは90.83%)。
論文 参考訳(メタデータ) (2026-02-04T02:54:37Z) - On the Constant Depth Implementation of Pauli Exponentials [49.48516314472825]
任意の長さの $Zotimes n$指数を$mathcalO(n)$ ancillae と 2体 XX と ZZ の相互作用を用いて一定深さの回路に分解する。
クビットリサイクルの恩恵を受ける回路の書き直し規則を導入し,本手法の正しさを実証する。
論文 参考訳(メタデータ) (2024-08-15T17:09:08Z) - A Multilevel Approach For Solving Large-Scale QUBO Problems With Noisy Hybrid Quantum Approximate Optimization [3.3493770627144004]
既存の量子処理ユニット(QPU)がマルチレベル戦略においてサブソルバとしてどのように機能するかを実験的に検証する。
完全連結な 82$-qubit Sherrington-Kirkpatrick グラフに対して 10$ の近似解を求める。
量子最適化の結果は古典学と比較して解の質に関して競争力がある。
論文 参考訳(メタデータ) (2024-08-14T20:06:32Z) - Light Cone Cancellation for Variational Quantum Eigensolver in Solving Noisy Max-Cut [2.646003577565874]
変分量子固有解法(VQE)は、与えられたハミルトンの基底エネルギーを推定するために用いられる量子古典ハイブリッドアルゴリズムである。
本研究では,光円錐キャンセラ法(LCC)を用いて2局所アンサッツに必要な量子ビット数とゲート数を削減した。
論文 参考訳(メタデータ) (2024-04-30T12:31:03Z) - Efficient DCQO Algorithm within the Impulse Regime for Portfolio
Optimization [41.94295877935867]
本稿では,デジタルカウンセバティック量子最適化(DCQO)パラダイムを用いて,ポートフォリオ最適化のための高速なディジタル量子アルゴリズムを提案する。
提案手法は,アルゴリズムの回路深度要件を特に低減し,解の精度を向上し,現在の量子プロセッサに適している。
我々は,IonQトラップイオン量子コンピュータ上で最大20量子ビットを使用するプロトコルの利点を実験的に実証した。
論文 参考訳(メタデータ) (2023-08-29T17:53:08Z) - A Structured Method for Compilation of QAOA Circuits in Quantum
Computing [5.560410979877026]
2ビットゲートを並べ替える柔軟性により、コンパイラ最適化により、より深い深さ、ゲート数、忠実度で回路を生成することができる。
多次元量子アーキテクチャ上の任意のコンパイルQAOA回路に対して線形深さを保証する構造的手法を提案する。
全体として、最大1024キュービットの回路を10秒でコンパイルでき、深さ3.8倍のスピードアップ、ゲート数17%の削減、回路ESPの18倍の改善が可能である。
論文 参考訳(メタデータ) (2021-12-12T04:00:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。