Fugu-MT 論文翻訳(概要): PauLIB: A High-Performance Library for Processing Pauli Strings

論文の概要: PauLIB: A High-Performance Library for Processing Pauli Strings

arxiv url: http://arxiv.org/abs/2605.25974v1
Date: Mon, 25 May 2026 15:48:14 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-26 19:50:20.449093
Title: PauLIB: A High-Performance Library for Processing Pauli Strings
Title（参考訳）: PauLIB: Pauli文字列を処理する高性能ライブラリ
Authors: Florian Krötz,
Abstract要約: PauLIBは、大きなパウリ和を処理するためのヘッダのみのC++20ライブラリである。 2ビットで各キュービットを符号化するビットパック二進シンプレクティック表現は、パウリの乗算をビットワイズXORと人口数に還元する。分岐予測可能なSIMDバルク操作を可能にするためにハッシュマップを置き換えるソートされた配列レイアウト。明示的なSIMDベクトル化のために連続したワード配列を公開する構造体配列(SoA)メモリレイアウト。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Processing large Pauli sums is a significant bottleneck in quantum chemistry, Pauli propagation, and Pauli-based compilation. Existing frameworks often suffer from Python interpreter overhead or utilize hash-map data structures that hinder SIMD vectorization and complicate multi-threaded merging. We present PauLIB, a header-only C++20 library designed to eliminate these bottlenecks through three key architectural choices. A bit-packed binary symplectic representation that encodes each qubit in two bits, reducing Pauli multiplication to a bitwise XOR and a population count; a sorted array layout that replaces hash maps to enable branch-predictable SIMD bulk operations; and a struct-of-arrays (SoA) memory layout that exposes contiguous word arrays for explicit SIMD vectorization. Benchmarks at 500 qubits show that single Pauli string multiplication runs at 25ns per operation-14 times faster than PauliEngine and 660 times faster than Qiskit-flat across all pair counts tested. Hamiltonian outer-product multiplication is approximately 10 times faster than PauliEngine and 45 times faster than Qiskit at all tested sizes. Greedy commutation grouping, the dominant preprocessing cost in variational algorithms, achieves up to 21,000 times speedup over PennyLane, driven by the compact bit-packed representation. The compact layout reduces the memory footprint of a one-million-term Hamiltonian at 500 qubits from 1,036MB (Qiskit) to 142MB, a 7.3 times reduction that directly enables larger problem sizes within a fixed memory budget. PauLIB is open source and provides C++ and Python interfaces.
Abstract（参考訳）: 大規模なパウリ和を処理することは、量子化学、パウリ伝播、パウリベースのコンパイルにおいて重要なボトルネックとなる。既存のフレームワークは、しばしばPythonインタプリタのオーバーヘッドに悩まされるか、SIMDベクタライゼーションを妨げ、マルチスレッドのマージを複雑にするハッシュマップデータ構造を使用する。 PauLIBはヘッダのみのC++20ライブラリで、3つの重要なアーキテクチャ選択を通じてボトルネックを取り除くように設計されています。ビットパックされたバイナリシンプレクティック表現は、各キュービットを2ビットにエンコードし、パウリ乗算をビットワイズXORと人口数に減らし、ハッシュマップを置換して分岐予測可能なSIMDバルク演算を可能にするソート配列レイアウトと、明示的なSIMDベクトル化のために連続したワード配列を露呈するストラクチャ・オブ・アレイ(SoA)メモリレイアウトである。 500 qubits のベンチマークでは、1つの Pauli 文字列の乗算は操作当たり 25ns で、PauliEngine より 14 倍速く、テストされたすべてのペア数に対して Qiskit フラットより 660 倍高速である。ハミルトニアン外積乗算はパウリエンジンの約10倍速く、全ての試験されたサイズでカイスキットの45倍速い。変分アルゴリズムの主要な前処理コストであるGreedy commutation groupingは、PennyLane上で最大21,000倍のスピードアップを達成する。コンパクトなレイアウトは500キュービットの100万のハミルトニアンのメモリフットプリントを1,036MB (Qiskit) から 142MB に削減する。 PauLIBはオープンソースで、C++とPythonのインターフェースを提供する。

関連論文リスト

PACOX: A FPGA-based Pauli Composer Accelerator for Pauli String Computation [0.8481798330936976]
パウリ弦はハイブリッド量子古典アルゴリズムにおける計算プリミティブである。 PACOXは、パウリ弦のためのFPGAベースのアクセラレーターである。実験によると、PACOXは最先端のCPUベースの手法と比較して最大100倍の高速化を実現している。
論文参考訳（メタデータ） (2026-01-08T11:04:57Z)
PauliEngine: High-Performant Symbolic Arithmetic for Quantum Operations [39.36424353588699]
PauliEngineは高性能なC++フレームワークで、Pauli文字列、演算子、シンボル位相追跡、構造変換のための効率的なプリミティブを提供する。 PauliEngineは数値係数とシンボル係数の両方をサポートし、Pythonインターフェースを介してアクセスすることができる。
論文参考訳（メタデータ） (2026-01-05T16:00:44Z)
Strassen Multisystolic Array Hardware Architectures [0.0]
ストラッセンの行列乗算アルゴリズムは、単純行列乗算の複雑さを低減する。汎用ハードウェアは、アルゴリズムが約束する理論的なスピードアップを達成するには適していない。本稿では,Strassenのアルゴリズムの理論的複雑性の低減をハードウェアリソースの節約に直接効率的に変換する,新しいシストリックアレイアーキテクチャを提案し,評価する。
論文参考訳（メタデータ） (2025-02-14T10:40:32Z)
BitStack: Any-Size Compression of Large Language Models in Variable Memory Environments [53.71158537264695]
大規模言語モデル(LLM)は、多くのアプリケーションに革命をもたらしたが、ローカルデバイスにおけるメモリ制限により、その展開は依然として困難である。 textbfBitStackは,メモリ使用量とモデル性能のトレードオフを可能にする,新しいトレーニング不要な重み圧縮手法である。
論文参考訳（メタデータ） (2024-10-31T13:26:11Z)
Efficiently manipulating Pauli strings with PauliArray [0.0]
パウリ行列とパウリ弦は量子コンピューティングで広く使われている。この基底で表される多くのパウリ文字列や演算子を扱うための、十分に包含され、多用途で効率的なツールを持つことが重要である。このライブラリは、Pauli文字列と演算子の配列を表現するデータ構造と、それらを変更して組み合わせるための様々なメソッドを導入している。
論文参考訳（メタデータ） (2024-05-29T17:18:08Z)
Linear Depth QFT over IBM Heavy-hex Architecture [5.452714742737149]
我々は,既存のIBMヘビーヘックスアーキテクチャに対する量子フーリエ変換回路の効率的なマッピング手法を提案する。この計算は、これらの構造の時間的複雑さに対して線形深さ上限が存在することを示している。これらの結果は、最先端の手法よりも優れている。
論文参考訳（メタデータ） (2024-02-15T04:41:31Z)
BTR: Binary Token Representations for Efficient Retrieval Augmented Language Models [77.0501668780182]
Retrieval augmentationは、大規模言語モデルにおける多くの重要な問題に対処する。検索拡張言語モデル(LM)の実行は遅く、大量の検索されたテキストを処理するため、スケールが困難である。 1ビットベクトルを用いて各トークンを前処理するバイナリトークン表現(BTR)を導入する。
論文参考訳（メタデータ） (2023-10-02T16:48:47Z)
HDCC: A Hyperdimensional Computing compiler for classification on embedded systems and high-performance computing [58.720142291102135]
この研究は、HDC分類メソッドの高レベルな記述を最適化されたCコードに変換する最初のオープンソースコンパイラである、ネームコンパイラを紹介している。 nameは現代のコンパイラのように設計されており、直感的で記述的な入力言語、中間表現(IR)、再ターゲット可能なバックエンドを備えている。これらの主張を裏付けるために,HDC文献で最もよく使われているデータセットについて,HDCCを用いて実験を行った。
論文参考訳（メタデータ） (2023-04-24T19:16:03Z)
Accelerating Barnes-Hut t-SNE Algorithm by Efficient Parallelization on Multi-Core CPUs [59.18990342943095]
t-SNEは高次元データを視覚化するための最も一般的な埋め込み技術の一つである。 BH t-SNEアルゴリズムは既存のCPU実装では非効率である。 Acc-t-SNEはScikit-learnよりも最大261倍、4倍高速で、daal4pyの最先端のBH t-SNE実装である。
論文参考訳（メタデータ） (2022-12-22T06:38:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。