論文の概要: LATTE: A Decoding Architecture for Quantum Computing with Temporal and Spatial Scalability
- arxiv url: http://arxiv.org/abs/2509.03954v1
- Date: Thu, 04 Sep 2025 07:29:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-12 14:18:56.476157
- Title: LATTE: A Decoding Architecture for Quantum Computing with Temporal and Spatial Scalability
- Title(参考訳): LATTE: 時間的および空間的スケーラビリティを備えた量子コンピューティングのためのデコードアーキテクチャ
- Authors: Kai Zhang, Jubo Xu, Fang Zhang, Linghang Kong, Zhengfeng Ji, Jianxin Chen,
- Abstract要約: 格子手術の量子オーバーヘッドをスケールアップする上で重要な要件に対処するため,FPGA-ハイブリッドデコーディングアーキテクチャであるLATTEを導入する。
LATTEは、リアルタイムデコードスループットを実現しつつ、ベースデコーダと同等の精度を提供し、帯域幅要求と計算資源の両方を著しく削減する。
- 参考スコア(独自算出の注目度): 7.184133388805955
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quantum error correction allows inherently noisy quantum devices to emulate an ideal quantum computer with reasonable resource overhead. As a crucial component, decoding architectures have received significant attention recently. In this paper, we introduce LATTE, a FPGA-CPU hybrid decoding architecture aiming to address the key requirements of scaling up in lattice surgery quantum computation -- Latency, Accuracy, Throughput and Transmission Bandwidth, in an Eclectic manner. LATTE follows a hierarchical design: (1) A fully streaming and asynchronous block decoding system on CPU to enable parallelization both temporally and spatially. (2) A super-light yet accurate neural local decoding unit integrated with quantum control hardware on FPGA, which remains \emph{transparent} to the block decoding system, effectively reducing transmission bandwidth and accelerating the decoding process. LATTE delivers accuracy on par with the base decoder while achieving real-time decoding throughput and significantly reducing both bandwidth requirements and computational resources, enabling a level of scalability far beyond previous approaches. Under circuit-level noise $p=0.001$, LATTE achieves over $\mathbf{90\%}$ reduction in transmission bandwidth and a $\mathbf{6.4\times}$ speedup on average in single-block decoding. In the \emph{streaming decoding} scenario: (1) LATTE achieves constant and low latency ($\mathbf{16\times}$-$\mathbf{20\times}$ speedup over existing streaming decoding implementations) in arbitrarily long quantum memory experiments, with near-optimal resources -- merely $\mathbf{2}$ threads are sufficient for decoding the surface code with distance up to $17$. (2) LATTE minimizes latency in multi-patch measurement experiments through highly parallelized decoding operations. These combined efforts ensure sufficient scalability for large-scale fault-tolerant quantum computing.
- Abstract(参考訳): 量子エラー補正により、本質的にノイズの多い量子デバイスは、合理的なリソースオーバーヘッドを持つ理想的な量子コンピュータをエミュレートすることができる。
重要なコンポーネントとして、デコードアーキテクチャが最近大きな注目を集めている。
本稿では,格子演算量子計算において,遅延,精度,スループット,伝送帯域幅といった重要な要件に対応するために,FPGA-CPUハイブリッドデコードアーキテクチャであるLATTEを紹介する。
1) 時間的および空間的に並列化を可能にするCPU上の完全ストリーミングおよび非同期ブロック復号システム。
2) FPGA上の量子制御ハードウェアと統合された超軽量で高精度なニューラルネットワーク局所復号ユニットは,ブロック復号システムに<emph{transparent} のまま残っており,伝送帯域を効果的に削減し,復号処理を高速化する。
LATTEは、リアルタイムデコードスループットを実現しつつ、ベースデコーダと同等の精度を提供し、帯域幅要求と計算資源の両方を大幅に削減し、従来のアプローチよりはるかに高いスケーラビリティを実現する。
LATTEは、回路レベルのノイズ$p=0.001$の下で、伝送帯域幅が$\mathbf{90\%}$以上減少し、$\mathbf{6.4\times}$1ブロックデコーディングで平均で$$$\mathbf{6.4\times}$スピードアップを達成する。
1) LATTEは、任意の長さの量子メモリ実験において、ほぼ最適なリソース -- 単に$\mathbf{2}$スレッドで、定数かつ低レイテンシ(\mathbf{16\times}$-$\mathbf{20\times}$-$\mathbf{20\times}$のスピードアップ)を達成する。
2) LATTEは並列化復号処理によるマルチパッチ計測実験の遅延を最小化する。
これらの組み合わせにより、大規模なフォールトトレラント量子コンピューティングに十分なスケーラビリティが確保される。
関連論文リスト
- A distillation-teleportation protocol for fault-tolerant QRAM [95.99192129224721]
本稿では,論理量子乱数アクセスメモリ(QRAM)をフォールトトレラント実装するためのプロトコルを提案する。
古典的メモリサイズ2n$をコヒーレントにアクセスするために、我々のプロトコルは、フォールトトレラントな量子リソースをわずか$mathrmpoly(n)$で消費する。
論文 参考訳(メタデータ) (2025-05-26T17:42:56Z) - Fast correlated decoding of transversal logical algorithms [67.01652927671279]
大規模計算には量子エラー補正(QEC)が必要であるが、かなりのリソースオーバーヘッドが発生する。
近年の進歩により、論理ゲートからなるアルゴリズムにおいて論理キュービットを共同で復号化することにより、症候群抽出ラウンドの数を削減できることが示されている。
ここでは、回路を介して伝播する関連する論理演算子製品を直接復号することで、回路の復号化の問題を修正する。
論文 参考訳(メタデータ) (2025-05-19T18:00:00Z) - Local Clustering Decoder: a fast and adaptive hardware decoder for the surface code [0.0]
本稿では,リアルタイムデコードシステムの精度と速度要件を同時に達成するソリューションとしてローカルクラスタリングデコーダを紹介する。
我々のデコーダはFPGA上に実装され、ハードウェア並列性を利用して、最速のキュービットタイプにペースを保ちます。
通常の非適応復号法と比較して4倍少ない物理量子ビットを持つ100万個の誤りのない量子演算を可能にする。
論文 参考訳(メタデータ) (2024-11-15T16:43:59Z) - Accelerating Error Correction Code Transformers [56.75773430667148]
本稿では,トランスを用いたデコーダの高速化手法を提案する。
最新のハードウェアでは、90%の圧縮比を実現し、算術演算エネルギー消費を少なくとも224倍削減する。
論文 参考訳(メタデータ) (2024-10-08T11:07:55Z) - Demonstrating real-time and low-latency quantum error correction with superconducting qubits [52.08698178354922]
超伝導量子プロセッサに組み込まれたスケーラブルFPGAデコーダを用いて低遅延フィードバックを示す。
復号ラウンド数が増加するにつれて、論理誤差の抑制が観察される。
この作業でデコーダのスループットとレイテンシが発達し、デバイスの継続的な改善と相まって、次世代の実験がアンロックされた。
論文 参考訳(メタデータ) (2024-10-07T17:07:18Z) - Hardware-Aware Parallel Prompt Decoding for Memory-Efficient Acceleration of LLM Inference [19.167604927651073]
LLM(Large Language Models)の自動回帰デコーディングは、ハードウェアの性能に大きなオーバーヘッドをもたらす。
トレーニング可能なパラメータを0.0002$%しか必要とせず,A100-40GBのGPUをたった16時間で効率的にトレーニングできる並列プロンプトデコーディングを提案する。
我々のアプローチでは、最大2.49$times$ スピードアップを示し、最小のメモリオーバーヘッドは0.0004$%である。
論文 参考訳(メタデータ) (2024-05-28T22:19:30Z) - Spatially parallel decoding for multi-qubit lattice surgery [0.10713888959520208]
量子エラー訂正によって保護される量子アルゴリズムの実行には、リアルタイム、古典的なデコーダが必要である。
リアルタイム復号化に関するこれまでのほとんどの研究は、表面コードに符号化された孤立論理量子ビットに焦点を当ててきた。
表面コードでは、実用性のある量子プログラムは格子手術によって実行されるマルチキュービットの相互作用を必要とする。
格子手術中に大規模なマージパッチが発生する可能性がある。
論文 参考訳(メタデータ) (2024-03-03T00:17:13Z) - A real-time, scalable, fast and highly resource efficient decoder for a quantum computer [1.9014261239550778]
我々は、Collision Clusteringデコーダを導入し、FPGAおよびASICハードウェア上で実装する。
我々は、主量子誤り訂正方式である曲面符号を用いて論理記憶実験をシミュレートする。
我々は、超伝導量子ビットのような高速動作モードの要求に合致するMHz復号速度を実証する。
論文 参考訳(メタデータ) (2023-09-11T15:46:27Z) - A Scalable, Fast and Programmable Neural Decoder for Fault-Tolerant
Quantum Computation Using Surface Codes [12.687083899824314]
量子誤り訂正符号(Quantum error-correcting codes, QECCs)は、量子アルゴリズムの実行の大きな障害である量子ノイズの負の効果を排除できる。
回転曲面符号(RSC)に対するFTQECの要件を満たすスケーラブルで高速でプログラム可能なニューラルデコーディングシステムを提案する。
本システムでは,197 nsのデコード遅延を極端に低くし,その精度はMWPMに近い。
論文 参考訳(メタデータ) (2023-05-25T06:23:32Z) - Parallel window decoding enables scalable fault tolerant quantum
computation [2.624902795082451]
本稿では,デコード問題を並列化し,ほぼ任意のシンドローム処理速度を実現する手法を提案する。
並列化では、古典的なフィードバックの決定を遅らせる必要があり、論理クロックの速度が遅くなる。
既知のオート・テレポーテーション・ガジェットを使用すれば、キュービットオーバーヘッドの増加と引き換えに、スローダウンを完全に排除することができる。
論文 参考訳(メタデータ) (2022-09-18T12:37:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。