論文の概要: Low-Latency FPGA Control System for Real-Time Neural Network Processing in CCD-Based Trapped-Ion Qubit Measurement
- arxiv url: http://arxiv.org/abs/2512.15838v1
- Date: Wed, 17 Dec 2025 18:34:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:31.758271
- Title: Low-Latency FPGA Control System for Real-Time Neural Network Processing in CCD-Based Trapped-Ion Qubit Measurement
- Title(参考訳): CCDを用いた1オン量子ビット計測におけるリアルタイムニューラルネットワーク処理のための低レイテンシFPGA制御系
- Authors: Binglei Lou, Gautham Duddi Krishnaswaroop, Filip Wojcicki, Ruilin Wu, Richard Rademacher, Zhiqiang Que, Wayne Luk, Philip H. W. Leong,
- Abstract要約: この研究は、フィールドプログラマブルゲートアレイ(FPGA)とグラフィックス処理ユニット(GPU)におけるディープニューラルネットワーク(DNN)ベースの量子ビット検出のレイテンシをベンチマークする。
FPGAソリューションは、電子多重化チャージ結合デバイス(EMCCD)とその後のデータ処理ロジックを直接インターフェースし、バッファリングとインターフェースのオーバーヘッドをなくす。
ハードウェアにマルチレイヤパーセプトロン(MLP)モデルとビジョントランスフォーマー(ViT)モデルを配置し,測定性能を評価する。
- 参考スコア(独自算出の注目度): 5.983860563083656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate and low-latency qubit state measurement is critical for trapped-ion quantum computing. While deep neural networks (DNNs) have been integrated to enhance detection fidelity, their latency performance on specific hardware platforms remains underexplored. This work benchmarks the latency of DNN-based qubit detection on field-programmable gate arrays (FPGAs) and graphics processing units (GPUs). The FPGA solution directly interfaces an electron-multiplying charge-coupled device (EMCCD) with the subsequent data processing logic, eliminating buffering and interface overheads. As a baseline, the GPU-based system employs a high-speed PCIe image grabber for image input and I/O card for state output. We deploy Multilayer Perceptron (MLP) and Vision Transformer (ViT) models on hardware to evaluate measurement performance. Compared to conventional thresholding, DNNs reduce the mean measurement fidelity (MMF) error by factors of 1.8-2.5x (one-qubit case) and 4.2-7.6x (three-qubit case). FPGA-based MLP and ViT achieve nanosecond- and microsecond-scale inference latencies, while the complete single-shot measurement process achieves over 100x speedup compared to the GPU implementation. Additionally, clock-cycle-level signal analysis reveals inefficiencies in EMCCD data transmission via Cameralink, suggesting that optimizing this interface could further leverage the advantages of ultra-low-latency DNN inference, guiding the development of next-generation qubit detection systems.
- Abstract(参考訳): トラップイオン量子コンピューティングでは、正確な量子ビット状態測定と低レイテンシ状態測定が重要である。
ディープニューラルネットワーク(DNN)は検出忠実度を高めるために統合されているが、特定のハードウェアプラットフォーム上でのレイテンシパフォーマンスはいまだ検討されていない。
この研究は、フィールドプログラマブルゲートアレイ(FPGA)とグラフィックス処理ユニット(GPU)におけるDNNベースの量子ビット検出のレイテンシをベンチマークする。
FPGAソリューションは、電子多重化チャージ結合デバイス(EMCCD)とその後のデータ処理ロジックを直接インターフェースし、バッファリングとインターフェースのオーバーヘッドをなくす。
ベースラインとして、GPUベースのシステムは、画像入力に高速PCIeイメージグラバ、状態出力にI/Oカードを使用する。
ハードウェアにマルチレイヤパーセプトロン(MLP)モデルとビジョントランスフォーマー(ViT)モデルを配置し,測定性能を評価する。
従来のしきい値と比較すると、DNNは平均測定忠実度(MMF)の誤差を1.8-2.5x(1量子の場合)と4.2-7.6x(3量子の場合)で減少させる。
FPGAベースのMLPとViTはナノ秒およびマイクロ秒スケールの推論レイテンシを実現し、完全な単ショット計測プロセスはGPU実装と比較して100倍以上のスピードアップを達成する。
さらに、クロックサイクルレベルの信号解析により、CameralinkによるEMCCDデータ伝送の非効率性が明らかとなり、このインタフェースを最適化することで、超低遅延DNN推論の利点をさらに活用し、次世代の量子ビット検出システムの開発を導くことが示唆された。
関連論文リスト
- Towards On-Device Learning and Reconfigurable Hardware Implementation for Encoded Single-Photon Signal Processing [0.0]
ワンシッド・ジャコビ回転型オンラインシーケンス・エクストリーム・ラーニング・マシン(OSOS-ELM)に基づくオンライン・トレーニング・アルゴリズムを提案する。
我々は、ARMコアを統合した異種FPGA上でOSOS-ELMを実行する際の並列性を完全に活用する。
単一光子信号解析を含む3つのケーススタディにより,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2025-04-12T00:58:52Z) - Enhancing Dropout-based Bayesian Neural Networks with Multi-Exit on FPGA [20.629635991749808]
本稿では,フィールドプログラマブルゲートアレイ(FPGA)ベースのアクセラレータを効率よく生成するアルゴリズムとハードウェアの共同設計フレームワークを提案する。
アルゴリズムレベルでは、計算とメモリのオーバーヘッドを低減した、新しいマルチエグジット・ドロップアウトベースのベイズNNを提案する。
ハードウェアレベルでは,提案する効率的なベイズNNのためのFPGAベースのアクセラレータを生成するための変換フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-20T17:08:42Z) - Embedded Graph Convolutional Networks for Real-Time Event Data Processing on SoC FPGAs [0.815557531820863]
我々は、PointNetConv用に最適化されたハードウェアを意識した一連の最適化を設計したEFGCN(Event-based FPGA-accelerated Graph Convolutional Network)を紹介する。
提案手法は,AEGNN (Asynchronous Event-based GNN) と比較して,モデルサイズを最大100倍に削減する。
提案手法は,高度にスケーラブルでカスタマイズ可能なリソース効率を維持しつつ,複数のイベントベース分類ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-06-11T14:47:36Z) - Signal Detection in MIMO Systems with Hardware Imperfections: Message
Passing on Neural Networks [101.59367762974371]
本稿では,Multi-Input-multiple-output (MIMO)通信システムにおける信号検出について検討する。
パイロット信号が限られているディープニューラルネットワーク(DNN)のトレーニングは困難であり、実用化を妨げている。
我々は、ユニタリ近似メッセージパッシング(UAMP)アルゴリズムを利用して、効率的なメッセージパッシングに基づくベイズ信号検出器を設計する。
論文 参考訳(メタデータ) (2022-10-08T04:32:58Z) - LL-GNN: Low Latency Graph Neural Networks on FPGAs for High Energy
Physics [45.666822327616046]
本研究は,粒子検出器のための低グラフニューラルネットワーク(LL-GNN)設計のための新しい再構成可能なアーキテクチャを提案する。
LL-GNNの設計は、洗練されたアルゴリズムが実験データを効率的に処理できるようにすることで、次世代のトリガーシステムを進化させる。
論文 参考訳(メタデータ) (2022-09-28T12:55:35Z) - MAPLE-X: Latency Prediction with Explicit Microprocessor Prior Knowledge [87.41163540910854]
ディープニューラルネットワーク(DNN)レイテンシのキャラクタリゼーションは、時間を要するプロセスである。
ハードウェアデバイスの事前知識とDNNアーキテクチャのレイテンシを具体化し,MAPLEを拡張したMAPLE-Xを提案する。
論文 参考訳(メタデータ) (2022-05-25T11:08:20Z) - Two-Timescale End-to-End Learning for Channel Acquisition and Hybrid
Precoding [94.40747235081466]
本研究では,ミリ波(mmWave)大規模マルチインプット多重出力(MIMO)システムのためのエンドツーエンドの深層学習に基づくジョイントトランスシーバ設計アルゴリズムを提案する。
我々は受信したパイロットを受信機でフィードバックビットにマッピングし、さらに送信機でハイブリッドプリコーダにフィードバックビットをマッピングするDNNアーキテクチャを開発した。
論文 参考訳(メタデータ) (2021-10-22T20:49:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。