論文の概要: Toward designing workload-aware Surface Code Architectures
- arxiv url: http://arxiv.org/abs/2604.19855v2
- Date: Thu, 23 Apr 2026 12:31:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.035299
- Title: Toward designing workload-aware Surface Code Architectures
- Title(参考訳): ワークロード対応のSurface Codeアーキテクチャの設計に向けて
- Authors: Archisman Ghosh, Avimita Chatterjee, Swaroop Ghosh,
- Abstract要約: FTQCの設計は一般に、大きな量子ビットオーバーヘッドのコストで高速な論理量子アクセシビリティ、ワークロード遅延のコストで高い論理量子密度のどちらかを強調している。
本研究では,各データキュービットに対してほぼ均一なアンシラアクセスを実現するアンシラ中心領域に,表面コードパッチを配置することで,これらの競合する目標のバランスをとるアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.5352699766206807
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Practical quantum advantage is expected to depend on fault-tolerant quantum computing, although the architectural overhead needed to support fault tolerance is still extremely high. Prior FTQC designs generally emphasize either fast logical-qubit accessibility at the cost of significant qubit overhead, or high logical-qubit density at the cost of added workload latency. We propose an architecture that balances these competing objectives by placing surface-code patches around an ancilla-centric region, which yields nearly uniform ancilla access for all data qubits. Building on this design, we introduce a new workload-driven placement method that uses the $T$-gate profile of an application to determine an effective floorplan. We further provide a reconfigurable optimization for reducing the latency of $Y$-gate measurements on a per-workload basis. To improve flexibility, we also study concurrent execution of multiple programs on the same architecture. Numerical evaluation indicates that our approach keeps cycles per instruction near the optimal regime while reducing the number of required data tiles by up to $\sim21\%$, and achieves up to $\sim90\%$ efficiency when running 10 programs concurrently.
- Abstract(参考訳): 現実的な量子優位性は、フォールトトレラントな量子コンピューティングに依存することが期待されているが、フォールトトレランスをサポートするのに必要なアーキテクチャ上のオーバーヘッドは依然として極めて高い。
以前のFTQC設計では、大きな量子ビットオーバーヘッドのコストで高速な論理量子アクセシビリティ、ワークロード遅延のコストで高い論理量子密度が強調されていた。
本研究では,各データキュービットに対してほぼ均一なアンシラアクセスを実現するアンシラ中心領域に,表面コードパッチを配置することで,これらの競合する目標のバランスをとるアーキテクチャを提案する。
この設計に基づいて、アプリケーションの$T$-gateプロファイルを使用して効果的なフロアプランを決定する新しいワークロード駆動配置手法を提案する。
さらに、ワークロード毎の$Y$-gate測定のレイテンシを低減するために、再構成可能な最適化も提供します。
柔軟性を向上させるため、同じアーキテクチャ上で複数のプログラムの同時実行についても検討する。
数値評価により,提案手法は命令毎のサイクルを最適条件付近で維持し,必要なデータタイルの数を最大$\sim21\%$に削減し,同時に10プログラムを実行する場合の効率を最大$\sim90\%$に向上することを示す。
関連論文リスト
- Architecting Early Fault Tolerant Neutral Atoms Systems with Quantum Advantage [3.470681946214809]
我々は、論理演算を並列化するために中性原子の再構成可能な接続を利用するテレポーテーションに基づくスキームを導入する。
提案手法は,余分な空間コストで抽出器アーキテクチャの3倍の高速化を実現する。
私たちのスピードアップは依然として適用され、成功確率とともに正確な時空コストが報告されます。
論文 参考訳(メタデータ) (2026-04-21T17:57:43Z) - Beyond Test-Time Training: Learning to Reason via Hardware-Efficient Optimal Control [86.63490309209378]
我々は、最適制御として推論を定式化し、推論時に潜在状態に対して有限水平LQR計画を行うテスト時間制御層を導入する。
アーキテクチャ層として最適制御を組み込むことは、テスト時間トレーニングを超えた推論のための効果的でスケーラブルなメカニズムを提供することを実証する。
論文 参考訳(メタデータ) (2026-03-10T05:42:13Z) - RASCqL: Reaction-time-limited Architecture for Space-time-efficient Complex qLDPC Logic [0.39768138694503036]
RASCqLは、時空効率のqLDPC論理のための応答時間制限アーキテクチャである。
量子算術、テーブルルックアップ、マジックステート蒸留などのアルゴリズムのサブルーチンをqLDPCコードで直接サポートする。
RASCqLは、最先端のサーフェスコードアーキテクチャに匹敵する、時空のコストで重要なアルゴリズムのサブルーチンを実装している。
論文 参考訳(メタデータ) (2026-02-15T18:52:25Z) - The Fast for the Curious: How to accelerate fault-tolerant quantum applications [101.46859364118622]
我々は、フォールトトレラント量子計算の実行時間を削減するための戦略を評価する。
ハードウェア,フォールトトレランス,アルゴリズム的サブルーチンの共設計が実行時間を短縮する方法について論じる。
論文 参考訳(メタデータ) (2025-10-30T02:27:55Z) - Tableau-Based Framework for Efficient Logical Quantum Compilation [15.58811254216672]
フォールトトレラント量子コンピューティング(FTQC)は、量子アルゴリズムの信頼性の高い実行を可能にする。
FTQCアーキテクチャは必要となる物理量子ビットの数を最小化し、他のアーキテクチャと比べて半分以上節約する。
追加の物理量子ビットを必要とせずにFTQCランタイムのオーバーヘッドを最小限に抑えるフレームワークであるTQCを提案する。
論文 参考訳(メタデータ) (2025-09-02T18:18:46Z) - Dynamic Speculative Agent Planning [57.630218933994534]
大規模な言語モデルベースのエージェントは、遅延の禁止と推論コストのために、重要なデプロイメント課題に直面している。
本稿では,オンライン強化学習フレームワークである動的投機計画(Dynamic Speculative Planning, DSP)を紹介する。
2つの標準エージェントベンチマークの実験では、DSPは高速加速法に匹敵する効率を達成し、総コストを30%削減し、不要コストを60%まで削減している。
論文 参考訳(メタデータ) (2025-09-02T03:34:36Z) - End-to-End On-Device Quantization-Aware Training for LLMs at Inference Cost [53.25965863436039]
量子化対応トレーニング(QAT)は、より原則化されたソリューションを提供するが、バックプロパゲーションに依存しているため、メモリコストは禁じられている。
重み付けとアクティベーション量子化の両方をサポートするゼロオーダー最適化ベースのQATフレームワークであるZeroQATを提案する。
実験の結果、ZeroQATはPTQとQATのベースラインを一貫して上回り、メモリは大幅に削減された。
論文 参考訳(メタデータ) (2025-08-21T01:18:27Z) - D$^{2}$MoE: Dual Routing and Dynamic Scheduling for Efficient On-Device MoE-based LLM Serving [14.607254882119507]
専門家(MoE)モデルの組み合わせは、大きな言語モデル(LLM)のスパース変種である。
メリットはあるものの、リソース制約のあるエッジデバイスにデプロイするにはMoEは高価すぎる。
D$2$MoEは,各専門家に最適なビット幅を動的に割り当てることで,多様なタスク要求に適合するアルゴリズム・システム協調設計フレームワークである。
論文 参考訳(メタデータ) (2025-04-17T05:37:35Z) - Optimizing Multi-level Magic State Factories for Fault-Tolerant Quantum Architectures [0.8453577061453568]
専用ゾーンをマルチレベルマジックステートファクトリと,効率的な論理演算のためのコアプロセッサとして考える。
物理量子資源推定は、少数の鍵パラメータを含む単純なモデルに還元されることを示す。
論文 参考訳(メタデータ) (2024-11-06T21:25:34Z) - Data-Driven Offline Optimization For Architecting Hardware Accelerators [89.68870139177785]
PRIMEと呼ばれるハードウェアアクセラレータを設計するための,データ駆動型オフライン最適化手法を開発した。
PRIMEは、最先端のシミュレーション駆動方式の性能を約1.54倍と1.20倍に改善し、必要な総シミュレーション時間をそれぞれ93%と99%削減する。
さらにPRIMEは、ゼロショット設定で見えないアプリケーションのための効果的なアクセラレーターを設計し、シミュレーションベースの手法を1.26倍に向上させた。
論文 参考訳(メタデータ) (2021-10-20T17:06:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。