論文の概要: ATHENA: A Compiler For Optimized Scheduling In Distributed Quantum Computers
- arxiv url: http://arxiv.org/abs/2605.21795v1
- Date: Wed, 20 May 2026 22:43:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.014596
- Title: ATHENA: A Compiler For Optimized Scheduling In Distributed Quantum Computers
- Title(参考訳): AtheNA:分散量子コンピュータにおける最適化スケジューリング用コンパイラ
- Authors: Won Joon Yun, Dhilan Nag, Sneha Ballabh, Jiapeng Zhao, Eneet Kaur, Poulami Das,
- Abstract要約: 分散量子コンピュータ(DQC)は、より小さなチップをフォトニック配線を介して接続することで、大規模なシステムサイズを実現する。
DQCはテレポーテーションを使用してキュービットをリロケーションし、異なるチップ上でキュービット間でCNOTを実行する。
非ローカルなCNOTは、チップ内のローカルなCNOTよりも遅い4.3-7.7$times$lowと4$times$ more error-proneである。
既存のコンパイラ群CNOTは、重なり合うキュービットをブロックにグループ化し、各ブロックのテレポーテーションをまとめて最適化する。
- 参考スコア(独自算出の注目度): 5.538394808661997
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Distributed Quantum Computers (DQCs) enable large system sizes by connecting smaller chips via photonic interconnects. DQCs use teleportation to relocate qubits and execute CNOTs between qubits on different chips. However, non-local CNOTs are 4.3-7.7$\times$ slower and 4$\times$ more error-prone than local CNOTs within a chip, which degrades program fidelities. Existing compilers group CNOTs with overlapping qubits into blocks and collectively optimize teleportations for each block. However, block-level scheduling has two key drawbacks. First, it lacks lookahead ability across blocks because it selects the optimal schedule for one block before proceeding to the next. As a result, it cannot assess the impact of a teleportation on future blocks. Our studies show that naively expanding the lookahead window to include subsequent blocks does not address this issue. Second, existing approaches do not schedule future block operations or the teleportations they require until preceding blocks are fully scheduled, introducing delay and latency overheads. We propose ATHENA, a DQC compiler that addresses these limitations using two key insights: Utility-driven Lookahead with Multi-Candidate Block Scheduling (UMS) and EPR-Capacity-Aware Early Scheduling (EES). UMS schedules a block by considering only useful future blocks in its lookahead window. A future block has utility if it shares overlapping qubits with the current block being scheduled. UMS also maintains multiple schedules during compilation, allowing it to defer commitment to globally sub-optimal schedules early in the compilation process. EES enables ATHENA to schedule future operations and their relocations early when EPR resources are available. Our evaluations show that ATHENA reduces teleportations by 34% on average and up to 65%, and reduces latency by 2$\times$ on average and up to 2.9$\times$ compared to the state-of-the-art.
- Abstract(参考訳): 分散量子コンピュータ(DQC)は、より小さなチップをフォトニック配線を介して接続することで、大規模なシステムサイズを実現する。
DQCはテレポーテーションを使用してキュービットをリロケーションし、異なるチップ上でキュービット間でCNOTを実行する。
しかし、非ローカル CNOT は 4.3-7.7$\times$ slow と 4$\times$ であり、チップ内のローカル CNOT よりもエラーを起こしやすい。
既存のコンパイラ群CNOTは、重なり合うキュービットをブロックにグループ化し、各ブロックのテレポーテーションをまとめて最適化する。
しかし、ブロックレベルのスケジューリングには2つの欠点がある。
まず、次のブロックに進む前に、1ブロックに対して最適なスケジュールを選択するため、ブロック間でのルックアヘッド能力が欠けている。
その結果、将来のブロックに対するテレポーテーションの影響を評価できない。
本研究は,後続のブロックを含むルックアヘッドウインドウの拡張は,この問題に対処するものではないことを示す。
第二に、既存のアプローチでは、先述のブロックが完全にスケジュールされるまで、将来のブロック操作やテレポーテーションをスケジュールせず、遅延と遅延のオーバーヘッドを発生させる。
本稿では,これらの制約に対処するDQCコンパイラであるATHENAを提案する。
UMSは、ルックアヘッドウィンドウで有用な将来のブロックのみを考慮することで、ブロックをスケジュールする。
将来のブロックは、現在のブロックがスケジュールされているときに重複するキュービットを共有する場合、ユーティリティを持つ。
UMSはまた、コンパイル中に複数のスケジュールを維持しており、コンパイルプロセスの早い段階でグローバルなサブ最適スケジュールへのコミットメントを延期することができる。
EESは、EPRリソースが利用可能になったら、ATHENAが将来のオペレーションとそれらの移動を早期にスケジュールできる。
評価の結果,AtheNAは平均で34%,最大で65%,平均で2$\times$,最先端と比較して2.9$\times$に短縮した。
関連論文リスト
- Boundary-Aware Stabilizer Scheduling for Distributed Quantum Error Correction [1.556083770714207]
色符号のようなトポロジカルな量子誤差補正では、パリティチェックはベル対を用いた遠隔CNOT操作を必要とする。
このオーバーヘッドを減らすための自然な方法は、いくつかのシーム測定をスキップすることです。
我々は,標準のシンドローム抽出回路に直接統合するスケジューリングモジュールを開発した。
論文 参考訳(メタデータ) (2026-04-24T11:49:07Z) - FlowPrefill: Decoupling Preemption from Prefill Scheduling Granularity to Mitigate Head-of-Line Blocking in LLM Serving [13.856291757420012]
長期にわたる要求はリソースを独占し、より高いプライオリティの要求を遅らせ、TTFT(Time-to-first-token)サービスレベルの違反を広範囲に発生させる。
本稿では,TTFTに最適化されたサービスシステムであるFlowPrefillを提案する。
FlowPrefillは最先端システムと比較して最大出力を最大5.6$times$に改善することを示す。
論文 参考訳(メタデータ) (2026-02-18T16:57:45Z) - Time Is All It Takes: Spike-Retiming Attacks on Event-Driven Spiking Neural Networks [87.16809558673403]
スパイキングニューラルネットワーク(SNN)は離散スパイクで計算し、時間構造を利用する。
イベント駆動SNNにおけるスパイク数と振幅を保存しながら、既存のスパイクを繰り返すタイミングのみの敵について検討する。
論文 参考訳(メタデータ) (2026-02-03T09:06:53Z) - PreScope: Unleashing the Power of Prefetching for Resource-Constrained MoE Inference [10.859168542656612]
メモリへの専門家の重み付けは、計算を数倍超えるPCIe転送遅延をもたらす。
予測駆動型エキスパートスケジューリングシステムPreScopeについて述べる。
PreScopeは141%のスループットと74.6%のレイテンシを実現している。
論文 参考訳(メタデータ) (2025-09-28T04:35:12Z) - Priority-Aware Preemptive Scheduling for Mixed-Priority Workloads in MoE Inference [4.7730970530715835]
大規模言語モデルは自然言語処理に革命をもたらしたが、データセンターで効率的に処理するのは難しい。
我々は、Mixture of Experts(MoE)モデル用に設計された新しい推論システムQLLMを紹介する。
QLLMはエキスパートレベルのプリエンプションを可能にし、LS Time-to-First-Token(TTFT)を最小化しながらBEジョブの実行を遅延させる。
論文 参考訳(メタデータ) (2025-03-12T11:56:01Z) - Zaptos: Towards Optimal Blockchain Latency [52.30047458198369]
Zaptosは、エンドツーエンドのレイテンシを最小限に抑えるために設計された並列パイプラインアーキテクチャである。
Zaptosは秒単位のレイテンシで毎秒20,000トランザクションのスループットを実現している。
論文 参考訳(メタデータ) (2025-01-18T00:22:22Z) - A Shuttle-Efficient Qubit Mapper for Trapped-Ion Quantum Computers [4.903455321543022]
本稿では,量子コンピュータプログラムの奥行きと多数の量子ビットを持つ新しいポリシーを提案する。
我々の方針はプログラム適応であり、プログラムの初期段階で発生したゲートを遅発するゲートよりも優先順位付けする。
本手法は,120個のランダム回路に対して,9%のシャトル/プログラムを(最高で21.3%)削減する。
論文 参考訳(メタデータ) (2022-04-07T18:57:57Z) - 1$\times$N Block Pattern for Network Sparsity [90.43191747596491]
我々は,この制限を破るために,ブロック間隔パターン(ブロックプルーニング)を1時間で定義する新しい概念を提案する。
このパターンはMobileNet-V2の上位1の精度でフィルタプルーニングよりも約3.0%改善されている。
また、重み付けによるCortex-A7 CPUの56.04msの推論も得る。
論文 参考訳(メタデータ) (2021-05-31T05:50:33Z) - Time-Sliced Quantum Circuit Partitioning for Modular Architectures [67.85032071273537]
現在の量子コンピュータの設計はスケールしない。
小さなプロトタイプを超えてスケールするために、量子アーキテクチャーは、密に連結された量子ビットとクラスタ間のスパーサ接続のクラスタによるモジュラーアプローチを採用する可能性が高い。
このクラスタリングと静的に知られた量子プログラムの制御フローを利用して、量子回路を一度に一度にモジュラ物理マシンにマップするトラクタブルパーティショニングを生成する。
論文 参考訳(メタデータ) (2020-05-25T17:58:44Z) - Straggler-aware Distributed Learning: Communication Computation Latency
Trade-off [56.08535873173518]
ストラグワーカーは冗長な計算を割り当て、データと計算をまたいでコーディングすることで許容できる。
既存のほとんどのスキームでは、各非ストラグリングワーカーは、全ての計算を完了した後、1イテレーションごとに1つのメッセージをパラメータサーバ(PS)に送信する。
このような制限を課すことで、ストレグリング動作の不正確な予測による過剰計算と、ストレグラー/非ストレグラーとしての作業員の処理による未使用の2つの主な欠点が生じる。
論文 参考訳(メタデータ) (2020-04-10T08:39:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。