論文の概要: Hardware Co-Designed Optimal Control for Programmable Atomic Quantum Processors via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2504.11737v1
- Date: Wed, 16 Apr 2025 03:30:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-17 14:39:13.841758
- Title: Hardware Co-Designed Optimal Control for Programmable Atomic Quantum Processors via Reinforcement Learning
- Title(参考訳): 強化学習によるプログラム可能な原子量子プロセッサのハードウェア共設計最適制御
- Authors: Qian Ding, Dirk Englund,
- Abstract要約: 本稿では,古典的制御ハードウェアに固有の欠陥に対処する,ハードウェア共同設計の量子制御フレームワークを提案する。
提案手法により,高忠実かつ並列な単一ビットゲート操作が可能となることを示す。
システム複雑性が増加するにつれてPPO性能は低下するが、エンドツーエンドの微分可能なRLは99.9$%以上のゲート忠実度を一貫して達成する。
- 参考スコア(独自算出の注目度): 0.18416014644193068
- License:
- Abstract: Developing scalable, fault-tolerant atomic quantum processors requires precise control over large arrays of optical beams. This remains a major challenge due to inherent imperfections in classical control hardware, such as inter-channel crosstalk and beam leakage. In this work, we introduce a hardware co-designed intelligent quantum control framework to address these limitations. We construct a mathematical model of the photonic control hardware, integrate it into the quantum optimal control (QOC) framework, and apply reinforcement learning (RL) techniques to discover optimal control strategies. We demonstrate that the proposed framework enables robust, high-fidelity parallel single-qubit gate operations under realistic control conditions, where each atom is individually addressed by an optical beam. Specifically, we implement and benchmark three optimization strategies: a classical hybrid Self-Adaptive Differential Evolution-Adam (SADE-Adam) optimizer, a conventional RL approach based on Proximal Policy Optimization (PPO), and a novel end-to-end differentiable RL method. Using SADE-Adam as a baseline, we find that while PPO performance degrades as system complexity increases, the end-to-end differentiable RL consistently achieves gate fidelities above 99.9$\%$, exhibits faster convergence, and maintains robustness under varied channel crosstalk strength and randomized dynamic control imperfections.
- Abstract(参考訳): スケーラブルでフォールトトレラントな原子量子プロセッサを開発するには、大量の光ビームを正確に制御する必要がある。
これは、チャンネル間クロストークやビームリークのような古典的な制御ハードウェアに固有の欠陥があるため、依然として大きな課題である。
本研究では,これらの制約に対処するハードウェア共同設計のインテリジェント量子制御フレームワークを提案する。
フォトニック制御ハードウェアの数学的モデルを構築し、量子最適制御(QOC)フレームワークに統合し、最適制御戦略を発見するために強化学習(RL)技術を適用する。
提案フレームワークは,光ビームによって各原子を個別に処理する現実的な制御条件下で,高忠実かつ並列な単一ビットゲート操作を実現する。
具体的には、古典的ハイブリッド型自己適応微分進化アダム(SADE-Adam)最適化器、PPOに基づく従来のRLアプローチ、新しいエンドツーエンド微分可能RL手法の3つの最適化戦略を実装し、ベンチマークする。
SADE-Adam をベースラインとして,PPO 性能はシステム複雑性が増大するにつれて低下するが,終端微分可能 RL は 99.9$\%$ 以上のゲート忠実度を一貫して達成し,より高速な収束を示し,チャネルクロストーク強度とランダム化された動的制御不完全性の下で頑健性を維持する。
関連論文リスト
- Reinforcement Learning for Quantum Control under Physical Constraints [2.874893537471256]
可能な解の空間を制限する物理インフォームド強化学習アルゴリズムを考案する。
提案手法は, 広義に関係した3つの量子系上で評価する。
論文 参考訳(メタデータ) (2025-01-24T10:11:32Z) - Enhancing Spectrum Efficiency in 6G Satellite Networks: A GAIL-Powered Policy Learning via Asynchronous Federated Inverse Reinforcement Learning [67.95280175998792]
ビームフォーミング,スペクトルアロケーション,リモートユーザ機器(RUE)アソシエイトを最適化するために,GAILを利用した新しいポリシー学習手法を提案する。
手動チューニングなしで報酬関数を自動的に学習するために、逆RL(IRL)を用いる。
提案手法は従来のRL手法よりも優れており,コンバージェンスと報酬値の14.6%の改善が達成されている。
論文 参考訳(メタデータ) (2024-09-27T13:05:02Z) - Controlling nonergodicity in quantum many-body systems by reinforcement learning [0.0]
量子非エルゴディティ制御のためのモデルフリー・ディープ強化学習フレームワークを開発した。
我々は, DRLエージェントが量子多体系を効率的に学習できることを実証するために, パラダイム的一次元傾斜Fermi-Hubbardシステムを用いた。
連続制御プロトコルと観測は実験的に実現可能である。
論文 参考訳(メタデータ) (2024-08-21T20:55:44Z) - Machine-learning-inspired quantum optimal control of nonadiabatic
geometric quantum computation via reverse engineering [3.3216171033358077]
制御パラメータを最適化するために,平均忠実度に基づく機械学習に基づく有望な手法を提案する。
逆工学による一量子ゲートをキャット状態の非断熱的幾何量子計算により実装する。
ニューラルネットワークがモデル空間を拡張する能力を持っていることを実証する。
論文 参考訳(メタデータ) (2023-09-28T14:36:26Z) - Optimizing quantum gates towards the scale of logical qubits [78.55133994211627]
量子ゲート理論の基本的な前提は、量子ゲートはフォールトトレランスの誤差閾値を超えることなく、大きなプロセッサにスケールできるということである。
ここでは、このような問題を克服できる戦略について報告する。
我々は、68個の周波数可変ビットの周波数軌跡をコレオグラフィーして、超伝導エラー中に単一量子ビットを実行することを示した。
論文 参考訳(メタデータ) (2023-08-04T13:39:46Z) - Quantum Gate Optimization for Rydberg Architectures in the Weak-Coupling
Limit [55.05109484230879]
我々は,Rydberg tweezerシステムにおける2ビットゲートの機械学習支援設計を実演する。
我々は,高忠実度CNOTゲートを実装した最適パルス列を生成する。
単一量子ビット演算の局所的な制御は、原子列上で量子計算を行うのに十分であることを示す。
論文 参考訳(メタデータ) (2023-06-14T18:24:51Z) - Optimal solutions to quantum annealing using two independent control
functions [0.0]
最適解は、進化時間全体の上界で調整された両制御からなることを示す。
本稿では,制御の振幅を制限するために最適化された量子最適制御手法を提案する。
2つの制御関数を持つスキームは、同じ進化時間における他のスキームよりも忠実であることを示す。
論文 参考訳(メタデータ) (2021-10-26T16:54:17Z) - Noise-Robust End-to-End Quantum Control using Deep Autoregressive Policy
Networks [2.5946789143276447]
変分量子固有解法は、量子コンピューティングデバイスの使用を可能にするため、近年注目を集めている。
不確実性のある方法で連続的および離散的な自由度を同時に最適化できるハイブリッドポリシグラデーショングラデーションアルゴリズムを提案する。
我々の研究は、強化学習と量子制御の相乗効果を示す。
論文 参考訳(メタデータ) (2020-12-12T02:13:28Z) - Adaptive pruning-based optimization of parameterized quantum circuits [62.997667081978825]
Variisyハイブリッド量子古典アルゴリズムは、ノイズ中間量子デバイスの使用を最大化する強力なツールである。
我々は、変分量子アルゴリズムで使用されるそのようなアンサーゼを「効率的な回路訓練」(PECT)と呼ぶ戦略を提案する。
すべてのアンサッツパラメータを一度に最適化する代わりに、PECTは一連の変分アルゴリズムを起動する。
論文 参考訳(メタデータ) (2020-10-01T18:14:11Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z) - Guided Constrained Policy Optimization for Dynamic Quadrupedal Robot
Locomotion [78.46388769788405]
我々は,制約付きポリシー最適化(CPPO)の実装に基づくRLフレームワークであるGCPOを紹介する。
誘導制約付きRLは所望の最適値に近い高速収束を実現し,正確な報酬関数チューニングを必要とせず,最適かつ物理的に実現可能なロボット制御動作を実現することを示す。
論文 参考訳(メタデータ) (2020-02-22T10:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。