論文の概要: Reinforcement Learning for Parameterized Quantum State Preparation: A Comparative Study
- arxiv url: http://arxiv.org/abs/2602.16523v1
- Date: Wed, 18 Feb 2026 15:10:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.627695
- Title: Reinforcement Learning for Parameterized Quantum State Preparation: A Comparative Study
- Title(参考訳): 量子状態のパラメータ化のための強化学習:比較研究
- Authors: Gerhard Stenzel, Isabella Debelic, Michael Kölle, Tobias Rohe, Leo Sünkel, Julian Hager, Claudia Linnhoff-Popien,
- Abstract要約: 我々は、純離散ゲート選択からパラメータ化量子状態準備への強化学習により、指向性量子回路合成(DQCS)を拡張した。
ゲートタイプと影響を受けるキュービット(s)と回転角を協調的に選択する一段エージェントとを比較した。
本稿では,2から10キュービットのシステム上でのPPO(Proximal Policy Optimization)とAdvantage Actor--Critic(Advantage Actor--Critic)を評価する。
- 参考スコア(独自算出の注目度): 2.4542351340244264
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We extend directed quantum circuit synthesis (DQCS) with reinforcement learning from purely discrete gate selection to parameterized quantum state preparation with continuous single-qubit rotations \(R_x\), \(R_y\), and \(R_z\). We compare two training regimes: a one-stage agent that jointly selects the gate type, the affected qubit(s), and the rotation angle; and a two-stage variant that first proposes a discrete circuit and subsequently optimizes the rotation angles with Adam using parameter-shift gradients. Using Gymnasium and PennyLane, we evaluate Proximal Policy Optimization (PPO) and Advantage Actor--Critic (A2C) on systems comprising two to ten qubits and on targets of increasing complexity with \(λ\) ranging from one to five. Whereas A2C does not learn effective policies in this setting, PPO succeeds under stable hyperparameters (one-stage: learning rate approximately \(5\times10^{-4}\) with a self-fidelity-error threshold of 0.01; two-stage: learning rate approximately \(10^{-4}\)). Both approaches reliably reconstruct computational basis states (between 83\% and 99\% success) and Bell states (between 61\% and 77\% success). However, scalability saturates for \(λ\) of approximately three to four and does not extend to ten-qubit targets even at \(λ=2\). The two-stage method offers only marginal accuracy gains while requiring around three times the runtime. For practicality under a fixed compute budget, we therefore recommend the one-stage PPO policy, provide explicit synthesized circuits, and contrast with a classical variational baseline to outline avenues for improved scalability.
- Abstract(参考訳): 我々は、純離散ゲート選択からパラメータ化量子状態準備への強化学習を連続した単一量子ビット回転 \(R_x\), \(R_y\), \(R_z\) で拡張した。
ゲートタイプ, 影響を受けるキュービット(s) と回転角を共に選択する一段エージェントと、まず離散回路を提案し、その後パラメータシフト勾配を用いてアダムと回転角を最適化する二段変種とを比較した。
Gymnasium と PennyLane を用いて、2 から 10 の量子ビットからなるシステムと 1 から 5 までの \(λ\) で複雑性が増大するターゲットに基づいて、PPO とアドバンテージ・アクター・クリティカル (A2C) を評価した。
A2Cはこの設定で効果的な政策を学ばないが、PPOは安定なハイパーパラメータ(1段階:学習率約10^{-4}\)で成功し、自己忠実度エラー閾値は0.01、二段階:学習率約10^{-4}\)である。
どちらのアプローチも、計算基底状態(83 %と99 %の成功)とベル状態(61 %と77 %の成功)を確実に再構築する。
しかし、スケーラビリティはおよそ 3 から 4 の \(λ\) に対して飽和し、 \(λ=2\) においても 10 キュービットの目標に拡張しない。
2段階の手法では、ランタイムの約3倍の精度しか得られない。
固定された計算予算の下では,一段階のPPOポリシーを推奨し,明示的な合成回路を提供し,拡張性を向上させるための古典的変動ベースラインと対比する。
関連論文リスト
- Closing the Approximation Gap of Partial AUC Optimization: A Tale of Two Formulations [121.39938773554523]
ROC曲線の下の領域(AUC)は、クラス不均衡と決定制約の両方を持つ実世界のシナリオにおける重要な評価指標である。
PAUC最適化の近似ギャップを埋めるために,2つの簡単なインスタンス単位のミニマックス修正を提案する。
得られたアルゴリズムは、サンプルサイズと典型的な一方方向と双方向のPAUCに対して$O(-2/3)$の収束率の線形パーイテレーション計算複雑性を享受する。
論文 参考訳(メタデータ) (2025-12-01T02:52:33Z) - Quantum Phase Classification of Rydberg Atom Systems Using Resource-Efficient Variational Quantum Circuits and Classical Shadows [0.0]
本稿では,古典的シャドウトモグラフィと変分量子回路を組み合わせた量子機械学習手法を提案する。
量子資源の最小化は高精度位相分類に十分であることを示す。
この研究は、短期量子デバイス上での量子強化凝縮物質物理学の経路を確立する。
論文 参考訳(メタデータ) (2025-10-27T16:25:16Z) - Pauli Network Circuit Synthesis with Reinforcement Learning [0.0]
本稿では,量子回路の再合成のための強化学習法を提案する。
2ビットゲート数と深さで平均20%の改善が観察され、多くのケースで60%に達する。
これらの結果は、現実的で大規模な量子トランスパイレーションワークロードにおいて、回路品質を著しく向上させるRL駆動合成の可能性を強調している。
論文 参考訳(メタデータ) (2025-03-18T17:27:50Z) - ParetoQ: Improving Scaling Laws in Extremely Low-bit LLM Quantization [73.60493264901359]
本稿では,1ビット,1.58ビット,2ビット,3ビット,4ビットの量子化設定に対して厳密な比較を行う統一フレームワークを提案する。
3次、2ビット、3ビット量子化は、サイズと精度のトレードオフにおいて同等のパフォーマンスを維持していることを示す。
ハードウェアの制約を考慮すると、2ビット量子化はメモリの削減とスピードアップに有望な可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-04T18:59:26Z) - Quantum Gate Generation in Two-Level Open Quantum Systems by Coherent
and Incoherent Photons Found with Gradient Search [77.34726150561087]
我々は、非コヒーレント光子によって形成される環境を、非コヒーレント制御によるオープン量子系制御の資源とみなす。
我々は、ハミルトニアンにおけるコヒーレント制御と、時間依存デコヒーレンス率を誘導する散逸器における非コヒーレント制御を利用する。
論文 参考訳(メタデータ) (2023-02-28T07:36:02Z) - Gradient Estimation with Constant Scaling for Hybrid Quantum Machine
Learning [0.0]
機械学習モデルにおけるパラメータ化量子回路(PQC)の勾配を決定する新しい手法を提案する。
PQC層の勾配は、回路パラメータの数に依存しないフォワードパス当たりの回路評価のオーバーヘッドで計算できる。
量子ビットの数が増加するにつれて、パラメータシフト規則と同等の精度で、我々の手法ははるかに高速に収束する。
論文 参考訳(メタデータ) (2022-11-25T09:45:35Z) - Gradient-descent quantum process tomography by learning Kraus operators [63.69764116066747]
離散および連続変数の量子システムに対して量子プロセストモグラフィー(QPT)を行う。
我々は、クラウス作用素を得るために、最適化中にいわゆるスティーフェル多様体に対して制約付き勾配-退化(GD)アプローチを用いる。
GD-QPTは、2量子ランダムプロセスを持つベンチマークにおいて、圧縮センシング(CS)と投影最小二乗QPT(PLS)の両方のパフォーマンスと一致する。
論文 参考訳(メタデータ) (2022-08-01T12:48:48Z) - Unsupervised strategies for identifying optimal parameters in Quantum
Approximate Optimization Algorithm [3.508346077709686]
最適化なしでパラメータを設定するための教師なし機械学習手法について検討する。
繰り返しに使用するQAOAパラメータの数が3ドルに制限された場合、これらをRecursive-QAOAで3ドルまで紹介します。
我々は、アングルを広範囲に最適化し、多数のサーキットコールを省く場合と同じような性能を得る。
論文 参考訳(メタデータ) (2022-02-18T19:55:42Z) - Optimized fermionic SWAP networks with equivalent circuit averaging for
QAOA [2.3362993651992863]
量子近似最適化アルゴリズム(QAOA)のためのフェミオンSWAPネットワークの実行を最適化する。
等価回路平均化(Equivalent Circuit Averaging)を導入し,量子回路コンパイルにおける自由度をランダム化する。
超伝導量子プロセッサ上の4つのトランスモン量子ビット上での深さp = 1のQAOAの誤差(経時変化距離)を平均60%低減する。
論文 参考訳(メタデータ) (2021-11-08T15:32:05Z) - Iterative Refinement in the Continuous Space for Non-Autoregressive
Neural Machine Translation [68.25872110275542]
非自己回帰型機械翻訳のための効率的な推論手法を提案する。
反復的に連続空間で純粋に翻訳を洗練させる。
We evaluate our approach on WMT'14 En-De, WMT'16 Ro-En and IWSLT'16 De-En。
論文 参考訳(メタデータ) (2020-09-15T15:30:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。