論文の概要: Quantum Policy Gradient in Reproducing Kernel Hilbert Space
- arxiv url: http://arxiv.org/abs/2411.06650v1
- Date: Mon, 11 Nov 2024 01:34:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:11:03.958469
- Title: Quantum Policy Gradient in Reproducing Kernel Hilbert Space
- Title(参考訳): カーネルヒルベルト空間再生における量子政策のグラディエント
- Authors: David M. Bossens, Kishor Bharti, Jayne Thompson,
- Abstract要約: パラメトリッド量子回路は、機械学習のための表現力とデータ効率の表現を提供する。
量子カーネルにおける量子回路の表現は量子教師あり学習において広く研究されている。
本稿では、量子環境における量子カーネルポリシーを用いたパラメトリックおよび非パラメトリックポリシー勾配とアクタークリティカルアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 3.8916312075738273
- License:
- Abstract: Parametrised quantum circuits offer expressive and data-efficient representations for machine learning. Due to quantum states residing in a high-dimensional complex Hilbert space, parametrised quantum circuits have a natural interpretation in terms of kernel methods. The representation of quantum circuits in terms of quantum kernels has been studied widely in quantum supervised learning, but has been overlooked in the context of quantum reinforcement learning. This paper proposes parametric and non-parametric policy gradient and actor-critic algorithms with quantum kernel policies in quantum environments. This approach, implemented with both numerical and analytical quantum policy gradient techniques, allows exploiting the many advantages of kernel methods, including available analytic forms for the gradient of the policy and tunable expressiveness. The proposed approach is suitable for vector-valued action spaces and each of the formulations demonstrates a quadratic reduction in query complexity compared to their classical counterparts. Two actor-critic algorithms, one based on stochastic policy gradient and one based on deterministic policy gradient (comparable to the popular DDPG algorithm), demonstrate additional query complexity reductions compared to quantum policy gradient algorithms under favourable conditions.
- Abstract(参考訳): パラメトリッド量子回路は、機械学習のための表現力とデータ効率の表現を提供する。
高次元複素ヒルベルト空間にある量子状態のため、パラメトリッド量子回路は核法の観点から自然な解釈を持つ。
量子カーネルにおける量子回路の表現は量子教師あり学習において広く研究されてきたが、量子強化学習の文脈では見過ごされてきた。
本稿では、量子環境における量子カーネルポリシーを用いたパラメトリックおよび非パラメトリックポリシー勾配とアクタークリティカルアルゴリズムを提案する。
このアプローチは、数値的および解析的量子ポリシー勾配法の両方で実装され、ポリシーの勾配と調整可能な表現性のための分析形式を含む、カーネル手法の多くの利点を利用することができる。
提案手法はベクトル値の作用空間に適しており,各定式化は古典的手法と比較してクエリの複雑性を2次的に減少させることを示す。
確率的ポリシー勾配に基づく2つのアクター批判アルゴリズムと、決定論的ポリシー勾配に基づく1つのアルゴリズム(DDPGアルゴリズムに匹敵する)は、好ましい条件下での量子ポリシー勾配アルゴリズムと比較して、さらなるクエリ複雑性の低減を示す。
関連論文リスト
- Accelerating Quantum Reinforcement Learning with a Quantum Natural Policy Gradient Based Approach [36.05085942729295]
本稿では、古典的なNPG推定器で使用されるランダムサンプリングを決定論的勾配推定手法で置き換える量子自然ポリシー勾配(QNPG)アルゴリズムを提案する。
提案したQNPGアルゴリズムは、量子オラクルへのクエリに対する$tildemathcalO(epsilon-1.5)$のサンプル複雑性を達成し、マルコフ決定プロセス(MDP)へのクエリに対する$tildemathcalO(epsilon-2)$の古典的な下界を大幅に改善する。
論文 参考訳(メタデータ) (2025-01-27T17:38:30Z) - Quantum Natural Stochastic Pairwise Coordinate Descent [6.187270874122921]
近年,変分量子アルゴリズム(VQA)による量子機械学習が注目されている。
本稿では,2QNSCD最適化法を提案する。
ゲート複雑性を持つ量子回路をパラメータ化量子回路と単発量子計測の2倍の精度で用いた,新しい計量テンソルの疎い非バイアス推定器を開発した。
論文 参考訳(メタデータ) (2024-07-18T18:57:29Z) - Parallel Quantum Computing Simulations via Quantum Accelerator Platform Virtualization [44.99833362998488]
本稿では,量子回路実行の並列化モデルを提案する。
このモデルはバックエンドに依存しない機能を利用することができ、任意のターゲットバックエンド上で並列量子回路の実行を可能にする。
論文 参考訳(メタデータ) (2024-06-05T17:16:07Z) - Bias-field digitized counterdiabatic quantum optimization [39.58317527488534]
我々はこのプロトコルをバイアス場デジタルダイアバティック量子最適化(BF-DCQO)と呼ぶ。
私たちの純粋に量子的なアプローチは、古典的な変分量子アルゴリズムへの依存を排除します。
基底状態の成功確率のスケーリング改善を実現し、最大2桁まで増大する。
論文 参考訳(メタデータ) (2024-05-22T18:11:42Z) - Characterizing randomness in parameterized quantum circuits through expressibility and average entanglement [39.58317527488534]
量子回路(PQC)は、その主応用の範囲外ではまだ完全には理解されていない。
我々は、量子ビット接続性に関する制約の下で、PQCにおけるランダム状態の生成を分析する。
生成した状態の分布の均一性の増加と絡み合いの発生との間には,どれだけ急激な関係があるかを示す。
論文 参考訳(メタデータ) (2024-05-03T17:32:55Z) - A quantum information theoretic analysis of reinforcement learning-assisted quantum architecture search [0.0]
本研究では,変分量子状態対角化問題に適したアンサッツ製造のためのRL-QASについて検討した。
我々はこれらの知見を活用して、最適な資源を用いてランダムな量子状態と対角化するために、QASの絡み合った許容アンサッツを考案する。
論文 参考訳(メタデータ) (2024-04-09T09:54:59Z) - Enhancing variational quantum state diagonalization using reinforcement
learning techniques [1.583327010995414]
我々は、量子状態対角化タスクに必要な非常に浅い量子回路を設計する問題に取り組む。
我々は、RL状態に対する新しい符号化法、高密度報酬関数、およびそれを実現するために$epsilon$-greedyポリシーを使用する。
強化学習法により提案される回路は, 標準変分量子状態対角化アルゴリズムよりも浅いことを示す。
論文 参考訳(メタデータ) (2023-06-19T17:59:04Z) - Circuit Symmetry Verification Mitigates Quantum-Domain Impairments [69.33243249411113]
本稿では,量子状態の知識を必要とせず,量子回路の可換性を検証する回路指向対称性検証を提案する。
特に、従来の量子領域形式を回路指向安定化器に一般化するフーリエ時間安定化器(STS)手法を提案する。
論文 参考訳(メタデータ) (2021-12-27T21:15:35Z) - Quantum Error Mitigation Relying on Permutation Filtering [84.66087478797475]
本稿では,既存の置換に基づく手法を特殊なケースとして含む,置換フィルタ(permutation filters)と呼ばれる一般的なフレームワークを提案する。
提案するフィルタ設計アルゴリズムは, 常に大域的最適度に収束し, フィルタが既存の置換法よりも大幅に改善できることを示す。
論文 参考訳(メタデータ) (2021-07-03T16:07:30Z) - Measuring Analytic Gradients of General Quantum Evolution with the
Stochastic Parameter Shift Rule [0.0]
本研究では,量子計測から直接最適化される関数の勾配を推定する問題について検討する。
マルチキュービットパラメトリック量子進化の勾配を推定するアルゴリズムを提供する数学的に正確な公式を導出する。
私たちのアルゴリズムは、利用可能な全ての量子ゲートがノイズである場合でも、いくつかの近似で機能し続けています。
論文 参考訳(メタデータ) (2020-05-20T18:24:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。