論文の概要: Accelerating Quantum Reinforcement Learning with a Quantum Natural Policy Gradient Based Approach
- arxiv url: http://arxiv.org/abs/2501.16243v1
- Date: Mon, 27 Jan 2025 17:38:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 14:00:21.366275
- Title: Accelerating Quantum Reinforcement Learning with a Quantum Natural Policy Gradient Based Approach
- Title(参考訳): 量子自然政策勾配に基づく量子強化学習の高速化
- Authors: Yang Xu, Vaneet Aggarwal,
- Abstract要約: 本稿では、古典的なNPG推定器で使用されるランダムサンプリングを決定論的勾配推定手法で置き換える量子自然ポリシー勾配(QNPG)アルゴリズムを提案する。
提案したQNPGアルゴリズムは、量子オラクルへのクエリに対する$tildemathcalO(epsilon-1.5)$のサンプル複雑性を達成し、マルコフ決定プロセス(MDP)へのクエリに対する$tildemathcalO(epsilon-2)$の古典的な下界を大幅に改善する。
- 参考スコア(独自算出の注目度): 36.05085942729295
- License:
- Abstract: We address the problem of quantum reinforcement learning (QRL) under model-free settings with quantum oracle access to the Markov Decision Process (MDP). This paper introduces a Quantum Natural Policy Gradient (QNPG) algorithm, which replaces the random sampling used in classical Natural Policy Gradient (NPG) estimators with a deterministic gradient estimation approach, enabling seamless integration into quantum systems. While this modification introduces a bounded bias in the estimator, the bias decays exponentially with increasing truncation levels. This paper demonstrates that the proposed QNPG algorithm achieves a sample complexity of $\tilde{\mathcal{O}}(\epsilon^{-1.5})$ for queries to the quantum oracle, significantly improving the classical lower bound of $\tilde{\mathcal{O}}(\epsilon^{-2})$ for queries to the MDP.
- Abstract(参考訳): 我々は、マルコフ決定プロセス(MDP)への量子オラクルアクセスを伴うモデルなし設定下でのQRL(quantum reinforcement learning)の問題に対処する。
本稿では,古典的自然政策勾配推定法(NPG)のランダムサンプリングを決定論的勾配推定法に置き換え,量子システムへのシームレスな統合を可能にする量子自然政策勾配法を提案する。
この修正は、推定器の有界バイアスをもたらすが、偏差はトラニケートレベルの増加とともに指数関数的に減衰する。
本稿では,QNPGアルゴリズムが量子オラクルへのクエリに対して$\tilde{\mathcal{O}}(\epsilon^{-1.5})$のサンプル複雑性を達成し,MDPへのクエリに対して$\tilde{\mathcal{O}}(\epsilon^{-2})$の古典的下界を大幅に改善することを示す。
関連論文リスト
- Quantum Policy Gradient in Reproducing Kernel Hilbert Space [3.8916312075738273]
パラメトリッド量子回路は、機械学習のための表現力とデータ効率の表現を提供する。
量子カーネルにおける量子回路の表現は量子教師あり学習において広く研究されている。
本稿では、量子環境における量子カーネルポリシーを用いたパラメトリックおよび非パラメトリックポリシー勾配とアクタークリティカルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-11T01:34:10Z) - Projective Quantum Eigensolver with Generalized Operators [0.0]
PQEフレームワークにおける閉形式残留方程式の観点から一般化作用素を決定する手法を開発する。
いくつかの分子系への応用により、アンザッツは単体、二重体、三重体を含む(異方性)UCCと同様の精度を達成できることを実証した。
論文 参考訳(メタデータ) (2024-10-21T15:40:22Z) - Quantum Natural Stochastic Pairwise Coordinate Descent [6.187270874122921]
近年,変分量子アルゴリズム(VQA)による量子機械学習が注目されている。
本稿では,2QNSCD最適化法を提案する。
ゲート複雑性を持つ量子回路をパラメータ化量子回路と単発量子計測の2倍の精度で用いた,新しい計量テンソルの疎い非バイアス推定器を開発した。
論文 参考訳(メタデータ) (2024-07-18T18:57:29Z) - GRAPE optimization for open quantum systems with time-dependent
decoherence rates driven by coherent and incoherent controls [77.34726150561087]
グラディエントアセンセントパルス工学(GRAPE)法は量子制御の最適化に広く用いられている。
我々は、コヒーレント制御と非コヒーレント制御の両方によって駆動されるオープン量子系の目的関数を最適化するために、GRAPE法を採用する。
状態-状態遷移問題に対する数値シミュレーションによりアルゴリズムの効率を実証する。
論文 参考訳(メタデータ) (2023-07-17T13:37:18Z) - Quantum Annealing for Single Image Super-Resolution [86.69338893753886]
単一画像超解像(SISR)問題を解くために,量子コンピューティングに基づくアルゴリズムを提案する。
提案したAQCアルゴリズムは、SISRの精度を維持しつつ、古典的なアナログよりも向上したスピードアップを実現する。
論文 参考訳(メタデータ) (2023-04-18T11:57:15Z) - Quantum Gate Generation in Two-Level Open Quantum Systems by Coherent
and Incoherent Photons Found with Gradient Search [77.34726150561087]
我々は、非コヒーレント光子によって形成される環境を、非コヒーレント制御によるオープン量子系制御の資源とみなす。
我々は、ハミルトニアンにおけるコヒーレント制御と、時間依存デコヒーレンス率を誘導する散逸器における非コヒーレント制御を利用する。
論文 参考訳(メタデータ) (2023-02-28T07:36:02Z) - A self-consistent field approach for the variational quantum
eigensolver: orbital optimization goes adaptive [52.77024349608834]
適応微分組立問題集合型アンザッツ変分固有解法(ADAPTVQE)における自己一貫したフィールドアプローチ(SCF)を提案する。
このフレームワークは、短期量子コンピュータ上の化学系の効率的な量子シミュレーションに使用される。
論文 参考訳(メタデータ) (2022-12-21T23:15:17Z) - Quantum algorithms for quantum dynamics: A performance study on the
spin-boson model [68.8204255655161]
量子力学シミュレーションのための量子アルゴリズムは、伝統的に時間進化作用素のトロッター近似の実装に基づいている。
変分量子アルゴリズムは欠かせない代替手段となり、現在のハードウェア上での小規模なシミュレーションを可能にしている。
量子ゲートコストが明らかに削減されているにもかかわらず、現在の実装における変分法は量子的優位性をもたらすことはありそうにない。
論文 参考訳(メタデータ) (2021-08-09T18:00:05Z) - Q-Match: Iterative Shape Matching via Quantum Annealing [64.74942589569596]
形状対応を見つけることは、NP-hard quadratic assignment problem (QAP)として定式化できる。
本稿では,アルファ拡大アルゴリズムに触発されたQAPの反復量子法Q-Matchを提案する。
Q-Match は、実世界の問題にスケールできるような長文対応のサブセットにおいて、反復的に形状マッチング問題に適用できる。
論文 参考訳(メタデータ) (2021-05-06T17:59:38Z) - Hybrid quantum variational algorithm for simulating open quantum systems
with near-term devices [0.0]
ハイブリッド量子古典(HQC)アルゴリズムは、古典的な計算資源によってサポートされている短期量子デバイスを使用できる。
オープンシステムのダイナミクスをシミュレートするために,効率的な変分最適化手法を用いたHQCアルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-08-12T13:49:29Z) - Measuring Analytic Gradients of General Quantum Evolution with the
Stochastic Parameter Shift Rule [0.0]
本研究では,量子計測から直接最適化される関数の勾配を推定する問題について検討する。
マルチキュービットパラメトリック量子進化の勾配を推定するアルゴリズムを提供する数学的に正確な公式を導出する。
私たちのアルゴリズムは、利用可能な全ての量子ゲートがノイズである場合でも、いくつかの近似で機能し続けています。
論文 参考訳(メタデータ) (2020-05-20T18:24:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。