論文の概要: Quantum Speedups in Regret Analysis of Infinite Horizon Average-Reward
Markov Decision Processes
- arxiv url: http://arxiv.org/abs/2310.11684v2
- Date: Sat, 2 Mar 2024 01:07:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 20:23:30.371768
- Title: Quantum Speedups in Regret Analysis of Infinite Horizon Average-Reward
Markov Decision Processes
- Title(参考訳): 無限水平平均逆マルコフ決定過程のレグレト解析における量子スピードアップ
- Authors: Bhargav Ganguly and Yang Xu and Vaneet Aggarwal
- Abstract要約: 我々は,未知のMDPとエージェントのエンゲージメントのための革新的な量子フレームワークを提案する。
平均推定における量子的優位性は、無限の地平線強化学習に対する後悔の保証において指数的な進歩をもたらすことを示す。
- 参考スコア(独自算出の注目度): 36.05085942729295
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates the potential of quantum acceleration in addressing
infinite horizon Markov Decision Processes (MDPs) to enhance average reward
outcomes. We introduce an innovative quantum framework for the agent's
engagement with an unknown MDP, extending the conventional interaction
paradigm. Our approach involves the design of an optimism-driven tabular
Reinforcement Learning algorithm that harnesses quantum signals acquired by the
agent through efficient quantum mean estimation techniques. Through thorough
theoretical analysis, we demonstrate that the quantum advantage in mean
estimation leads to exponential advancements in regret guarantees for infinite
horizon Reinforcement Learning. Specifically, the proposed Quantum algorithm
achieves a regret bound of $\tilde{\mathcal{O}}(1)$, a significant improvement
over the $\tilde{\mathcal{O}}(\sqrt{T})$ bound exhibited by classical
counterparts.
- Abstract(参考訳): 本稿では,無限大地平線マルコフ決定過程(mdps)の解法における量子加速度のポテンシャルについて検討する。
我々は、エージェントが未知のMDPと関わり合うための革新的な量子フレームワークを導入し、従来の相互作用パラダイムを拡張した。
提案手法は,効率的な量子平均推定手法を用いて,エージェントが取得した量子信号を利用する楽観性駆動型表型強化学習アルゴリズムの設計を含む。
徹底的な理論解析を通じて,平均推定における量子優位は無限遠地平線強化学習における後悔保証の指数関数的発展をもたらすことを実証する。
具体的には、提案したQuantumアルゴリズムは、古典的対象によって示される$\tilde{\mathcal{O}}(1)$に対する大きな改善である$\tilde{\mathcal{O}}(1)$の後悔境界を達成する。
関連論文リスト
- Power Characterization of Noisy Quantum Kernels [52.47151453259434]
一般化誤差が小さい場合でも,量子カーネル法は予測能力に乏しい。
我々は、量子計算にノイズの多い量子カーネル法を用いるために重要な警告を提供する。
論文 参考訳(メタデータ) (2024-01-31T01:02:16Z) - Quantum Advantage Actor-Critic for Reinforcement Learning [5.579028648465784]
本稿では,Advantage Actor-Criticアルゴリズムと変分量子回路を組み合わせた新しい量子強化学習手法を提案する。
複数の量子アドバンテージ・アクター・クリティカル構成をよく知られたカートポール環境で実証的にテストし、連続的な状態空間を持つ制御タスクにおける我々のアプローチを評価する。
論文 参考訳(メタデータ) (2024-01-13T11:08:45Z) - Near-Term Distributed Quantum Computation using Mean-Field Corrections
and Auxiliary Qubits [77.04894470683776]
本稿では,限られた情報伝達と保守的絡み合い生成を含む短期分散量子コンピューティングを提案する。
我々はこれらの概念に基づいて、変分量子アルゴリズムの断片化事前学習のための近似回路切断手法を作成する。
論文 参考訳(メタデータ) (2023-09-11T18:00:00Z) - Evaluating the Convergence of Tabu Enhanced Hybrid Quantum Optimization [58.720142291102135]
本稿では,量子ハードウェア上での最適化問題解決に有用な Tabu Enhanced Hybrid Quantum Optimization メタヒューリスティック手法を提案する。
提案手法の理論的収束を,イジングモデルに基づくタブ状態を保存する対象の衝突の観点から考察する。
論文 参考訳(メタデータ) (2022-09-05T07:23:03Z) - Constrained Quantum Optimization for Extractive Summarization on a
Trapped-ion Quantum Computer [13.528362112761805]
本稿では,量子ハードウェアの制約を保存する量子最適化アルゴリズムの,これまでで最大の実行方法を示す。
我々は、最大20キュービットと2キュービットゲート深さ最大159の量子進化を制限するXY-QAOA回路を実行する。
本稿では,アルゴリズムのトレードオフと,短期量子ハードウェア上での実行に対する影響について論じる。
論文 参考訳(メタデータ) (2022-06-13T16:21:04Z) - Theory of Quantum Generative Learning Models with Maximum Mean
Discrepancy [67.02951777522547]
量子回路ボルンマシン(QCBM)と量子生成逆ネットワーク(QGAN)の学習可能性について検討する。
まず、QCBMの一般化能力を解析し、量子デバイスがターゲット分布に直接アクセスできる際の優位性を同定する。
次に、QGANの一般化誤差境界が、採用されるAnsatz、クォーディットの数、入力状態に依存することを示す。
論文 参考訳(メタデータ) (2022-05-10T08:05:59Z) - Circuit Symmetry Verification Mitigates Quantum-Domain Impairments [69.33243249411113]
本稿では,量子状態の知識を必要とせず,量子回路の可換性を検証する回路指向対称性検証を提案する。
特に、従来の量子領域形式を回路指向安定化器に一般化するフーリエ時間安定化器(STS)手法を提案する。
論文 参考訳(メタデータ) (2021-12-27T21:15:35Z) - Portfolio Optimization with Digitized-Counterdiabatic Quantum Algorithms [1.1682745573995112]
我々は、NISQ時代の産業応用における量子優位性にアプローチするための先進パラダイムとして、デジタルカウンテルダイアバティック量子コンピューティングを考察する。
本分析は, 近似反断熱法を導入すると, 得られたディジタル量子アルゴリズムの成功確率を大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-12-15T18:55:02Z) - Quantum computing critical exponents [0.0]
逆場イジング連鎖の臨界点を対象とする場合,変分量子古典シミュレーションアルゴリズムは有限回路深度スケーリングの崩壊を許容することを示す。
秩序パラメータは、相転移を渡るときに量子アルゴリズムが遅くなるため、遷移の片側にしか崩壊しない。
論文 参考訳(メタデータ) (2021-04-02T17:38:20Z) - Direct Quantum Communications in the Presence of Realistic Noisy
Entanglement [69.25543534545538]
本稿では,現実的な雑音に依拠する新しい量子通信方式を提案する。
性能分析の結果,提案手法は競争力のあるQBER, 利得, 利得を提供することがわかった。
論文 参考訳(メタデータ) (2020-12-22T13:06:12Z) - K-spin Hamiltonian for quantum-resolvable Markov decision processes [0.0]
離散的、有限な割引マルコフ決定過程のKスピンハミルトン表現と等価な擬ブールコスト関数を導出する。
このKスピンハミルトニアンは、量子アルゴリズムを用いて最適なポリシーを解くための出発点を与える。
論文 参考訳(メタデータ) (2020-04-13T16:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。