論文の概要: Quantum Reinforcement Learning via Policy Iteration
- arxiv url: http://arxiv.org/abs/2203.01889v1
- Date: Thu, 3 Mar 2022 18:08:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-04 18:30:15.827648
- Title: Quantum Reinforcement Learning via Policy Iteration
- Title(参考訳): 政策イテレーションによる量子強化学習
- Authors: El Amine Cherrat and Iordanis Kerenidis and Anupam Prakash
- Abstract要約: 政策反復による量子強化学習を行うための一般的なフレームワークを提供する。
無限の地平線割引問題に対するEmphquantum Policy Evaluation法の設計と分析により、我々の枠組みを検証する。
本稿では,OpenAI の Gym を用いた2つの環境における量子アルゴリズムの理論的および実験的性能について検討する。
- 参考スコア(独自算出の注目度): 6.961253535504979
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quantum computing has shown the potential to substantially speed up machine
learning applications, in particular for supervised and unsupervised learning.
Reinforcement learning, on the other hand, has become essential for solving
many decision making problems and policy iteration methods remain the
foundation of such approaches. In this paper, we provide a general framework
for performing quantum reinforcement learning via policy iteration. We validate
our framework by designing and analyzing: \emph{quantum policy evaluation}
methods for infinite horizon discounted problems by building quantum states
that approximately encode the value function of a policy $\pi$; and
\emph{quantum policy improvement} methods by post-processing measurement
outcomes on these quantum states. Last, we study the theoretical and
experimental performance of our quantum algorithms on two environments from
OpenAI's Gym.
- Abstract(参考訳): 量子コンピューティングは、特に教師なしおよび教師なし学習において、機械学習アプリケーションを大幅にスピードアップする可能性を示している。
一方, 意思決定問題の解決には強化学習が不可欠であり, 政策反復法がそのような手法の基礎となっている。
本稿では,ポリシーイテレーションを通じて量子強化学習を行うための汎用フレームワークを提案する。
この枠組みを設計・解析することにより検証する: \emph{quantum policy evaluation} 法: \emph{quantum policy evaluation} 法:$\pi$ の値関数をエンコードする量子状態を構築し、これらの量子状態に対する後処理測定結果による \emph{quantum policy improvement} 法。
最後に,OpenAI の Gym を用いた2つの環境における量子アルゴリズムの理論的および実験的性能について検討した。
関連論文リスト
- Robustness and Generalization in Quantum Reinforcement Learning via Lipschitz Regularization [2.8445375187526154]
本稿では、RegQPGアルゴリズムと呼ばれる量子ポリシー勾配アプローチの正規化バージョンを提案する。
本稿では、RegQPGによるトレーニングにより、その結果のロバスト性や一般化が向上することを示す。
論文 参考訳(メタデータ) (2024-10-28T15:20:35Z) - Quantum algorithms: A survey of applications and end-to-end complexities [90.05272647148196]
期待されている量子コンピュータの応用は、科学と産業にまたがる。
本稿では,量子アルゴリズムの応用分野について検討する。
私たちは、各領域における課題と機会を"エンドツーエンド"な方法で概説します。
論文 参考訳(メタデータ) (2023-10-04T17:53:55Z) - Quantum-enhanced policy iteration on the example of a mountain car [0.0]
本稿では,強化学習分野において広く用いられているQEPI(quantum-enhanced Policy iteration)アルゴリズムを提案する。
アルゴリズムの複雑さは、密度と(典型的には)スパースケースに対して解析される。
量子エミュレータを用いたマウンテンカーの例による数値計算の結果,開発手順を検証し,QEPI性能をベンチマークした。
論文 参考訳(メタデータ) (2023-08-16T13:16:40Z) - Quantum policy gradient algorithms [1.5293427903448025]
強化学習環境への量子アクセスを与えられた場合、学習のスピードアップが可能であることを示す。
本研究では、最先端の強化学習ポリシーをトレーニングするための量子アルゴリズムを設計する。
パラメタライズド量子回路から得られる強化学習方針は良好であることがわかった。
論文 参考訳(メタデータ) (2022-12-19T09:45:58Z) - Quantum Policy Iteration via Amplitude Estimation and Grover Search --
Towards Quantum Advantage for Reinforcement Learning [7.122914046030916]
本稿では,振幅推定とGrover検索を組み合わせた政策評価・改善手法を提案する。
最適値に到達するまで、Grover検索を用いて初期ポリシーを繰り返し改善する量子ポリシー反復法を導出する。
論文 参考訳(メタデータ) (2022-06-09T19:23:10Z) - Reducing the cost of energy estimation in the variational quantum
eigensolver algorithm with robust amplitude estimation [50.591267188664666]
量子化学と材料は、量子コンピューティングの最も有望な応用の1つである。
これらの領域における産業関連問題とそれを解決する量子アルゴリズムとの整合性については、まだ多くの研究が続けられている。
論文 参考訳(メタデータ) (2022-03-14T16:51:36Z) - Circuit Symmetry Verification Mitigates Quantum-Domain Impairments [69.33243249411113]
本稿では,量子状態の知識を必要とせず,量子回路の可換性を検証する回路指向対称性検証を提案する。
特に、従来の量子領域形式を回路指向安定化器に一般化するフーリエ時間安定化器(STS)手法を提案する。
論文 参考訳(メタデータ) (2021-12-27T21:15:35Z) - On exploring the potential of quantum auto-encoder for learning quantum systems [60.909817434753315]
そこで我々は,古典的な3つのハードラーニング問題に対処するために,QAEに基づく効果的な3つの学習プロトコルを考案した。
私たちの研究は、ハード量子物理学と量子情報処理タスクを達成するための高度な量子学習アルゴリズムの開発に新たな光を当てています。
論文 参考訳(メタデータ) (2021-06-29T14:01:40Z) - Variational quantum policies for reinforcement learning [0.0]
変分量子回路は近年、量子機械学習モデルとして人気を集めている。
本研究では,変動量子回路に基づく強化学習ポリシの構築と訓練について検討する。
論文 参考訳(メタデータ) (2021-03-09T17:33:09Z) - Quantum Geometric Machine Learning for Quantum Circuits and Control [78.50747042819503]
我々は、量子幾何学的制御問題に対するディープラーニングの適用をレビューし、拡張する。
量子回路合成問題における時間-最適制御の強化について述べる。
我々の研究結果は、時間-最適制御問題に対する機械学習と幾何学的手法を組み合わせた量子制御と量子情報理論の研究者にとって興味深いものである。
論文 参考訳(メタデータ) (2020-06-19T19:12:14Z) - An Application of Quantum Annealing Computing to Seismic Inversion [55.41644538483948]
小型地震インバージョン問題を解決するために,D波量子アニールに量子アルゴリズムを適用した。
量子コンピュータによって達成される精度は、少なくとも古典的コンピュータと同程度である。
論文 参考訳(メタデータ) (2020-05-06T14:18:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。