論文の概要: Variational quantum policies for reinforcement learning
- arxiv url: http://arxiv.org/abs/2103.05577v1
- Date: Tue, 9 Mar 2021 17:33:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-10 15:12:19.156296
- Title: Variational quantum policies for reinforcement learning
- Title(参考訳): 強化学習のための変分量子政策
- Authors: Sofiene Jerbi, Casper Gyurik, Simon Marshall, Hans J. Briegel, Vedran
Dunjko
- Abstract要約: 変分量子回路は近年、量子機械学習モデルとして人気を集めている。
本研究では,変動量子回路に基づく強化学習ポリシの構築と訓練について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Variational quantum circuits have recently gained popularity as quantum
machine learning models. While considerable effort has been invested to train
them in supervised and unsupervised learning settings, relatively little
attention has been given to their potential use in reinforcement learning. In
this work, we leverage the understanding of quantum policy gradient algorithms
in a number of ways. First, we investigate how to construct and train
reinforcement learning policies based on variational quantum circuits. We
propose several designs for quantum policies, provide their learning
algorithms, and test their performance on classical benchmarking environments.
Second, we show the existence of task environments with a provable separation
in performance between quantum learning agents and any polynomial-time
classical learner, conditioned on the widely-believed classical hardness of the
discrete logarithm problem. We also consider more natural settings, in which we
show an empirical quantum advantage of our quantum policies over standard
neural-network policies. Our results constitute a first step towards
establishing a practical near-term quantum advantage in a reinforcement
learning setting. Additionally, we believe that some of our design choices for
variational quantum policies may also be beneficial to other models based on
variational quantum circuits, such as quantum classifiers and quantum
regression models.
- Abstract(参考訳): 変分量子回路は近年、量子機械学習モデルとして人気を集めている。
教師なしおよび教師なしの学習環境において教育訓練に多大な努力が注がれているが、強化学習における潜在的な使用には比較的注意が向けられていない。
本研究では,量子政策勾配アルゴリズムの理解を様々な方法で活用する。
まず,変動量子回路に基づく強化学習ポリシの構築と訓練について検討する。
本稿では、量子ポリシーの設計、学習アルゴリズムの提供、および古典的なベンチマーク環境での性能試験を行う。
次に,量子学習エージェントと多項式時間古典学習者との性能を分離するタスク環境の存在を,離散対数問題の解の古典的硬さを条件として示す。
また、より自然な設定も検討し、標準のニューラルネットワークポリシーよりも、量子ポリシーに実証的な量子効果を示す。
この結果は、強化学習環境における実用的短期量子優位性を確立するための第一歩となる。
さらに、変動量子ポリシーの設計選択のいくつかは、量子分類器や量子回帰モデルなどの変動量子回路に基づく他のモデルにも有益であると考えています。
関連論文リスト
- Robustness and Generalization in Quantum Reinforcement Learning via Lipschitz Regularization [2.8445375187526154]
本稿では、RegQPGアルゴリズムと呼ばれる量子ポリシー勾配アプローチの正規化バージョンを提案する。
本稿では、RegQPGによるトレーニングにより、その結果のロバスト性や一般化が向上することを示す。
論文 参考訳(メタデータ) (2024-10-28T15:20:35Z) - Quantum resources of quantum and classical variational methods [0.48212500317840945]
量子情報と変分技法の間の橋渡しを、非安定化性(マジック)の概念がいかに実現できるかを示す。
エネルギーの正確性は必要だが、非安定化装置の正確性には必ずしも十分ではないことを示す。
本研究は,古典的変分法と量子的変分法の両方の普遍的表現性評価の基礎となる。
論文 参考訳(メタデータ) (2024-09-19T18:00:00Z) - Efficient Learning for Linear Properties of Bounded-Gate Quantum Circuits [63.733312560668274]
d可変RZゲートとG-dクリフォードゲートを含む量子回路を与えられた場合、学習者は純粋に古典的な推論を行い、その線形特性を効率的に予測できるだろうか?
我々は、d で線形にスケーリングするサンプルの複雑さが、小さな予測誤差を達成するのに十分であり、対応する計算の複雑さは d で指数関数的にスケールすることを証明する。
我々は,予測誤差と計算複雑性をトレードオフできるカーネルベースの学習モデルを考案し,多くの実践的な環境で指数関数からスケーリングへ移行した。
論文 参考訳(メタデータ) (2024-08-22T08:21:28Z) - Separable Power of Classical and Quantum Learning Protocols Through the Lens of No-Free-Lunch Theorem [70.42372213666553]
No-Free-Lunch(NFL)定理は、最適化プロセスに関係なく問題とデータ非依存の一般化誤差を定量化する。
我々は、様々な量子学習アルゴリズムを、特定の観測可能条件下で量子力学を学習するために設計された3つの学習プロトコルに分類する。
得られたNFL定理は, CLC-LP, ReQu-LP, Qu-LPにまたがるサンプルの複雑性を2次的に低減することを示した。
この性能差は、非直交量子状態のグローバル位相に関する情報を間接的に活用するために、量子関連学習プロトコルのユニークな能力に起因している。
論文 参考訳(メタデータ) (2024-05-12T09:05:13Z) - Quantum data learning for quantum simulations in high-energy physics [55.41644538483948]
本研究では,高エネルギー物理における量子データ学習の実践的問題への適用性について検討する。
我々は、量子畳み込みニューラルネットワークに基づくアンサッツを用いて、基底状態の量子位相を認識できることを数値的に示す。
これらのベンチマークで示された非自明な学習特性の観察は、高エネルギー物理学における量子データ学習アーキテクチャのさらなる探求の動機となる。
論文 参考訳(メタデータ) (2023-06-29T18:00:01Z) - Quantum Deep Hedging [10.243020478772056]
我々は、深層強化学習が現実世界に強力な枠組みを提供するヘッジの問題を考察する。
我々はポリシー探索と分布型アクター批判アルゴリズムに基づく量子強化学習法を開発した。
トラップイオン量子プロセッサ上で提案したモデルの実装に成功した。
論文 参考訳(メタデータ) (2023-03-29T10:42:50Z) - Quantum Machine Learning: from physics to software engineering [58.720142291102135]
古典的な機械学習アプローチが量子コンピュータの設備改善にどのように役立つかを示す。
量子アルゴリズムと量子コンピュータは、古典的な機械学習タスクを解くのにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2023-01-04T23:37:45Z) - The Quantum Path Kernel: a Generalized Quantum Neural Tangent Kernel for
Deep Quantum Machine Learning [52.77024349608834]
古典的なディープニューラルネットワークの量子アナログを構築することは、量子コンピューティングにおける根本的な課題である。
鍵となる問題は、古典的なディープラーニングの本質的な非線形性にどのように対処するかである。
我々は、深層機械学習のこれらの側面を複製できる量子機械学習の定式化であるQuantum Path Kernelを紹介する。
論文 参考訳(メタデータ) (2022-12-22T16:06:24Z) - Quantum policy gradient algorithms [1.5293427903448025]
強化学習環境への量子アクセスを与えられた場合、学習のスピードアップが可能であることを示す。
本研究では、最先端の強化学習ポリシーをトレーニングするための量子アルゴリズムを設計する。
パラメタライズド量子回路から得られる強化学習方針は良好であることがわかった。
論文 参考訳(メタデータ) (2022-12-19T09:45:58Z) - Variational Quantum Soft Actor-Critic [1.90365714903665]
本研究では,連続制御の最先端手法の一つであるソフトアクター批判に基づく量子強化学習アルゴリズムを開発した。
この量子版のソフトアクター・クリティックは、調整可能なパラメータをはるかに少なくして、オリジナルのソフトアクター・クリティックに匹敵することを示す。
論文 参考訳(メタデータ) (2021-12-20T06:31:06Z) - Quantum algorithms for quantum dynamics: A performance study on the
spin-boson model [68.8204255655161]
量子力学シミュレーションのための量子アルゴリズムは、伝統的に時間進化作用素のトロッター近似の実装に基づいている。
変分量子アルゴリズムは欠かせない代替手段となり、現在のハードウェア上での小規模なシミュレーションを可能にしている。
量子ゲートコストが明らかに削減されているにもかかわらず、現在の実装における変分法は量子的優位性をもたらすことはありそうにない。
論文 参考訳(メタデータ) (2021-08-09T18:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。