論文の概要: Variational quantum policies for reinforcement learning
- arxiv url: http://arxiv.org/abs/2103.05577v1
- Date: Tue, 9 Mar 2021 17:33:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-10 15:12:19.156296
- Title: Variational quantum policies for reinforcement learning
- Title(参考訳): 強化学習のための変分量子政策
- Authors: Sofiene Jerbi, Casper Gyurik, Simon Marshall, Hans J. Briegel, Vedran
Dunjko
- Abstract要約: 変分量子回路は近年、量子機械学習モデルとして人気を集めている。
本研究では,変動量子回路に基づく強化学習ポリシの構築と訓練について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Variational quantum circuits have recently gained popularity as quantum
machine learning models. While considerable effort has been invested to train
them in supervised and unsupervised learning settings, relatively little
attention has been given to their potential use in reinforcement learning. In
this work, we leverage the understanding of quantum policy gradient algorithms
in a number of ways. First, we investigate how to construct and train
reinforcement learning policies based on variational quantum circuits. We
propose several designs for quantum policies, provide their learning
algorithms, and test their performance on classical benchmarking environments.
Second, we show the existence of task environments with a provable separation
in performance between quantum learning agents and any polynomial-time
classical learner, conditioned on the widely-believed classical hardness of the
discrete logarithm problem. We also consider more natural settings, in which we
show an empirical quantum advantage of our quantum policies over standard
neural-network policies. Our results constitute a first step towards
establishing a practical near-term quantum advantage in a reinforcement
learning setting. Additionally, we believe that some of our design choices for
variational quantum policies may also be beneficial to other models based on
variational quantum circuits, such as quantum classifiers and quantum
regression models.
- Abstract(参考訳): 変分量子回路は近年、量子機械学習モデルとして人気を集めている。
教師なしおよび教師なしの学習環境において教育訓練に多大な努力が注がれているが、強化学習における潜在的な使用には比較的注意が向けられていない。
本研究では,量子政策勾配アルゴリズムの理解を様々な方法で活用する。
まず,変動量子回路に基づく強化学習ポリシの構築と訓練について検討する。
本稿では、量子ポリシーの設計、学習アルゴリズムの提供、および古典的なベンチマーク環境での性能試験を行う。
次に,量子学習エージェントと多項式時間古典学習者との性能を分離するタスク環境の存在を,離散対数問題の解の古典的硬さを条件として示す。
また、より自然な設定も検討し、標準のニューラルネットワークポリシーよりも、量子ポリシーに実証的な量子効果を示す。
この結果は、強化学習環境における実用的短期量子優位性を確立するための第一歩となる。
さらに、変動量子ポリシーの設計選択のいくつかは、量子分類器や量子回帰モデルなどの変動量子回路に基づく他のモデルにも有益であると考えています。
関連論文リスト
- Information-theoretic generalization bounds for learning from quantum
data [3.618615996077951]
古典量子データに基づくトレーニングにより量子学習を記述するための数学的定式化を提案する。
我々は,古典的および量子的情報理論量の観点から,量子学習者の期待する一般化誤差を証明した。
我々の研究は、量子学習に関する量子情報理論的な視点を統一するための基礎を築いた。
論文 参考訳(メタデータ) (2023-11-09T17:21:38Z) - Quantum data learning for quantum simulations in high-energy physics [55.41644538483948]
本研究では,高エネルギー物理における量子データ学習の実践的問題への適用性について検討する。
我々は、量子畳み込みニューラルネットワークに基づくアンサッツを用いて、基底状態の量子位相を認識できることを数値的に示す。
これらのベンチマークで示された非自明な学習特性の観察は、高エネルギー物理学における量子データ学習アーキテクチャのさらなる探求の動機となる。
論文 参考訳(メタデータ) (2023-06-29T18:00:01Z) - Quantum machine learning for image classification [62.997667081978825]
我々のハイブリッド量子アプローチの1つは、MNISTデータセットで99%以上の顕著な精度を示す。
要約して,本研究は,量子機械学習技術を用いた画像認識と分類の改善に関する継続的な研究に寄与する。
論文 参考訳(メタデータ) (2023-04-18T18:23:20Z) - Quantum Imitation Learning [74.15588381240795]
本稿では、量子優位性を利用してILを高速化する量子模倣学習(QIL)を提案する。
量子行動クローニング(Q-BC)と量子生成逆模倣学習(Q-GAIL)という2つのQILアルゴリズムを開発した。
実験結果から,Q-BCとQ-GAILの両者が,従来のものと同等の性能を達成できることが判明した。
論文 参考訳(メタデータ) (2023-04-04T12:47:35Z) - Quantum Deep Hedging [10.243020478772056]
我々は、深層強化学習が現実世界に強力な枠組みを提供するヘッジの問題を考察する。
我々はポリシー探索と分布型アクター批判アルゴリズムに基づく量子強化学習法を開発した。
トラップイオン量子プロセッサ上で提案したモデルの実装に成功した。
論文 参考訳(メタデータ) (2023-03-29T10:42:50Z) - Quantum Machine Learning: from physics to software engineering [58.720142291102135]
古典的な機械学習アプローチが量子コンピュータの設備改善にどのように役立つかを示す。
量子アルゴリズムと量子コンピュータは、古典的な機械学習タスクを解くのにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2023-01-04T23:37:45Z) - The Quantum Path Kernel: a Generalized Quantum Neural Tangent Kernel for
Deep Quantum Machine Learning [52.77024349608834]
古典的なディープニューラルネットワークの量子アナログを構築することは、量子コンピューティングにおける根本的な課題である。
鍵となる問題は、古典的なディープラーニングの本質的な非線形性にどのように対処するかである。
我々は、深層機械学習のこれらの側面を複製できる量子機械学習の定式化であるQuantum Path Kernelを紹介する。
論文 参考訳(メタデータ) (2022-12-22T16:06:24Z) - Quantum policy gradient algorithms [1.5293427903448025]
強化学習環境への量子アクセスを与えられた場合、学習のスピードアップが可能であることを示す。
本研究では、最先端の強化学習ポリシーをトレーニングするための量子アルゴリズムを設計する。
パラメタライズド量子回路から得られる強化学習方針は良好であることがわかった。
論文 参考訳(メタデータ) (2022-12-19T09:45:58Z) - Time-Optimal Quantum Driving by Variational Circuit Learning [2.9582851733261286]
ディジタル量子シミュレーションとハイブリッド回路学習は、量子最適制御の新しい可能性を開く。
有限個の量子ビットを持つ量子デバイス上で、捕捉された量子粒子の波束展開をシミュレートする。
本手法の誤差に対する堅牢性について考察し,回路にバレンプラトーが存在しないことを示す。
論文 参考訳(メタデータ) (2022-11-01T11:53:49Z) - Variational Quantum Soft Actor-Critic [1.90365714903665]
本研究では,連続制御の最先端手法の一つであるソフトアクター批判に基づく量子強化学習アルゴリズムを開発した。
この量子版のソフトアクター・クリティックは、調整可能なパラメータをはるかに少なくして、オリジナルのソフトアクター・クリティックに匹敵することを示す。
論文 参考訳(メタデータ) (2021-12-20T06:31:06Z) - Quantum algorithms for quantum dynamics: A performance study on the
spin-boson model [68.8204255655161]
量子力学シミュレーションのための量子アルゴリズムは、伝統的に時間進化作用素のトロッター近似の実装に基づいている。
変分量子アルゴリズムは欠かせない代替手段となり、現在のハードウェア上での小規模なシミュレーションを可能にしている。
量子ゲートコストが明らかに削減されているにもかかわらず、現在の実装における変分法は量子的優位性をもたらすことはありそうにない。
論文 参考訳(メタデータ) (2021-08-09T18:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。