論文の概要: Quantum Natural Policy Gradients: Towards Sample-Efficient Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2304.13571v1
- Date: Wed, 26 Apr 2023 14:09:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 14:12:07.949853
- Title: Quantum Natural Policy Gradients: Towards Sample-Efficient Reinforcement
Learning
- Title(参考訳): 量子自然政策勾配:サンプル効率強化学習に向けて
- Authors: Nico Meyer, Daniel D. Scherer, Axel Plinge, Christopher Mutschler, and
Michael J. Hartmann
- Abstract要約: 本稿では,量子フィッシャー情報行列の効率的な近似を生かした量子自然政策勾配(QNPG)アルゴリズムを提案する。
我々は,QNPGがコンバージェンス速度と安定性に関するコンテキスト帯域環境の1次学習より優れていることを実験的に実証した。
12kbitのハードウェアデバイスでトレーニングすることで,本手法の実現可能性を示す。
- 参考スコア(独自算出の注目度): 1.3946033794136758
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning is a growing field in AI with a lot of potential.
Intelligent behavior is learned automatically through trial and error in
interaction with the environment. However, this learning process is often
costly. Using variational quantum circuits as function approximators can reduce
this cost. In order to implement this, we propose the quantum natural policy
gradient (QNPG) algorithm -- a second-order gradient-based routine that takes
advantage of an efficient approximation of the quantum Fisher information
matrix. We experimentally demonstrate that QNPG outperforms first-order based
training on Contextual Bandits environments regarding convergence speed and
stability and thereby reduces the sample complexity. Furthermore, we provide
evidence for the practical feasibility of our approach by training on a
12-qubit hardware device.
- Abstract(参考訳): 強化学習はAIにおける成長分野であり、多くの可能性がある。
知的行動は、試行錯誤と環境との相互作用を通じて自動的に学習される。
しかし、この学習プロセスはしばしばコストがかかる。
関数近似器として変分量子回路を用いると、このコストを削減できる。
これを実現するために、量子フィッシャー情報行列の効率的な近似を利用する2階勾配に基づくルーチンである量子自然ポリシー勾配(QNPG)アルゴリズムを提案する。
本研究では,QNPGがコンバージェンス速度と安定性に関するコンテキスト帯域環境の1次学習より優れており,サンプルの複雑さを低減できることを示す。
さらに,12kbitのハードウェアデバイス上でのトレーニングにより,本手法の実現可能性を示す。
関連論文リスト
- QuantumSEA: In-Time Sparse Exploration for Noise Adaptive Quantum
Circuits [82.50620782471485]
QuantumSEAはノイズ適応型量子回路のインタイムスパース探索である。
1)トレーニング中の暗黙の回路容量と(2)雑音の頑健さの2つの主要な目標を達成することを目的としている。
提案手法は, 量子ゲート数の半減と回路実行の2倍の時間節約で, 最先端の計算結果を確立する。
論文 参考訳(メタデータ) (2024-01-10T22:33:00Z) - Certainty In, Certainty Out: REVQCs for Quantum Machine Learning [15.908051575681458]
高精度かつ高精度なサンプル推測が可能な統計理論について論じる。
本稿では,このトレーニング手法の有効性を,いくつかの有効な変分量子回路を用いて評価する。
論文 参考訳(メタデータ) (2023-10-16T17:53:30Z) - Learning To Optimize Quantum Neural Network Without Gradients [3.9848482919377006]
本稿では,量子回路のパラメータを出力するために,Emphmeta-Optimizerネットワークをトレーニングする新しいメタ最適化アルゴリズムを提案する。
我々は,従来の勾配に基づくアルゴリズムよりも回路評価が少ない場合に,より高品質な最小値が得られることを示す。
論文 参考訳(メタデータ) (2023-04-15T01:09:12Z) - Quantum Imitation Learning [74.15588381240795]
本稿では、量子優位性を利用してILを高速化する量子模倣学習(QIL)を提案する。
量子行動クローニング(Q-BC)と量子生成逆模倣学習(Q-GAIL)という2つのQILアルゴリズムを開発した。
実験結果から,Q-BCとQ-GAILの両者が,従来のものと同等の性能を達成できることが判明した。
論文 参考訳(メタデータ) (2023-04-04T12:47:35Z) - Quantum policy gradient algorithms [1.5293427903448025]
強化学習環境への量子アクセスを与えられた場合、学習のスピードアップが可能であることを示す。
本研究では、最先端の強化学習ポリシーをトレーニングするための量子アルゴリズムを設計する。
パラメタライズド量子回路から得られる強化学習方針は良好であることがわかった。
論文 参考訳(メタデータ) (2022-12-19T09:45:58Z) - Stabilizing Q-learning with Linear Architectures for Provably Efficient
Learning [53.17258888552998]
本研究では,線形関数近似を用いた基本的な$Q$-learningプロトコルの探索変種を提案する。
このアルゴリズムの性能は,新しい近似誤差というより寛容な概念の下で,非常に優雅に低下することを示す。
論文 参考訳(メタデータ) (2022-06-01T23:26:51Z) - Optimizing Tensor Network Contraction Using Reinforcement Learning [86.05566365115729]
本稿では,グラフニューラルネットワーク(GNN)と組み合わせた強化学習(RL)手法を提案する。
この問題は、巨大な検索スペース、重い尾の報酬分布、そして困難なクレジット割り当てのために非常に難しい。
GNNを基本方針として利用するRLエージェントが,これらの課題にどのように対処できるかを示す。
論文 参考訳(メタデータ) (2022-04-18T21:45:13Z) - Quantum Annealing Formulation for Binary Neural Networks [40.99969857118534]
本研究では、リソース制約のあるデバイスを意図した軽量で強力なモデルであるバイナリニューラルネットワークについて検討する。
トレーニング問題に対する2次非制約バイナリ最適化の定式化を考案する。
問題は難解であり、すなわち、二分重みを推定するコストはネットワークサイズと指数関数的にスケールするが、どのようにして問題を量子アニール器に直接最適化できるかを示す。
論文 参考訳(メタデータ) (2021-07-05T03:20:54Z) - Optimal training of variational quantum algorithms without barren
plateaus [0.0]
変分量子アルゴリズム(VQA)は、短期量子コンピュータの効率的な利用を約束する。
量子状態学習のためのVQAを最適に訓練する方法を示す。
量子機械学習におけるガウスカーネルの応用を提案する。
論文 参考訳(メタデータ) (2021-04-29T17:54:59Z) - Preparation of excited states for nuclear dynamics on a quantum computer [117.44028458220427]
量子コンピュータ上で励起状態を作成するための2つの異なる方法を研究する。
シミュレーションおよび実量子デバイス上でこれらの手法をベンチマークする。
これらの結果から,フォールトトレラントデバイスに優れたスケーリングを実現するために設計された量子技術が,接続性やゲート忠実性に制限されたデバイスに実用的なメリットをもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-28T17:21:25Z) - Machine learning transfer efficiencies for noisy quantum walks [62.997667081978825]
グラフ型と量子系コヒーレンスの両方の要件を見つけるプロセスは自動化可能であることを示す。
この自動化は、特定のタイプの畳み込みニューラルネットワークを使用して、どのネットワークで、どのコヒーレンス要求の量子優位性が可能かを学習する。
我々の結果は、量子実験における利点の実証と、科学的研究と発見の自動化への道を開くために重要である。
論文 参考訳(メタデータ) (2020-01-15T18:36:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。