論文の概要: Variational Quantum Soft Actor-Critic
- arxiv url: http://arxiv.org/abs/2112.11921v1
- Date: Mon, 20 Dec 2021 06:31:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 15:09:59.454447
- Title: Variational Quantum Soft Actor-Critic
- Title(参考訳): 変分量子ソフトアクター臨界
- Authors: Qingfeng Lan
- Abstract要約: 本研究では,連続制御の最先端手法の一つであるソフトアクター批判に基づく量子強化学習アルゴリズムを開発した。
この量子版のソフトアクター・クリティックは、調整可能なパラメータをはるかに少なくして、オリジナルのソフトアクター・クリティックに匹敵することを示す。
- 参考スコア(独自算出の注目度): 1.90365714903665
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Quantum computing has a superior advantage in tackling specific problems,
such as integer factorization and Simon's problem. For more general tasks in
machine learning, by applying variational quantum circuits, more and more
quantum algorithms have been proposed recently, especially in supervised
learning and unsupervised learning. However, little work has been done in
reinforcement learning, arguably more important and challenging. Previous work
in quantum reinforcement learning mainly focuses on discrete control tasks
where the action space is discrete. In this work, we develop a quantum
reinforcement learning algorithm based on soft actor-critic -- one of the
state-of-the-art methods for continuous control. Specifically, we use a hybrid
quantum-classical policy network consisting of a variational quantum circuit
and a classical artificial neural network. Tested in a standard reinforcement
learning benchmark, we show that this quantum version of soft actor-critic is
comparable with the original soft actor-critic, using much less adjustable
parameters. Furthermore, we analyze the effect of different hyper-parameters
and policy network architectures, pointing out the importance of architecture
design for quantum reinforcement learning.
- Abstract(参考訳): 量子コンピューティングは整数分解やサイモンの問題といった特定の問題に対処する上で優位である。
機械学習におけるより一般的なタスクとして、変分量子回路を適用することで、特に教師なし学習や教師なし学習において、近年ますます多くの量子アルゴリズムが提案されている。
しかし、強化学習において、より重要で挑戦的な作業はほとんど行われていない。
量子強化学習における以前の研究は主に、アクション空間が離散的である離散制御タスクに焦点を当てている。
本研究では,連続制御のための最先端手法の一つであるソフトアクター批判に基づく量子強化学習アルゴリズムを開発する。
具体的には、変動量子回路と古典的人工ニューラルネットワークからなるハイブリッド量子古典政策ネットワークを用いる。
標準強化学習ベンチマークでテストした結果、このソフトアクタ-クリティックの量子バージョンは、調整可能なパラメータをはるかに少なくして、オリジナルのソフトアクタ-クリティックに匹敵することが示された。
さらに,量子強化学習におけるアーキテクチャ設計の重要性を指摘し,異なるハイパーパラメータとポリシーネットワークアーキテクチャの効果を分析した。
関連論文リスト
- Robustness and Generalization in Quantum Reinforcement Learning via Lipschitz Regularization [2.8445375187526154]
本稿では、RegQPGアルゴリズムと呼ばれる量子ポリシー勾配アプローチの正規化バージョンを提案する。
本稿では、RegQPGによるトレーニングにより、その結果のロバスト性や一般化が向上することを示す。
論文 参考訳(メタデータ) (2024-10-28T15:20:35Z) - Hybrid Quantum-Classical Reinforcement Learning in Latent Observation Spaces [0.36944296923226316]
量子機械学習の最近の進歩は、古典的な制御問題に取り組むために量子法を使うことに関心を喚起している。
本稿では,古典的オートエンコーダと量子エージェントを併用して,この次元課題を解決することを提案する。
遅延空間学習法の性能解析のために, 一連の数値実験を設計する。
論文 参考訳(メタデータ) (2024-10-23T21:19:38Z) - Entanglement-Assisted Quantum Networks: Mechanics, Enabling
Technologies, Challenges, and Research Directions [66.27337498864556]
本稿では,量子ネットワークの絡み合いに関する包括的調査を行う。
ネットワーク構造、作業原則、開発段階の詳細な概要を提供する。
また、アーキテクチャ設計、絡み合いに基づくネットワーク問題、標準化など、オープンな研究の方向性を強調している。
論文 参考訳(メタデータ) (2023-07-24T02:48:22Z) - QNEAT: Natural Evolution of Variational Quantum Circuit Architecture [95.29334926638462]
我々は、ニューラルネットワークの量子対する最も有望な候補として登場した変分量子回路(VQC)に注目した。
有望な結果を示す一方で、バレン高原、重みの周期性、アーキテクチャの選択など、さまざまな問題のために、VQCのトレーニングは困難である。
本稿では,VQCの重みとアーキテクチャの両方を最適化するために,自然進化にインスパイアされた勾配のないアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-14T08:03:20Z) - Quantum Deep Hedging [10.243020478772056]
我々は、深層強化学習が現実世界に強力な枠組みを提供するヘッジの問題を考察する。
我々はポリシー探索と分布型アクター批判アルゴリズムに基づく量子強化学習法を開発した。
トラップイオン量子プロセッサ上で提案したモデルの実装に成功した。
論文 参考訳(メタデータ) (2023-03-29T10:42:50Z) - Quantum Machine Learning: from physics to software engineering [58.720142291102135]
古典的な機械学習アプローチが量子コンピュータの設備改善にどのように役立つかを示す。
量子アルゴリズムと量子コンピュータは、古典的な機械学習タスクを解くのにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2023-01-04T23:37:45Z) - The Quantum Path Kernel: a Generalized Quantum Neural Tangent Kernel for
Deep Quantum Machine Learning [52.77024349608834]
古典的なディープニューラルネットワークの量子アナログを構築することは、量子コンピューティングにおける根本的な課題である。
鍵となる問題は、古典的なディープラーニングの本質的な非線形性にどのように対処するかである。
我々は、深層機械学習のこれらの側面を複製できる量子機械学習の定式化であるQuantum Path Kernelを紹介する。
論文 参考訳(メタデータ) (2022-12-22T16:06:24Z) - Optimizing Tensor Network Contraction Using Reinforcement Learning [86.05566365115729]
本稿では,グラフニューラルネットワーク(GNN)と組み合わせた強化学習(RL)手法を提案する。
この問題は、巨大な検索スペース、重い尾の報酬分布、そして困難なクレジット割り当てのために非常に難しい。
GNNを基本方針として利用するRLエージェントが,これらの課題にどのように対処できるかを示す。
論文 参考訳(メタデータ) (2022-04-18T21:45:13Z) - Quantum Deep Reinforcement Learning for Robot Navigation Tasks [2.6999000177990924]
ハイブリッド量子古典的強化学習装置における量子回路は、複数のロボットナビゲーションシナリオにおいて最適なポリシーを学習可能であることを示す。
応用量子回路は、トレーニング可能なパラメータの数に等しくなると、古典的ニューラルネットワークのベースラインを上回っていることがわかった。
論文 参考訳(メタデータ) (2022-02-24T16:26:23Z) - Quantum algorithms for quantum dynamics: A performance study on the
spin-boson model [68.8204255655161]
量子力学シミュレーションのための量子アルゴリズムは、伝統的に時間進化作用素のトロッター近似の実装に基づいている。
変分量子アルゴリズムは欠かせない代替手段となり、現在のハードウェア上での小規模なシミュレーションを可能にしている。
量子ゲートコストが明らかに削減されているにもかかわらず、現在の実装における変分法は量子的優位性をもたらすことはありそうにない。
論文 参考訳(メタデータ) (2021-08-09T18:00:05Z) - Variational quantum policies for reinforcement learning [0.0]
変分量子回路は近年、量子機械学習モデルとして人気を集めている。
本研究では,変動量子回路に基づく強化学習ポリシの構築と訓練について検討する。
論文 参考訳(メタデータ) (2021-03-09T17:33:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。