論文の概要: Variational Quantum Soft Actor-Critic
- arxiv url: http://arxiv.org/abs/2112.11921v1
- Date: Mon, 20 Dec 2021 06:31:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 15:09:59.454447
- Title: Variational Quantum Soft Actor-Critic
- Title(参考訳): 変分量子ソフトアクター臨界
- Authors: Qingfeng Lan
- Abstract要約: 本研究では,連続制御の最先端手法の一つであるソフトアクター批判に基づく量子強化学習アルゴリズムを開発した。
この量子版のソフトアクター・クリティックは、調整可能なパラメータをはるかに少なくして、オリジナルのソフトアクター・クリティックに匹敵することを示す。
- 参考スコア(独自算出の注目度): 1.90365714903665
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Quantum computing has a superior advantage in tackling specific problems,
such as integer factorization and Simon's problem. For more general tasks in
machine learning, by applying variational quantum circuits, more and more
quantum algorithms have been proposed recently, especially in supervised
learning and unsupervised learning. However, little work has been done in
reinforcement learning, arguably more important and challenging. Previous work
in quantum reinforcement learning mainly focuses on discrete control tasks
where the action space is discrete. In this work, we develop a quantum
reinforcement learning algorithm based on soft actor-critic -- one of the
state-of-the-art methods for continuous control. Specifically, we use a hybrid
quantum-classical policy network consisting of a variational quantum circuit
and a classical artificial neural network. Tested in a standard reinforcement
learning benchmark, we show that this quantum version of soft actor-critic is
comparable with the original soft actor-critic, using much less adjustable
parameters. Furthermore, we analyze the effect of different hyper-parameters
and policy network architectures, pointing out the importance of architecture
design for quantum reinforcement learning.
- Abstract(参考訳): 量子コンピューティングは整数分解やサイモンの問題といった特定の問題に対処する上で優位である。
機械学習におけるより一般的なタスクとして、変分量子回路を適用することで、特に教師なし学習や教師なし学習において、近年ますます多くの量子アルゴリズムが提案されている。
しかし、強化学習において、より重要で挑戦的な作業はほとんど行われていない。
量子強化学習における以前の研究は主に、アクション空間が離散的である離散制御タスクに焦点を当てている。
本研究では,連続制御のための最先端手法の一つであるソフトアクター批判に基づく量子強化学習アルゴリズムを開発する。
具体的には、変動量子回路と古典的人工ニューラルネットワークからなるハイブリッド量子古典政策ネットワークを用いる。
標準強化学習ベンチマークでテストした結果、このソフトアクタ-クリティックの量子バージョンは、調整可能なパラメータをはるかに少なくして、オリジナルのソフトアクタ-クリティックに匹敵することが示された。
さらに,量子強化学習におけるアーキテクチャ設計の重要性を指摘し,異なるハイパーパラメータとポリシーネットワークアーキテクチャの効果を分析した。
関連論文リスト
- Quantum Advantage Actor-Critic for Reinforcement Learning [5.579028648465784]
本稿では,Advantage Actor-Criticアルゴリズムと変分量子回路を組み合わせた新しい量子強化学習手法を提案する。
複数の量子アドバンテージ・アクター・クリティカル構成をよく知られたカートポール環境で実証的にテストし、連続的な状態空間を持つ制御タスクにおける我々のアプローチを評価する。
論文 参考訳(メタデータ) (2024-01-13T11:08:45Z) - Quantum machine learning for image classification [62.997667081978825]
我々のハイブリッド量子アプローチの1つは、MNISTデータセットで99%以上の顕著な精度を示す。
要約して,本研究は,量子機械学習技術を用いた画像認識と分類の改善に関する継続的な研究に寄与する。
論文 参考訳(メタデータ) (2023-04-18T18:23:20Z) - QNEAT: Natural Evolution of Variational Quantum Circuit Architecture [95.29334926638462]
我々は、ニューラルネットワークの量子対する最も有望な候補として登場した変分量子回路(VQC)に注目した。
有望な結果を示す一方で、バレン高原、重みの周期性、アーキテクチャの選択など、さまざまな問題のために、VQCのトレーニングは困難である。
本稿では,VQCの重みとアーキテクチャの両方を最適化するために,自然進化にインスパイアされた勾配のないアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-14T08:03:20Z) - Quantum Deep Hedging [10.243020478772056]
我々は、深層強化学習が現実世界に強力な枠組みを提供するヘッジの問題を考察する。
我々はポリシー探索と分布型アクター批判アルゴリズムに基づく量子強化学習法を開発した。
トラップイオン量子プロセッサ上で提案したモデルの実装に成功した。
論文 参考訳(メタデータ) (2023-03-29T10:42:50Z) - Quantum Machine Learning: from physics to software engineering [58.720142291102135]
古典的な機械学習アプローチが量子コンピュータの設備改善にどのように役立つかを示す。
量子アルゴリズムと量子コンピュータは、古典的な機械学習タスクを解くのにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2023-01-04T23:37:45Z) - The Quantum Path Kernel: a Generalized Quantum Neural Tangent Kernel for
Deep Quantum Machine Learning [52.77024349608834]
古典的なディープニューラルネットワークの量子アナログを構築することは、量子コンピューティングにおける根本的な課題である。
鍵となる問題は、古典的なディープラーニングの本質的な非線形性にどのように対処するかである。
我々は、深層機械学習のこれらの側面を複製できる量子機械学習の定式化であるQuantum Path Kernelを紹介する。
論文 参考訳(メタデータ) (2022-12-22T16:06:24Z) - Optimizing Tensor Network Contraction Using Reinforcement Learning [86.05566365115729]
本稿では,グラフニューラルネットワーク(GNN)と組み合わせた強化学習(RL)手法を提案する。
この問題は、巨大な検索スペース、重い尾の報酬分布、そして困難なクレジット割り当てのために非常に難しい。
GNNを基本方針として利用するRLエージェントが,これらの課題にどのように対処できるかを示す。
論文 参考訳(メタデータ) (2022-04-18T21:45:13Z) - Quantum algorithms for quantum dynamics: A performance study on the
spin-boson model [68.8204255655161]
量子力学シミュレーションのための量子アルゴリズムは、伝統的に時間進化作用素のトロッター近似の実装に基づいている。
変分量子アルゴリズムは欠かせない代替手段となり、現在のハードウェア上での小規模なシミュレーションを可能にしている。
量子ゲートコストが明らかに削減されているにもかかわらず、現在の実装における変分法は量子的優位性をもたらすことはありそうにない。
論文 参考訳(メタデータ) (2021-08-09T18:00:05Z) - An unsupervised feature learning for quantum-classical convolutional
network with applications to fault detection [5.609958919699706]
本稿では,量子特徴抽出器の階層構造を学習するために,量子古典的畳み込みネットワークのための単純な教師なし手法を提案する。
提案手法の主な貢献は、量子回路アンサッツにおける量子特性の差を最大化するために、$K$-meansクラスタリングを使用することである。
論文 参考訳(メタデータ) (2021-07-17T03:16:59Z) - Variational quantum policies for reinforcement learning [0.0]
変分量子回路は近年、量子機械学習モデルとして人気を集めている。
本研究では,変動量子回路に基づく強化学習ポリシの構築と訓練について検討する。
論文 参考訳(メタデータ) (2021-03-09T17:33:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。