論文の概要: Hybrid actor-critic algorithm for quantum reinforcement learning at CERN
beam lines
- arxiv url: http://arxiv.org/abs/2209.11044v1
- Date: Thu, 22 Sep 2022 14:38:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-25 18:08:30.753233
- Title: Hybrid actor-critic algorithm for quantum reinforcement learning at CERN
beam lines
- Title(参考訳): CERNビームラインにおける量子強化学習のためのハイブリッドアクター・クリティックアルゴリズム
- Authors: Michael Schenk, El\'ias F. Combarro, Michele Grossi, Verena Kain,
Kevin Shing Bruce Li, Mircea-Marian Popa, Sofia Vallecorsa
- Abstract要約: クランプ量子ボルツマンマシン(QBM)を用いた自由エネルギーベース強化学習(FERL)は学習効率を著しく向上することを示した。
本稿では、FERLアプローチを多次元連続状態-作用空間環境に拡張する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Free energy-based reinforcement learning (FERL) with clamped quantum
Boltzmann machines (QBM) was shown to significantly improve the learning
efficiency compared to classical Q-learning with the restriction, however, to
discrete state-action space environments. In this paper, the FERL approach is
extended to multi-dimensional continuous state-action space environments to
open the doors for a broader range of real-world applications. First, free
energy-based Q-learning is studied for discrete action spaces, but continuous
state spaces and the impact of experience replay on sample efficiency is
assessed. In a second step, a hybrid actor-critic scheme for continuous
state-action spaces is developed based on the Deep Deterministic Policy
Gradient algorithm combining a classical actor network with a QBM-based critic.
The results obtained with quantum annealing, both simulated and with D-Wave
quantum annealing hardware, are discussed, and the performance is compared to
classical reinforcement learning methods. The environments used throughout
represent existing particle accelerator beam lines at the European Organisation
for Nuclear Research (CERN). Among others, the hybrid actor-critic agent is
evaluated on the actual electron beam line of the Advanced Plasma Wakefield
Experiment (AWAKE).
- Abstract(参考訳): 量子ボルツマンマシン (qbm) を用いた自由エネルギー型強化学習 (ferl) は, 古典的q-ラーニングに比べて, 離散的状態動作空間環境において, 学習効率が有意に向上することを示した。
本稿では,ferlアプローチを多次元連続状態動作空間環境に拡張し,より広い範囲の実世界アプリケーションへの扉を開く。
まず,自由エネルギーに基づくq-learningを離散的行動空間に対して検討するが,連続状態空間と経験リプレイがサンプル効率に与える影響について検討する。
第2のステップでは、古典的アクターネットワークとQBMベースの批評家を組み合わせたDeep Deterministic Policy Gradientアルゴリズムに基づいて、連続状態アクション空間に対するハイブリッドアクター批判スキームを開発した。
シミュレーションおよびD波量子アニールハードウェアを用いて得られた量子アニールの結果について考察し,古典的強化学習法と比較した。
使用した環境は、欧州原子力研究機構(CERN)の既存の粒子加速器ビームラインを表している。
中でも、advanced plasma wakefield experiment(awake)の実際の電子線上でのハイブリッドアクタ-クリティック剤の評価を行う。
関連論文リスト
- Hybrid Quantum-Classical Reinforcement Learning in Latent Observation Spaces [0.36944296923226316]
量子機械学習の最近の進歩は、古典的な制御問題に取り組むために量子法を使うことに関心を喚起している。
本稿では,古典的オートエンコーダと量子エージェントを併用して,この次元課題を解決することを提案する。
遅延空間学習法の性能解析のために, 一連の数値実験を設計する。
論文 参考訳(メタデータ) (2024-10-23T21:19:38Z) - Thermalization and Criticality on an Analog-Digital Quantum Simulator [133.58336306417294]
本稿では,69個の超伝導量子ビットからなる量子シミュレータについて述べる。
古典的Kosterlitz-Thouless相転移のシグネチャと,Kibble-Zurekスケール予測からの強い偏差を観測する。
本システムは, 対角二量体状態でディジタル的に調製し, 熱化時のエネルギーと渦の輸送を画像化する。
論文 参考訳(メタデータ) (2024-05-27T17:40:39Z) - Trainability of a quantum-classical machine in the NISQ era [0.0]
量子機械学習アルゴリズムは、制限を克服するだけでなく、彼ら自身の課題に沿う有望な道を提供する。
本研究では、教師付きトレーニングプロトコルを実装した実実験量子古典ハイブリッドシステムのトレーニング可能性の限界について検討する。
二項分類問題に焦点をあてた実験結果から,遺伝的アルゴリズムの効率性と精度が向上した。
論文 参考訳(メタデータ) (2024-01-22T16:27:14Z) - Quantum Advantage Actor-Critic for Reinforcement Learning [5.579028648465784]
本稿では,Advantage Actor-Criticアルゴリズムと変分量子回路を組み合わせた新しい量子強化学習手法を提案する。
複数の量子アドバンテージ・アクター・クリティカル構成をよく知られたカートポール環境で実証的にテストし、連続的な状態空間を持つ制御タスクにおける我々のアプローチを評価する。
論文 参考訳(メタデータ) (2024-01-13T11:08:45Z) - Re-exploring Control Strategies in a Non-Markovian Open Quantum System
by Reinforcement Learning [0.0]
複素分子系におけるUV領域における2つの励起電子状態の重ね合わせを目標とした最近の最適制御シミュレーションを再検討する。
我々は、この制御を強化学習の観点から再考し、従来の量子制御法に代わる効率的な代替手段を提供する。
論文 参考訳(メタデータ) (2023-12-19T04:44:32Z) - Simulating Gaussian boson sampling quantum computers [68.8204255655161]
実験的なガウスボソンサンプリングネットワークをシミュレートする最近の理論手法について概説する。
主に、量子力学の位相空間表現を使用する手法に焦点を当てる。
GBSの理論、最近の実験、その他の手法についても概説する。
論文 参考訳(メタデータ) (2023-08-02T02:03:31Z) - Neural-network quantum states for ultra-cold Fermi gases [49.725105678823915]
この研究は、メッセージパッシングアーキテクチャに基づいたバックフロー変換を含む、新しいPfaffian-Jastrowニューラルネットワーク量子状態を導入する。
逆スピン対分布関数による強いペアリング相関の出現を観察する。
この結果から, ニューラルネットワーク量子状態は, 超低温フェルミガスの研究に有望な戦略をもたらすことが示唆された。
論文 参考訳(メタデータ) (2023-05-15T17:46:09Z) - Quantum enhancement of qutrit dynamics through driving field and
photonic band-gap crystal [0.0]
PBG材料を中・古典的な駆動場として構成的に相互作用させることにより,興味のあるすべての量子特性を著しく向上させることを示す。
この結果から,量子ビットではなく量子プロセッサの代替候補として期待できる量子力学系における量子特性の保存と向上に関する知見が得られた。
論文 参考訳(メタデータ) (2022-01-25T19:54:15Z) - Enhancement of quantum correlations and geometric phase for a driven
bipartite quantum system in a structured environment [77.34726150561087]
構造環境下で進化する初期最大絡み合い状態における運転の役割について検討した。
この知識は、散逸動力学の下で量子特性を最もよく保持する物理装置の探索に役立つ。
論文 参考訳(メタデータ) (2021-03-18T21:11:37Z) - Assessment of weak-coupling approximations on a driven two-level system
under dissipation [58.720142291102135]
我々は, 減散を伴うリウヴィル・ヴォン方程式(Liouville-von equation)と呼ばれる数値的正確かつ非摂動的手法を用いて, 駆動量子ビットについて検討した。
我々は、駆動された量子ビットの定常状態を予測する上で、リンドブラッド方程式の妥当性の規則をマップするために実験で用いられる計量を提案する。
論文 参考訳(メタデータ) (2020-11-11T22:45:57Z) - Method of spectral Green functions in driven open quantum dynamics [77.34726150561087]
オープン量子力学のシミュレーションのために,スペクトルグリーン関数に基づく新しい手法を提案する。
この形式主義は、場の量子論におけるグリーン関数の使用と顕著な類似性を示している。
本手法は,完全マスター方程式の解法に基づくシミュレーションと比較して計算コストを劇的に削減する。
論文 参考訳(メタデータ) (2020-06-04T09:41:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。