論文の概要: Hybrid actor-critic algorithm for quantum reinforcement learning at CERN
beam lines
- arxiv url: http://arxiv.org/abs/2209.11044v1
- Date: Thu, 22 Sep 2022 14:38:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-25 18:08:30.753233
- Title: Hybrid actor-critic algorithm for quantum reinforcement learning at CERN
beam lines
- Title(参考訳): CERNビームラインにおける量子強化学習のためのハイブリッドアクター・クリティックアルゴリズム
- Authors: Michael Schenk, El\'ias F. Combarro, Michele Grossi, Verena Kain,
Kevin Shing Bruce Li, Mircea-Marian Popa, Sofia Vallecorsa
- Abstract要約: クランプ量子ボルツマンマシン(QBM)を用いた自由エネルギーベース強化学習(FERL)は学習効率を著しく向上することを示した。
本稿では、FERLアプローチを多次元連続状態-作用空間環境に拡張する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Free energy-based reinforcement learning (FERL) with clamped quantum
Boltzmann machines (QBM) was shown to significantly improve the learning
efficiency compared to classical Q-learning with the restriction, however, to
discrete state-action space environments. In this paper, the FERL approach is
extended to multi-dimensional continuous state-action space environments to
open the doors for a broader range of real-world applications. First, free
energy-based Q-learning is studied for discrete action spaces, but continuous
state spaces and the impact of experience replay on sample efficiency is
assessed. In a second step, a hybrid actor-critic scheme for continuous
state-action spaces is developed based on the Deep Deterministic Policy
Gradient algorithm combining a classical actor network with a QBM-based critic.
The results obtained with quantum annealing, both simulated and with D-Wave
quantum annealing hardware, are discussed, and the performance is compared to
classical reinforcement learning methods. The environments used throughout
represent existing particle accelerator beam lines at the European Organisation
for Nuclear Research (CERN). Among others, the hybrid actor-critic agent is
evaluated on the actual electron beam line of the Advanced Plasma Wakefield
Experiment (AWAKE).
- Abstract(参考訳): 量子ボルツマンマシン (qbm) を用いた自由エネルギー型強化学習 (ferl) は, 古典的q-ラーニングに比べて, 離散的状態動作空間環境において, 学習効率が有意に向上することを示した。
本稿では,ferlアプローチを多次元連続状態動作空間環境に拡張し,より広い範囲の実世界アプリケーションへの扉を開く。
まず,自由エネルギーに基づくq-learningを離散的行動空間に対して検討するが,連続状態空間と経験リプレイがサンプル効率に与える影響について検討する。
第2のステップでは、古典的アクターネットワークとQBMベースの批評家を組み合わせたDeep Deterministic Policy Gradientアルゴリズムに基づいて、連続状態アクション空間に対するハイブリッドアクター批判スキームを開発した。
シミュレーションおよびD波量子アニールハードウェアを用いて得られた量子アニールの結果について考察し,古典的強化学習法と比較した。
使用した環境は、欧州原子力研究機構(CERN)の既存の粒子加速器ビームラインを表している。
中でも、advanced plasma wakefield experiment(awake)の実際の電子線上でのハイブリッドアクタ-クリティック剤の評価を行う。
関連論文リスト
- PPO-Q: Proximal Policy Optimization with Parametrized Quantum Policies or Values [5.260281988042923]
PPO-Qは、PPOアルゴリズムのアクターまたは批判部分にハイブリッド量子古典的ネットワークを統合する。
PPO-Qは、訓練パラメータを著しく減らした複雑な環境において、最先端の性能を達成する。
論文 参考訳(メタデータ) (2025-01-13T06:40:40Z) - Polynomially efficient quantum enabled variational Monte Carlo for training neural-network quantum states for physico-chemical applications [0.0]
ニューラルネットワーク量子状態(NQS)は、物理系に対する従来の変分アンゼの代替を提供する。
エネルギーベースのフレームワークは、統計物理学を利用して量子状態をエネルギーランドスケープにマッピングし、メモリディスクリプタとして機能する。
このようなモデルは、量子デバイスによって強化されたモンテカルロ技術を用いて効率的に訓練できることを示す。
論文 参考訳(メタデータ) (2024-12-16T23:11:41Z) - Bayesian Quantum Amplitude Estimation [49.1574468325115]
本稿では,量子振幅推定のための雑音対応ベイズアルゴリズムであるBAEを紹介する。
我々は,BAEがハイゼンベルク限界推定を達成し,他の手法と比較した。
論文 参考訳(メタデータ) (2024-12-05T18:09:41Z) - Hybrid Quantum-Classical Reinforcement Learning in Latent Observation Spaces [0.36944296923226316]
量子機械学習の最近の進歩は、古典的な制御問題に取り組むために量子法を使うことに関心を喚起している。
本稿では,古典的オートエンコーダと量子エージェントを併用して,この次元課題を解決することを提案する。
遅延空間学習法の性能解析のために, 一連の数値実験を設計する。
論文 参考訳(メタデータ) (2024-10-23T21:19:38Z) - Thermalization and Criticality on an Analog-Digital Quantum Simulator [133.58336306417294]
本稿では,69個の超伝導量子ビットからなる量子シミュレータについて述べる。
古典的Kosterlitz-Thouless相転移のシグネチャと,Kibble-Zurekスケール予測からの強い偏差を観測する。
本システムは, 対角二量体状態でディジタル的に調製し, 熱化時のエネルギーと渦の輸送を画像化する。
論文 参考訳(メタデータ) (2024-05-27T17:40:39Z) - Practicality of training a quantum-classical machine in the NISQ era [0.0]
本研究では、イオントラッププラットフォーム上で、教師付きトレーニングプロトコルを用いた実実験量子古典ハイブリッドシステムの訓練限界について検討する。
イオントラップを結合した古典的プロセッサに関連する課題に対処し、NISQデバイスのノイズチャネルをナビゲートする古典的手法として、遺伝的アルゴリズムの$robustness$が強調される。
これらの知見は、量子古典ハイブリッドシステムの性能に関する洞察に寄与し、実用的な量子機械学習アプリケーションにおける効率的なトレーニング戦略とハードウェア考慮の重要性を強調している。
論文 参考訳(メタデータ) (2024-01-22T16:27:14Z) - Quantum Advantage Actor-Critic for Reinforcement Learning [5.579028648465784]
本稿では,Advantage Actor-Criticアルゴリズムと変分量子回路を組み合わせた新しい量子強化学習手法を提案する。
複数の量子アドバンテージ・アクター・クリティカル構成をよく知られたカートポール環境で実証的にテストし、連続的な状態空間を持つ制御タスクにおける我々のアプローチを評価する。
論文 参考訳(メタデータ) (2024-01-13T11:08:45Z) - Neural-network quantum states for ultra-cold Fermi gases [49.725105678823915]
この研究は、メッセージパッシングアーキテクチャに基づいたバックフロー変換を含む、新しいPfaffian-Jastrowニューラルネットワーク量子状態を導入する。
逆スピン対分布関数による強いペアリング相関の出現を観察する。
この結果から, ニューラルネットワーク量子状態は, 超低温フェルミガスの研究に有望な戦略をもたらすことが示唆された。
論文 参考訳(メタデータ) (2023-05-15T17:46:09Z) - Enhancement of quantum correlations and geometric phase for a driven
bipartite quantum system in a structured environment [77.34726150561087]
構造環境下で進化する初期最大絡み合い状態における運転の役割について検討した。
この知識は、散逸動力学の下で量子特性を最もよく保持する物理装置の探索に役立つ。
論文 参考訳(メタデータ) (2021-03-18T21:11:37Z) - Assessment of weak-coupling approximations on a driven two-level system
under dissipation [58.720142291102135]
我々は, 減散を伴うリウヴィル・ヴォン方程式(Liouville-von equation)と呼ばれる数値的正確かつ非摂動的手法を用いて, 駆動量子ビットについて検討した。
我々は、駆動された量子ビットの定常状態を予測する上で、リンドブラッド方程式の妥当性の規則をマップするために実験で用いられる計量を提案する。
論文 参考訳(メタデータ) (2020-11-11T22:45:57Z) - Method of spectral Green functions in driven open quantum dynamics [77.34726150561087]
オープン量子力学のシミュレーションのために,スペクトルグリーン関数に基づく新しい手法を提案する。
この形式主義は、場の量子論におけるグリーン関数の使用と顕著な類似性を示している。
本手法は,完全マスター方程式の解法に基づくシミュレーションと比較して計算コストを劇的に削減する。
論文 参考訳(メタデータ) (2020-06-04T09:41:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。