論文の概要: The Quantum Cartpole: A benchmark environment for non-linear
reinforcement learning
- arxiv url: http://arxiv.org/abs/2311.00756v2
- Date: Sun, 10 Mar 2024 11:58:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 15:28:18.140620
- Title: The Quantum Cartpole: A benchmark environment for non-linear
reinforcement learning
- Title(参考訳): 量子カルトポール:非線形強化学習のためのベンチマーク環境
- Authors: Kai Meinerz, Simon Trebst, Mark Rudner, Evert van Nieuwenburg
- Abstract要約: 状態推定と制御可能性のトレードオフがどのように生じるかを示す。
本稿では、転送学習を用いて強化学習を通して訓練された量子制御エージェントを開発する可能性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Feedback-based control is the de-facto standard when it comes to controlling
classical stochastic systems and processes. However, standard feedback-based
control methods are challenged by quantum systems due to measurement induced
backaction and partial observability. Here we remedy this by using weak quantum
measurements and model-free reinforcement learning agents to perform quantum
control. By comparing control algorithms with and without state estimators to
stabilize a quantum particle in an unstable state near a local potential energy
maximum, we show how a trade-off between state estimation and controllability
arises. For the scenario where the classical analogue is highly nonlinear, the
reinforcement learned controller has an advantage over the standard controller.
Additionally, we demonstrate the feasibility of using transfer learning to
develop a quantum control agent trained via reinforcement learning on a
classical surrogate of the quantum control problem. Finally, we present results
showing how the reinforcement learning control strategy differs from the
classical controller in the non-linear scenarios.
- Abstract(参考訳): フィードバックベースの制御は、古典的な確率システムやプロセスの制御に関してデファクトスタンダードである。
しかし、標準フィードバックに基づく制御法は、測定によるバックアクションと部分的可観測性のために量子システムによって挑戦される。
ここでは,弱量子計測とモデルフリー強化学習エージェントを用いて量子制御を行う。
制御アルゴリズムと状態推定器とを比較して、局所ポテンシャルエネルギー最大値付近の不安定な状態で量子粒子を安定化させることにより、状態推定と制御性の間のトレードオフが生じることを示す。
古典的アナログが非常に非線形なシナリオでは、強化学習された制御器は標準制御器よりも有利である。
さらに, 量子制御問題の古典的サロゲート上で強化学習により訓練された量子制御エージェントを開発するために, 転送学習を用いた場合の可能性を示す。
最後に,非線形シナリオにおいて,強化学習制御戦略が古典型コントローラとどのように異なるかを示す。
関連論文リスト
- Quantum control by the environment: Turing uncomputability, Optimization over Stiefel manifolds, Reachable sets, and Incoherent GRAPE [56.47577824219207]
多くの現実的な状況において、制御された量子系は環境と相互作用する。
本稿では,環境を資源として利用したオープン量子システムの制御に関するいくつかの結果について概説する。
論文 参考訳(メタデータ) (2024-03-20T10:09:13Z) - Effect of the readout efficiency of quantum measurement on the system entanglement [44.99833362998488]
非効率なモニタリングの下で、1d量子ランダムウォークにおける粒子の絡み合いを定量化する。
測定によって引き起こされる量子-古典的交叉における系の最大平均絡み合いは、測定強度と非効率性によって異なる方法であることがわかった。
論文 参考訳(メタデータ) (2024-02-29T18:10:05Z) - A quantum system control method based on enhanced reinforcement learning [2.70857393901228]
強化強化学習(QSC-ERL)に基づく量子システム制御法を提案する。
強化学習における状態と行動は、量子系の量子状態と制御操作にマッピングされる。
他の方法と比較して、QSC-ERLは量子システムの1倍近い忠実度学習制御を達成する。
論文 参考訳(メタデータ) (2023-09-30T03:22:44Z) - Classical Verification of Quantum Learning [42.362388367152256]
量子学習の古典的検証のための枠組みを開発する。
そこで我々は,新しい量子データアクセスモデルを提案し,これを"mixture-of-superpositions"量子例と呼ぶ。
この結果から,学習課題における量子データの潜在能力は無限ではないものの,古典的エージェントが活用できることが示唆された。
論文 参考訳(メタデータ) (2023-06-08T00:31:27Z) - Learning in quantum games [41.67943127631515]
誘導量子状態ダイナミクスは (i) 系の固有値の力学を支配する古典的可換成分に分解されることを示す。
FTQLのダイナミクスは、全ての量子ゲームにおいて常に後悔することしか起こらない。
論文 参考訳(メタデータ) (2023-02-05T08:23:04Z) - Robust optimization for quantum reinforcement learning control using
partial observations [10.975734427172231]
量子状態の完全な観測は、量子ビット数に対する必要な量子測定数の指数的スケーリングのために実験的に不可能である。
この制御方式は、ノイズが一般的である短期量子デバイスと互換性がある。
騒音振幅が制御振幅と同じレベルであっても、高忠実度状態制御が達成できることが示されている。
論文 参考訳(メタデータ) (2022-06-29T06:30:35Z) - Self-Correcting Quantum Many-Body Control using Reinforcement Learning
with Tensor Networks [0.0]
本稿では、強化学習(RL)に基づく量子多体系を効率的に制御するための新しい枠組みを提案する。
我々は、RLエージェントが普遍的な制御を見出すことができ、多くの身体状態を最適に制御する方法を学ぶことができ、量子力学が摂動を受けるとき、制御プロトコルをオンザフライで適用できることを示した。
論文 参考訳(メタデータ) (2022-01-27T20:14:09Z) - Stochastic optimization for learning quantum state feedback control [16.4432244108711]
量子非破壊測定を用いたオープン量子システムのためのディープフィードバックネットワークのトレーニングフレームワークを提案する。
本手法は, 並列化性, オープンなシステム間相互作用に対する堅牢性, およびシミュレーションにおけるランドマーク状態フィードバック制御結果よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-18T19:00:06Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Model-Free Quantum Control with Reinforcement Learning [0.0]
本研究では,量子制御タスクにおける強化学習エージェントをモデル無しで学習するための回路ベースアプローチを提案する。
実験可能な観測機器の測定値を用いて学習エージェントに報奨を与える方法を示す。
このアプローチは、サンプル効率の観点から、広く使われているモデルフリーメソッドよりも大幅に優れている。
論文 参考訳(メタデータ) (2021-04-29T17:53:26Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。