論文の概要: Robustness and Generalization in Quantum Reinforcement Learning via Lipschitz Regularization
- arxiv url: http://arxiv.org/abs/2410.21117v1
- Date: Mon, 28 Oct 2024 15:20:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:16:02.719984
- Title: Robustness and Generalization in Quantum Reinforcement Learning via Lipschitz Regularization
- Title(参考訳): リプシッツ正規化による量子強化学習におけるロバスト性と一般化
- Authors: Nico Meyer, Julian Berberich, Christopher Mutschler, Daniel D. Scherer,
- Abstract要約: 本稿では、RegQPGアルゴリズムと呼ばれる量子ポリシー勾配アプローチの正規化バージョンを提案する。
本稿では、RegQPGによるトレーニングにより、その結果のロバスト性や一般化が向上することを示す。
- 参考スコア(独自算出の注目度): 2.8445375187526154
- License:
- Abstract: Quantum machine learning leverages quantum computing to enhance accuracy and reduce model complexity compared to classical approaches, promising significant advancements in various fields. Within this domain, quantum reinforcement learning has garnered attention, often realized using variational quantum circuits to approximate the policy function. This paper addresses the robustness and generalization of quantum reinforcement learning by combining principles from quantum computing and control theory. Leveraging recent results on robust quantum machine learning, we utilize Lipschitz bounds to propose a regularized version of a quantum policy gradient approach, named the RegQPG algorithm. We show that training with RegQPG improves the robustness and generalization of the resulting policies. Furthermore, we introduce an algorithmic variant that incorporates curriculum learning, which minimizes failures during training. Our findings are validated through numerical experiments, demonstrating the practical benefits of our approach.
- Abstract(参考訳): 量子機械学習は量子コンピューティングを活用し、古典的なアプローチに比べて精度を高め、モデルの複雑さを低減する。
この領域内では、量子強化学習が注目され、しばしばポリシー関数を近似するために変分量子回路を用いて実現された。
本稿では、量子コンピューティングと制御理論の原理を組み合わせることで、量子強化学習の堅牢性と一般化について論じる。
堅牢な量子機械学習の最近の成果を活用して、Lipschitz境界を用いて、RegQPGアルゴリズムと呼ばれる量子ポリシー勾配アプローチの正規化版を提案する。
本稿では、RegQPGによるトレーニングにより、その結果のロバスト性や一般化が向上することを示す。
さらに,カリキュラム学習を取り入れたアルゴリズム的変種を導入し,学習中の障害を最小限に抑える。
数値実験により,本手法の実用的メリットを実証し,本手法の有効性を検証した。
関連論文リスト
- Efficient Learning for Linear Properties of Bounded-Gate Quantum Circuits [63.733312560668274]
d可変RZゲートとG-dクリフォードゲートを含む量子回路を与えられた場合、学習者は純粋に古典的な推論を行い、その線形特性を効率的に予測できるだろうか?
我々は、d で線形にスケーリングするサンプルの複雑さが、小さな予測誤差を達成するのに十分であり、対応する計算の複雑さは d で指数関数的にスケールすることを証明する。
我々は,予測誤差と計算複雑性をトレードオフできるカーネルベースの学習モデルを考案し,多くの実践的な環境で指数関数からスケーリングへ移行した。
論文 参考訳(メタデータ) (2024-08-22T08:21:28Z) - Separable Power of Classical and Quantum Learning Protocols Through the Lens of No-Free-Lunch Theorem [70.42372213666553]
No-Free-Lunch(NFL)定理は、最適化プロセスに関係なく問題とデータ非依存の一般化誤差を定量化する。
我々は、様々な量子学習アルゴリズムを、特定の観測可能条件下で量子力学を学習するために設計された3つの学習プロトコルに分類する。
得られたNFL定理は, CLC-LP, ReQu-LP, Qu-LPにまたがるサンプルの複雑性を2次的に低減することを示した。
この性能差は、非直交量子状態のグローバル位相に関する情報を間接的に活用するために、量子関連学習プロトコルのユニークな能力に起因している。
論文 参考訳(メタデータ) (2024-05-12T09:05:13Z) - Quantum Advantage Actor-Critic for Reinforcement Learning [5.579028648465784]
本稿では,Advantage Actor-Criticアルゴリズムと変分量子回路を組み合わせた新しい量子強化学習手法を提案する。
複数の量子アドバンテージ・アクター・クリティカル構成をよく知られたカートポール環境で実証的にテストし、連続的な状態空間を持つ制御タスクにおける我々のアプローチを評価する。
論文 参考訳(メタデータ) (2024-01-13T11:08:45Z) - Quantum Annealing for Single Image Super-Resolution [86.69338893753886]
単一画像超解像(SISR)問題を解くために,量子コンピューティングに基づくアルゴリズムを提案する。
提案したAQCアルゴリズムは、SISRの精度を維持しつつ、古典的なアナログよりも向上したスピードアップを実現する。
論文 参考訳(メタデータ) (2023-04-18T11:57:15Z) - Quantum Policy Gradient Algorithm with Optimized Action Decoding [1.3946033794136758]
動作選択に必要な古典的後処理を最適化するための,新しい品質指標を提案する。
この手法により,5キュービットのハードウェアデバイス上で,フルトレーニングルーチンの実行に成功した。
論文 参考訳(メタデータ) (2022-12-13T15:42:10Z) - Quantum Reinforcement Learning via Policy Iteration [6.961253535504979]
政策反復による量子強化学習を行うための一般的なフレームワークを提供する。
無限の地平線割引問題に対するEmphquantum Policy Evaluation法の設計と分析により、我々の枠組みを検証する。
本稿では,OpenAI の Gym を用いた2つの環境における量子アルゴリズムの理論的および実験的性能について検討する。
論文 参考訳(メタデータ) (2022-03-03T18:08:17Z) - Circuit Symmetry Verification Mitigates Quantum-Domain Impairments [69.33243249411113]
本稿では,量子状態の知識を必要とせず,量子回路の可換性を検証する回路指向対称性検証を提案する。
特に、従来の量子領域形式を回路指向安定化器に一般化するフーリエ時間安定化器(STS)手法を提案する。
論文 参考訳(メタデータ) (2021-12-27T21:15:35Z) - Variational Quantum Soft Actor-Critic [1.90365714903665]
本研究では,連続制御の最先端手法の一つであるソフトアクター批判に基づく量子強化学習アルゴリズムを開発した。
この量子版のソフトアクター・クリティックは、調整可能なパラメータをはるかに少なくして、オリジナルのソフトアクター・クリティックに匹敵することを示す。
論文 参考訳(メタデータ) (2021-12-20T06:31:06Z) - Quantum algorithms for quantum dynamics: A performance study on the
spin-boson model [68.8204255655161]
量子力学シミュレーションのための量子アルゴリズムは、伝統的に時間進化作用素のトロッター近似の実装に基づいている。
変分量子アルゴリズムは欠かせない代替手段となり、現在のハードウェア上での小規模なシミュレーションを可能にしている。
量子ゲートコストが明らかに削減されているにもかかわらず、現在の実装における変分法は量子的優位性をもたらすことはありそうにない。
論文 参考訳(メタデータ) (2021-08-09T18:00:05Z) - On exploring the potential of quantum auto-encoder for learning quantum systems [60.909817434753315]
そこで我々は,古典的な3つのハードラーニング問題に対処するために,QAEに基づく効果的な3つの学習プロトコルを考案した。
私たちの研究は、ハード量子物理学と量子情報処理タスクを達成するための高度な量子学習アルゴリズムの開発に新たな光を当てています。
論文 参考訳(メタデータ) (2021-06-29T14:01:40Z) - Variational quantum policies for reinforcement learning [0.0]
変分量子回路は近年、量子機械学習モデルとして人気を集めている。
本研究では,変動量子回路に基づく強化学習ポリシの構築と訓練について検討する。
論文 参考訳(メタデータ) (2021-03-09T17:33:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。