論文の概要: Benchmarking Quantum Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2501.15893v1
- Date: Mon, 27 Jan 2025 09:40:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:58:10.582038
- Title: Benchmarking Quantum Reinforcement Learning
- Title(参考訳): 量子強化学習のベンチマーク
- Authors: Nico Meyer, Christian Ufrecht, George Yammine, Georgios Kontes, Christopher Mutschler, Daniel D. Scherer,
- Abstract要約: 量子コンピューティングの出現とその量子強化学習(QRL)への応用は、さらなるベンチマークの取り組みを複雑にしている。
本稿では,サンプルの複雑性を統計的に推定する手法と,統計的性能の定義に基づく新しいベンチマーク手法を提案する。
これらの結果の潜在的な限界について論じ、QRLにおける量子優位性に関する実証的研究にその影響について考察する。
- 参考スコア(独自算出の注目度): 2.5882725323376112
- License:
- Abstract: Benchmarking and establishing proper statistical validation metrics for reinforcement learning (RL) remain ongoing challenges, where no consensus has been established yet. The emergence of quantum computing and its potential applications in quantum reinforcement learning (QRL) further complicate benchmarking efforts. To enable valid performance comparisons and to streamline current research in this area, we propose a novel benchmarking methodology, which is based on a statistical estimator for sample complexity and a definition of statistical outperformance. Furthermore, considering QRL, our methodology casts doubt on some previous claims regarding its superiority. We conducted experiments on a novel benchmarking environment with flexible levels of complexity. While we still identify possible advantages, our findings are more nuanced overall. We discuss the potential limitations of these results and explore their implications for empirical research on quantum advantage in QRL.
- Abstract(参考訳): 強化学習(RL)のための適切な統計的検証指標のベンチマークと確立は、まだ合意が得られていない現在、進行中の課題である。
量子コンピューティングの出現とその量子強化学習(QRL)への応用は、さらなるベンチマークの取り組みを複雑にしている。
有効な性能比較と,本領域における現在の研究の合理化を図るため,サンプルの複雑性の統計的推定と統計的アウトパフォーマンスの定義に基づく新しいベンチマーク手法を提案する。
さらに,QRLを考慮し,その優位性に関する過去の主張に疑問を呈している。
フレキシブルな複雑性を持つ新しいベンチマーク環境で実験を行った。
可能性はまだ明らかですが、私たちの発見は全体としては微妙です。
これらの結果の潜在的な限界について論じ、QRLにおける量子優位性に関する実証的研究にその影響について考察する。
関連論文リスト
- Uncertainty quantification for Markov chains with application to temporal difference learning [63.49764856675643]
マルコフ連鎖のベクトル値および行列値関数に対する新しい高次元濃度不等式とベリー・エッシー境界を開発する。
我々は、強化学習における政策評価に広く用いられているTD学習アルゴリズムを解析する。
論文 参考訳(メタデータ) (2025-02-19T15:33:55Z) - Unifying (Quantum) Statistical and Parametrized (Quantum) Algorithms [65.268245109828]
我々はカーンズのSQオラクルとヴァリアントの弱い評価オラクルからインスピレーションを得ます。
評価クエリから学習するための非条件の下限を出力する,広範かつ直感的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-26T18:23:21Z) - Learning unitaries with quantum statistical queries [0.0]
量子統計クエリ(QSQ)からユニタリ演算子を学習するためのいくつかのアルゴリズムを提案する。
本手法は, 1つの量子統計的クエリを用いて, パウリ弦の部分集合上のユニタリのフーリエ質量を推定する新しい手法に基づく。
量子統計的クエリは,Choi-Jamiolkowski状態に対する分離可能な測定値と比較して,特定のタスクに対して指数関数的に大きなサンプル複雑性をもたらすことを示す。
論文 参考訳(メタデータ) (2023-10-03T17:56:07Z) - Efficient quantum recurrent reinforcement learning via quantum reservoir
computing [3.6881738506505988]
量子強化学習(QRL)は、シーケンシャルな意思決定タスクを解決するためのフレームワークとして登場した。
本研究は、QRNNベースの量子長短期メモリ(QLSTM)を用いたQRLエージェントの構築により、この課題に対処する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-13T22:18:38Z) - QKSAN: A Quantum Kernel Self-Attention Network [53.96779043113156]
量子カーネル法(Quantum Kernel Methods, QKM)のデータ表現能力とSAMの効率的な情報抽出能力を組み合わせた量子カーネル自己認識機構(Quantum Kernel Self-Attention Mechanism, QKSAM)を導入する。
量子カーネル自己保持ネットワーク(QKSAN)フレームワークは,DMP(Dederred Measurement Principle)と条件測定技術を巧みに組み込んだQKSAMに基づいて提案されている。
4つのQKSANサブモデルはPennyLaneとIBM Qiskitプラットフォームにデプロイされ、MNISTとFashion MNISTのバイナリ分類を実行する。
論文 参考訳(メタデータ) (2023-08-25T15:08:19Z) - Uncovering Instabilities in Variational-Quantum Deep Q-Networks [0.0]
変動量子深度Q-networks (VQ-DQN) は、学習ポリシーが分岐する不安定な状態にあることを示す。
我々は、実量子処理ユニット(IBM量子デバイス)上でRLアルゴリズムを実行し、シミュレーションされた量子システムと物理量子システムの振る舞いの違いを調査する。
論文 参考訳(メタデータ) (2022-02-10T17:52:44Z) - Convergence Results For Q-Learning With Experience Replay [51.11953997546418]
コンバージェンスレート保証を行い、リプレイの頻度や回数といった重要なパラメータによってQ-ラーニングのコンバージェンスとどのように比較されるかについて議論する。
また、シンプルなMDPのクラスを導入・分析することで、これを厳格に改善する可能性を示す理論的な証拠も提示する。
論文 参考訳(メタデータ) (2021-12-08T10:22:49Z) - Quantum circuit architecture search for variational quantum algorithms [88.71725630554758]
本稿では、QAS(Quantum Architecture Search)と呼ばれるリソースと実行時の効率的なスキームを提案する。
QASは、よりノイズの多い量子ゲートを追加することで得られる利点と副作用のバランスをとるために、自動的にほぼ最適アンサッツを求める。
数値シミュレータと実量子ハードウェアの両方に、IBMクラウドを介してQASを実装し、データ分類と量子化学タスクを実現する。
論文 参考訳(メタデータ) (2020-10-20T12:06:27Z) - Cross Learning in Deep Q-Networks [82.20059754270302]
本稿では、値に基づく強化学習手法において、よく知られた過大評価問題を緩和することを目的とした、新しいクロスQ-ラーニングアルゴリズムを提案する。
本アルゴリズムは,並列モデルの集合を維持し,ランダムに選択されたネットワークに基づいてQ値を算出することによって,二重Q-ラーニングに基づいて構築する。
論文 参考訳(メタデータ) (2020-09-29T04:58:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。