論文の概要: Benchmarking Quantum Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2502.04909v1
- Date: Fri, 07 Feb 2025 13:28:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 14:56:15.527341
- Title: Benchmarking Quantum Reinforcement Learning
- Title(参考訳): 量子強化学習のベンチマーク
- Authors: Georg Kruse, Rodrigo Coelho, Andreas Rosskopf, Robert Wille, Jeanette-Miriam Lorenz,
- Abstract要約: 量子強化学習(QRL)は、量子力学の原理を活用して強化学習(RL)アルゴリズムの性能を向上させる、有望な研究分野として登場した。
QRLが古典的なRLに対して人工的な問題定式化以上の優位性を示すかどうかはまだ不明である。
QRL研究のどのストリームが最大の可能性を示すのかは、まだ明らかになっていない。
- 参考スコア(独自算出の注目度): 2.536162003546062
- License:
- Abstract: Quantum Reinforcement Learning (QRL) has emerged as a promising research field, leveraging the principles of quantum mechanics to enhance the performance of reinforcement learning (RL) algorithms. However, despite its growing interest, QRL still faces significant challenges. It is still uncertain if QRL can show any advantage over classical RL beyond artificial problem formulations. Additionally, it is not yet clear which streams of QRL research show the greatest potential. The lack of a unified benchmark and the need to evaluate the reliance on quantum principles of QRL approaches are pressing questions. This work aims to address these challenges by providing a comprehensive comparison of three major QRL classes: Parameterized Quantum Circuit based QRL (PQC-QRL) (with one policy gradient (QPG) and one Q-Learning (QDQN) algorithm), Free Energy based QRL (FE-QRL), and Amplitude Amplification based QRL (AA-QRL). We introduce a set of metrics to evaluate the QRL algorithms on the widely applicable benchmark of gridworld games. Our results provide a detailed analysis of the strengths and weaknesses of the QRL classes, shedding light on the role of quantum principles in QRL and paving the way for future research in this field.
- Abstract(参考訳): 量子強化学習(QRL)は、量子力学の原理を活用して強化学習(RL)アルゴリズムの性能を向上させる、有望な研究分野として登場した。
しかし、QRLの関心は高まりつつあるものの、QRLは依然として大きな課題に直面している。
QRLが古典的なRLに対して人工的な問題定式化以上の優位性を示すかどうかはまだ不明である。
さらに、QRL研究のどのストリームが最大の可能性を示すのかは、まだ明らかになっていない。
統一ベンチマークの欠如とQRLアプローチの量子原理への依存を評価する必要性は、疑問を呈している。
本研究の目的は、パラメータ化量子回路に基づくQRL(PQC-QRL)と1つのポリシー勾配(QPG)と1つのQ-Learning(QDQN)アルゴリズム、自由エネルギーベースのQRL(FE-QRL)、振幅増幅ベースのQRL(AA-QRL)の3つの主要なQRLクラスを包括的に比較することにある。
広範に適用可能なグリッドワールドゲームベンチマークにおいて,QRLアルゴリズムを評価するためのメトリクスセットを紹介する。
この結果はQRLクラスの長所と短所を詳細に分析し、QRLにおける量子原理の役割に光を当て、この分野における今後の研究の道を開くものである。
関連論文リスト
- SF-DQN: Provable Knowledge Transfer using Successor Feature for Deep Reinforcement Learning [89.04776523010409]
本稿では、複数のRL問題が異なる報酬関数を持つが、基礎となる遷移力学を共有する転写強化学習(RL)問題を考察する。
この設定では、各RL問題(タスク)のQ-関数を後継特徴(SF)と報酬マッピングに分解することができる。
GPIを用いたSF-DQNの証明可能な一般化保証を用いた最初の収束解析を確立する。
論文 参考訳(メタデータ) (2024-05-24T20:30:14Z) - Efficient quantum recurrent reinforcement learning via quantum reservoir
computing [3.6881738506505988]
量子強化学習(QRL)は、シーケンシャルな意思決定タスクを解決するためのフレームワークとして登場した。
本研究は、QRNNベースの量子長短期メモリ(QLSTM)を用いたQRLエージェントの構築により、この課題に対処する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-13T22:18:38Z) - Quantum Imitation Learning [74.15588381240795]
本稿では、量子優位性を利用してILを高速化する量子模倣学習(QIL)を提案する。
量子行動クローニング(Q-BC)と量子生成逆模倣学習(Q-GAIL)という2つのQILアルゴリズムを開発した。
実験結果から,Q-BCとQ-GAILの両者が,従来のものと同等の性能を達成できることが判明した。
論文 参考訳(メタデータ) (2023-04-04T12:47:35Z) - Optimal Goal-Reaching Reinforcement Learning via Quasimetric Learning [73.80728148866906]
準メトリック強化学習(QRL)は、準メトリックモデルを用いて最適な値関数を学習する新しいRL法である。
オフラインおよびオンラインの目標達成ベンチマークでは、QRLはサンプル効率とパフォーマンスが改善されている。
論文 参考訳(メタデータ) (2023-04-03T17:59:58Z) - Asynchronous training of quantum reinforcement learning [0.8702432681310399]
変分量子回路(VQC)による量子RLエージェント構築の先導的手法
本稿では,QRLエージェントを非同期トレーニングすることで,この問題に対処する。
検討したタスクにおいて,QRLエージェントの非同期トレーニングが性能に匹敵するか,優れているかを数値シミュレーションで示す。
論文 参考訳(メタデータ) (2023-01-12T15:54:44Z) - Quantum deep recurrent reinforcement learning [0.8702432681310399]
強化学習(Reinforcement Learning、RL)は、複雑なシーケンシャルな意思決定問題を解決するために使用できる機械学習(ML)パラダイムの1つである。
QRLエージェントのコアとなるために、量子長短期メモリ(QLSTM)を構築し、Q$-learningでモデル全体をトレーニングします。
QLSTM-DRQNは従来のDRQNよりも安定で平均スコアの高いCart-Poleのような標準ベンチマークを解くことができる。
論文 参考訳(メタデータ) (2022-10-26T17:29:19Z) - LCRL: Certified Policy Synthesis via Logically-Constrained Reinforcement
Learning [78.2286146954051]
LCRLは未知決定プロセス(MDP)上でのモデルフリー強化学習(RL)アルゴリズムを実装している
本稿では,LCRLの適用性,使いやすさ,拡張性,性能を示すケーススタディを提案する。
論文 参考訳(メタデータ) (2022-09-21T13:21:00Z) - Optimizing Tensor Network Contraction Using Reinforcement Learning [86.05566365115729]
本稿では,グラフニューラルネットワーク(GNN)と組み合わせた強化学習(RL)手法を提案する。
この問題は、巨大な検索スペース、重い尾の報酬分布、そして困難なクレジット割り当てのために非常に難しい。
GNNを基本方針として利用するRLエージェントが,これらの課題にどのように対処できるかを示す。
論文 参考訳(メタデータ) (2022-04-18T21:45:13Z) - Quantum Multi-Agent Reinforcement Learning via Variational Quantum
Circuit Design [16.53719091025918]
本稿では、QRLを量子マルチエージェントRL(QMARL)に拡張し、実証する。
ノイズ中間スケール量子(NISQ)と古典的マルチエージェントRL(MARL)の非定常特性のため、QRLからQMARLへの拡張は簡単ではない。
提案されたQMARLフレームワークは、古典的なフレームワークよりも57.7%の報酬を得られる。
論文 参考訳(メタデータ) (2022-03-20T03:44:45Z) - Quantum agents in the Gym: a variational quantum algorithm for deep
Q-learning [0.0]
本稿では、離散的かつ連続的な状態空間に対するRLタスクを解くために使用できるパラメタライズド量子回路(PQC)のトレーニング手法を提案する。
量子Q学習エージェントのどのアーキテクチャ選択が、特定の種類の環境をうまく解決するのに最も重要であるかを検討する。
論文 参考訳(メタデータ) (2021-03-28T08:57:22Z) - EMaQ: Expected-Max Q-Learning Operator for Simple Yet Effective Offline
and Online RL [48.552287941528]
オフ・ポリティクス強化学習は、意思決定ポリシーのサンプル効率の学習を約束する。
オフラインのRL設定では、標準のオフポリシーのRLメソッドは大幅に性能が低下する。
本稿では,提案アルゴリズムとより密接な関係を持つ期待値Q-Learning(EMaQ)を提案する。
論文 参考訳(メタデータ) (2020-07-21T21:13:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。