論文の概要: Batch Quantum Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2305.00905v1
- Date: Thu, 27 Apr 2023 16:43:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 12:55:48.500558
- Title: Batch Quantum Reinforcement Learning
- Title(参考訳): バッチ量子強化学習
- Authors: Maniraman Periyasamy and Marc H\"olle and Marco Wiedmann and Daniel D.
Scherer and Axel Plinge and Christopher Mutschler
- Abstract要約: 離散BCQアルゴリズムにおいて,VQCを関数近似器として活用したバッチRLアルゴリズムを提案する。
我々は,OpenAI CartPole環境におけるアルゴリズムの有効性を示し,その性能を従来のニューラルネットワークベースの離散BCQと比較する。
- 参考スコア(独自算出の注目度): 1.3946033794136758
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training DRL agents is often a time-consuming process as a large number of
samples and environment interactions is required. This effect is even amplified
in the case of Batch RL, where the agent is trained without environment
interactions solely based on a set of previously collected data. Novel
approaches based on quantum computing suggest an advantage compared to
classical approaches in terms of sample efficiency. To investigate this
advantage, we propose a batch RL algorithm leveraging VQC as function
approximators in the discrete BCQ algorithm. Additionally, we present a novel
data re-uploading scheme based on cyclically shifting the input variables'
order in the data encoding layers. We show the efficiency of our algorithm on
the OpenAI CartPole environment and compare its performance to classical neural
network-based discrete BCQ.
- Abstract(参考訳): DRLエージェントの訓練は、多くのサンプルと環境相互作用を必要とするため、しばしば時間を要する。
この効果はバッチrlの場合でも増幅され、エージェントは事前に収集したデータのセットのみに基づいて環境相互作用なしでトレーニングされる。
量子コンピューティングに基づく新しいアプローチは、サンプル効率の点で古典的なアプローチと比較して利点を示唆している。
そこで本研究では,VQCを関数近似器として活用したバッチRLアルゴリズムを提案する。
さらに,データ符号化層における入力変数の順序の周期的シフトに基づく新しいデータ再ロード方式を提案する。
我々は,OpenAI CartPole環境におけるアルゴリズムの有効性を示し,その性能を従来のニューラルネットワークベースの離散BCQと比較する。
関連論文リスト
- Bandit-Driven Batch Selection for Robust Learning under Label Noise [20.202806541218944]
本稿では,SGD(Gradient Descent)トレーニングにおけるバッチ選択のための新しい手法を提案する。
本手法は,ラベルノイズの存在下での学習過程の最適化に重点を置いている。
論文 参考訳(メタデータ) (2023-10-31T19:19:01Z) - Certainty In, Certainty Out: REVQCs for Quantum Machine Learning [15.908051575681458]
高精度かつ高精度なサンプル推測が可能な統計理論について論じる。
本稿では,このトレーニング手法の有効性を,いくつかの有効な変分量子回路を用いて評価する。
論文 参考訳(メタデータ) (2023-10-16T17:53:30Z) - BatchGFN: Generative Flow Networks for Batch Active Learning [80.73649229919454]
BatchGFNは、生成フローネットワークを使用してバッチ報酬に比例したデータポイントのセットをサンプリングする、プールベースのアクティブラーニングのための新しいアプローチである。
提案手法は,おもちゃの回帰問題において,1点当たり1回の前方通過で推定時間に近距離最適効用バッチをサンプリングすることを可能にした。
論文 参考訳(メタデータ) (2023-06-26T20:41:36Z) - The Cascaded Forward Algorithm for Neural Network Training [61.06444586991505]
本稿では,ニューラルネットワークのための新しい学習フレームワークであるCascaded Forward(CaFo)アルゴリズムを提案する。
FFとは異なり、我々のフレームワークは各カスケードブロックのラベル分布を直接出力する。
我々のフレームワークでは、各ブロックは独立して訓練できるので、並列加速度システムに容易に展開できる。
論文 参考訳(メタデータ) (2023-03-17T02:01:11Z) - A didactic approach to quantum machine learning with a single qubit [68.8204255655161]
我々は、データ再ロード技術を用いて、単一のキュービットで学習するケースに焦点を当てる。
我々は、Qiskit量子コンピューティングSDKを用いて、おもちゃと現実世界のデータセットに異なる定式化を実装した。
論文 参考訳(メタデータ) (2022-11-23T18:25:32Z) - A Stable, Fast, and Fully Automatic Learning Algorithm for Predictive
Coding Networks [65.34977803841007]
予測符号化ネットワークは、ベイズ統計学と神経科学の両方にルーツを持つ神経科学にインスパイアされたモデルである。
シナプス重みに対する更新規則の時間的スケジュールを変更するだけで、元の規則よりもずっと効率的で安定したアルゴリズムが得られることを示す。
論文 参考訳(メタデータ) (2022-11-16T00:11:04Z) - Composably secure data processing for Gaussian-modulated continuous
variable quantum key distribution [58.720142291102135]
連続可変量子鍵分布(QKD)は、ボソニックモードの二次構造を用いて、2つのリモートパーティ間の秘密鍵を確立する。
構成可能な有限サイズセキュリティの一般的な設定におけるホモダイン検出プロトコルについて検討する。
特に、ハイレート(非バイナリ)の低密度パリティチェックコードを使用する必要のあるハイシグネチャ・ツー・ノイズ・システマを解析する。
論文 参考訳(メタデータ) (2021-03-30T18:02:55Z) - Attentive Gaussian processes for probabilistic time-series generation [4.94950858749529]
本稿では,ガウス過程の回帰と組み合わせて実数値列を生成する,計算効率のよいアテンションベースネットワークを提案する。
我々は,GPがフルバッチを用いて訓練されている間,ネットワークのミニバッチトレーニングを可能にするブロックワイズトレーニングアルゴリズムを開発した。
アルゴリズムは収束することが証明され、より良くなくても、見いだされた解の品質に匹敵することを示す。
論文 参考訳(メタデータ) (2021-02-10T01:19:15Z) - An optimal quantum sampling regression algorithm for variational
eigensolving in the low qubit number regime [0.0]
量子サンプリング回帰(QSR)は、代替の量子古典的アルゴリズムである。
低量子ビット数構造における時間的複雑さに基づいて,その利用事例を分析した。
ベンチマーク問題に対するアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2020-12-04T00:01:15Z) - Plug-And-Play Learned Gaussian-mixture Approximate Message Passing [71.74028918819046]
そこで本研究では,従来のi.i.d.ソースに適した圧縮圧縮センシング(CS)リカバリアルゴリズムを提案する。
我々のアルゴリズムは、Borgerdingの学習AMP(LAMP)に基づいて構築されるが、アルゴリズムに普遍的な復調関数を採用することにより、それを大幅に改善する。
数値評価により,L-GM-AMPアルゴリズムは事前の知識を必要とせず,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-11-18T16:40:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。