論文の概要: Quantum-enhanced policy iteration on the example of a mountain car
- arxiv url: http://arxiv.org/abs/2308.08348v1
- Date: Wed, 16 Aug 2023 13:16:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-17 13:22:57.627309
- Title: Quantum-enhanced policy iteration on the example of a mountain car
- Title(参考訳): マウンテンカーの例における量子化政策の反復
- Authors: Egor E. Nuzhin, Dmitry Yudin
- Abstract要約: 本稿では,強化学習分野において広く用いられているQEPI(quantum-enhanced Policy iteration)アルゴリズムを提案する。
アルゴリズムの複雑さは、密度と(典型的には)スパースケースに対して解析される。
量子エミュレータを用いたマウンテンカーの例による数値計算の結果,開発手順を検証し,QEPI性能をベンチマークした。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Advances in the experimental demonstration of quantum processors have
provoked a surge of interest to the idea of practical implementation of quantum
computing over last years. It is expected that the use of quantum algorithms
will significantly speed up the solution to certain problems in numerical
optimization and machine learning. In this paper, we propose a quantum-enhanced
policy iteration (QEPI) algorithm as widely used in the domain of reinforcement
learning and validate it with the focus on the mountain car problem. In
practice, we elaborate on the soft version of the value iteration algorithm,
which is beneficial for policy interpretation, and discuss the stochastic
discretization technique in the context of continuous state reinforcement
learning problems for the purposes of QEPI. The complexity of the algorithm is
analyzed for dense and (typical) sparse cases. Numerical results on the example
of a mountain car with the use of a quantum emulator verify the developed
procedures and benchmark the QEPI performance.
- Abstract(参考訳): 量子プロセッサの実験的な実証の進歩は、近年、量子コンピューティングの実践的実装というアイデアに対する関心の高まりをもたらした。
量子アルゴリズムを用いることで、数値最適化や機械学習における特定の問題に対する解の大幅な高速化が期待できる。
本稿では,強化学習の分野で広く用いられているqepi(quantum-enhanced policy iteration)アルゴリズムを提案し,マウンテンカー問題に着目して検証する。
実際,政策解釈に有益である値反復アルゴリズムのソフトバージョンを詳述し,qepiを目的とし,連続状態強化学習問題の文脈における確率的離散化手法について考察した。
アルゴリズムの複雑さは、密度が高く(典型的な)スパースケースで分析される。
量子エミュレータを用いたマウンテンカーの例による数値計算の結果,開発手順を検証し,QEPI性能をベンチマークした。
関連論文リスト
- Robustness and Generalization in Quantum Reinforcement Learning via Lipschitz Regularization [2.8445375187526154]
本稿では、RegQPGアルゴリズムと呼ばれる量子ポリシー勾配アプローチの正規化バージョンを提案する。
本稿では、RegQPGによるトレーニングにより、その結果のロバスト性や一般化が向上することを示す。
論文 参考訳(メタデータ) (2024-10-28T15:20:35Z) - Quantum Subroutine for Variance Estimation: Algorithmic Design and Applications [80.04533958880862]
量子コンピューティングは、アルゴリズムを設計する新しい方法の基礎となる。
どの場の量子スピードアップが達成できるかという新たな課題が生じる。
量子サブルーチンの設計は、従来のサブルーチンよりも効率的で、新しい強力な量子アルゴリズムに固い柱を向ける。
論文 参考訳(メタデータ) (2024-02-26T09:32:07Z) - Quantum Annealing for Single Image Super-Resolution [86.69338893753886]
単一画像超解像(SISR)問題を解くために,量子コンピューティングに基づくアルゴリズムを提案する。
提案したAQCアルゴリズムは、SISRの精度を維持しつつ、古典的なアナログよりも向上したスピードアップを実現する。
論文 参考訳(メタデータ) (2023-04-18T11:57:15Z) - Quantum Computing Techniques for Multi-Knapsack Problems [1.0136953995598361]
我々は、異なる量子ソフトウェアとハードウェアツールを用いて、最も顕著で最先端の量子アルゴリズムを調査する。
本稿では,QAOA や VQE などのゲート型量子アルゴリズムについて考察し,その解法と実行時推定について概観する。
論文 参考訳(メタデータ) (2023-01-13T20:21:24Z) - Quantum Policy Gradient Algorithm with Optimized Action Decoding [1.3946033794136758]
動作選択に必要な古典的後処理を最適化するための,新しい品質指標を提案する。
この手法により,5キュービットのハードウェアデバイス上で,フルトレーニングルーチンの実行に成功した。
論文 参考訳(メタデータ) (2022-12-13T15:42:10Z) - Reducing the cost of energy estimation in the variational quantum
eigensolver algorithm with robust amplitude estimation [50.591267188664666]
量子化学と材料は、量子コンピューティングの最も有望な応用の1つである。
これらの領域における産業関連問題とそれを解決する量子アルゴリズムとの整合性については、まだ多くの研究が続けられている。
論文 参考訳(メタデータ) (2022-03-14T16:51:36Z) - Parametrized Complexity of Quantum Inspired Algorithms [0.0]
量子アルゴリズムの有望な領域は量子機械学習と量子最適化である。
近年の量子技術、特に量子ソフトウェアの発展により、研究と産業のコミュニティは量子アルゴリズムの新しい応用を見つけようとしている。
論文 参考訳(メタデータ) (2021-12-22T06:19:36Z) - Quantum algorithm for stochastic optimal stopping problems with
applications in finance [60.54699116238087]
有名な最小二乗モンテカルロ (LSM) アルゴリズムは、線形最小二乗回帰とモンテカルロシミュレーションを組み合わせることで、最適停止理論の問題を解決する。
プロセスへの量子アクセス、最適な停止時間を計算するための量子回路、モンテカルロの量子技術に基づく量子LSMを提案する。
論文 参考訳(メタデータ) (2021-11-30T12:21:41Z) - Quantum algorithms for quantum dynamics: A performance study on the
spin-boson model [68.8204255655161]
量子力学シミュレーションのための量子アルゴリズムは、伝統的に時間進化作用素のトロッター近似の実装に基づいている。
変分量子アルゴリズムは欠かせない代替手段となり、現在のハードウェア上での小規模なシミュレーションを可能にしている。
量子ゲートコストが明らかに削減されているにもかかわらず、現在の実装における変分法は量子的優位性をもたらすことはありそうにない。
論文 参考訳(メタデータ) (2021-08-09T18:00:05Z) - An optimal quantum sampling regression algorithm for variational
eigensolving in the low qubit number regime [0.0]
量子サンプリング回帰(QSR)は、代替の量子古典的アルゴリズムである。
低量子ビット数構造における時間的複雑さに基づいて,その利用事例を分析した。
ベンチマーク問題に対するアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2020-12-04T00:01:15Z) - Quantum circuit architecture search for variational quantum algorithms [88.71725630554758]
本稿では、QAS(Quantum Architecture Search)と呼ばれるリソースと実行時の効率的なスキームを提案する。
QASは、よりノイズの多い量子ゲートを追加することで得られる利点と副作用のバランスをとるために、自動的にほぼ最適アンサッツを求める。
数値シミュレータと実量子ハードウェアの両方に、IBMクラウドを介してQASを実装し、データ分類と量子化学タスクを実現する。
論文 参考訳(メタデータ) (2020-10-20T12:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。