論文の概要: Quantum Markov Decision Processes: General Theory, Approximations, and Classes of Policies
- arxiv url: http://arxiv.org/abs/2402.14649v2
- Date: Wed, 18 Sep 2024 09:21:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-19 23:25:58.886688
- Title: Quantum Markov Decision Processes: General Theory, Approximations, and Classes of Policies
- Title(参考訳): 量子マルコフ決定過程:一般理論、近似、政策の類
- Authors: Naci Saldi, Sina Sanjari, Serdar Yuksel,
- Abstract要約: 本稿では,新しいフレームワーク,アルゴリズム,今後の研究手法を導入することを目的とした,新しい量子MDPモデルを提案する。
われわれのアプローチは、離散時間量子制御における新しい研究方向の道を開くことを願っている。
- 参考スコア(独自算出の注目度): 1.8775413720750924
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, the aim is to develop a quantum counterpart to classical Markov decision processes (MDPs). Firstly, we provide a very general formulation of quantum MDPs with state and action spaces in the quantum domain, quantum transitions, and cost functions. Once we formulate the quantum MDP (q-MDP), our focus shifts to establishing the verification theorem that proves the sufficiency of Markovian quantum control policies and provides a dynamic programming principle. Subsequently, a comparison is drawn between our q-MDP model and previously established quantum MDP models (referred to as QOMDPs) found in the literature. Furthermore, approximations of q-MDPs are obtained via finite-action models, which can be formulated as QOMDPs. Finally, classes of open-loop and classical-state-preserving closed-loop policies for q-MDPs are introduced, along with structural results for these policies. In summary, we present a novel quantum MDP model aiming to introduce a new framework, algorithms, and future research avenues. We hope that our approach will pave the way for a new research direction in discrete-time quantum control.
- Abstract(参考訳): 本稿では,古典マルコフ決定過程(MDP)に対抗して量子的手法を開発することを目的とする。
まず、量子領域、量子遷移、コスト関数の状態と作用空間を持つ量子MDPの非常に一般的な定式化を提供する。
量子 MDP (q-MDP) を定式化すると、マルコフの量子制御ポリシーが十分であることを証明し、動的プログラミング原理を提供する検証定理の確立に焦点が移る。
その後、文献で確認されているq-MDPモデルと以前に確立された量子MDPモデル(QOMDP)の比較を行う。
さらに、Q-MDPの近似は、QOMDPとして定式化できる有限作用モデルによって得られる。
最後に、q-MDPに対するオープンループおよび古典状態保存クローズループポリシーのクラスを導入し、これらのポリシーの構造的な結果を示す。
まとめると、新しいフレームワーク、アルゴリズム、そして将来の研究方法を導入することを目的とした、新しい量子MDPモデルを提案する。
われわれのアプローチは、離散時間量子制御における新しい研究方向の道を開くことを願っている。
関連論文リスト
- Quantum Markov Decision Processes Part II: Optimal Solutions and
Algorithms [1.8775413720750924]
本論文は、古典マルコフ決定過程(MDP)に量子アナログを導入することを目的としている。
パートIIでは,オープンループポリシとクローズループポリシの両方の値関数を最適化するアルゴリズムの開発に重点を置いている。
論文 参考訳(メタデータ) (2024-02-22T16:00:21Z) - A new quantum machine learning algorithm: split hidden quantum Markov model inspired by quantum conditional master equation [14.262911696419934]
隠れ量子マルコフプロセスを実装するための分割HQMM(SHQMM)を提案する。
実験結果から,本モデルはアプリケーションの範囲やロバスト性において,従来のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-07-17T16:55:26Z) - A Framework for Demonstrating Practical Quantum Advantage: Racing
Quantum against Classical Generative Models [62.997667081978825]
生成モデルの一般化性能を評価するためのフレームワークを構築した。
古典的および量子生成モデル間の実用的量子優位性(PQA)に対する最初の比較レースを確立する。
以上の結果から,QCBMは,他の最先端の古典的生成モデルよりも,データ制限方式の方が効率的であることが示唆された。
論文 参考訳(メタデータ) (2023-03-27T22:48:28Z) - A self-consistent field approach for the variational quantum
eigensolver: orbital optimization goes adaptive [52.77024349608834]
適応微分組立問題集合型アンザッツ変分固有解法(ADAPTVQE)における自己一貫したフィールドアプローチ(SCF)を提案する。
このフレームワークは、短期量子コンピュータ上の化学系の効率的な量子シミュレーションに使用される。
論文 参考訳(メタデータ) (2022-12-21T23:15:17Z) - End-to-end resource analysis for quantum interior point methods and portfolio optimization [63.4863637315163]
問題入力から問題出力までの完全な量子回路レベルのアルゴリズム記述を提供する。
アルゴリズムの実行に必要な論理量子ビットの数と非クリフォードTゲートの量/深さを報告する。
論文 参考訳(メタデータ) (2022-11-22T18:54:48Z) - Decomposition of Matrix Product States into Shallow Quantum Circuits [62.5210028594015]
テンソルネットワーク(TN)アルゴリズムは、パラメタライズド量子回路(PQC)にマッピングできる
本稿では,現実的な量子回路を用いてTN状態を近似する新しいプロトコルを提案する。
その結果、量子回路の逐次的な成長と最適化を含む1つの特定のプロトコルが、他の全ての手法より優れていることが明らかとなった。
論文 参考訳(メタデータ) (2022-09-01T17:08:41Z) - On the design and analysis of near-term quantum network protocols using
Markov decision processes [0.9065034043031668]
マルコフ決定過程(MDP)に基づく短期量子ネットワークの理論
MDPは、短期量子ネットワークのためのプロトコルをモデル化するための正確で体系的な数学的枠組みを提供する。
新しい結果は、よく知られたメモリカットポリシーが最適であることを示している。
論文 参考訳(メタデータ) (2022-07-07T16:18:59Z) - Quantum Policy Iteration via Amplitude Estimation and Grover Search --
Towards Quantum Advantage for Reinforcement Learning [7.122914046030916]
本稿では,振幅推定とGrover検索を組み合わせた政策評価・改善手法を提案する。
最適値に到達するまで、Grover検索を用いて初期ポリシーを繰り返し改善する量子ポリシー反復法を導出する。
論文 参考訳(メタデータ) (2022-06-09T19:23:10Z) - Theory of Quantum Generative Learning Models with Maximum Mean
Discrepancy [67.02951777522547]
量子回路ボルンマシン(QCBM)と量子生成逆ネットワーク(QGAN)の学習可能性について検討する。
まず、QCBMの一般化能力を解析し、量子デバイスがターゲット分布に直接アクセスできる際の優位性を同定する。
次に、QGANの一般化誤差境界が、採用されるAnsatz、クォーディットの数、入力状態に依存することを示す。
論文 参考訳(メタデータ) (2022-05-10T08:05:59Z) - Q-Learning for MDPs with General Spaces: Convergence and Near Optimality
via Quantization under Weak Continuity [2.685668802278156]
状態と行動の量子化による標準ボレル MDP のQ-ラーニングが限界に収束することを示す。
本稿では,連続型MDPに対するQ-ラーニングの適用性について,非常に一般的な収束と近似結果を示す。
論文 参考訳(メタデータ) (2021-11-12T15:47:10Z) - State preparation and measurement in a quantum simulation of the O(3)
sigma model [65.01359242860215]
我々は,非線型O(3)シグマモデルの固定点が,格子サイトあたり2キュービットしか持たないスピンモデルの量子相転移付近で再現可能であることを示す。
本稿では,弱い結合状態と量子臨界状態の両方において,断熱的基底状態の準備が複雑になる結果を得るためにトロッター法を適用した。
非単位ランダム化シミュレーション法に基づく量子アルゴリズムの提案と解析を行う。
論文 参考訳(メタデータ) (2020-06-28T23:44:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。