論文の概要: Quantum Reinforcement Learning with Dynamic-Circuit Qubit Reuse and Grover-Based Trajectory Optimization
- arxiv url: http://arxiv.org/abs/2509.16002v1
- Date: Fri, 19 Sep 2025 14:11:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:11.194942
- Title: Quantum Reinforcement Learning with Dynamic-Circuit Qubit Reuse and Grover-Based Trajectory Optimization
- Title(参考訳): 動的回路量子ビット再利用とグロバーベース軌道最適化による量子強化学習
- Authors: Thet Htar Su, Shaswot Shresthamali, Masaaki Kondo,
- Abstract要約: フレームワークは状態、アクション、報酬、遷移を量子領域内で完全にエンコードする。
動的回路に基づく量子ビットの再利用と、軌跡最適化のためのグローバーのアルゴリズム。
このフレームワークは、大規模なシーケンシャルな意思決定タスクに対する量子強化学習のスケーラビリティと実践的応用を推進している。
- 参考スコア(独自算出の注目度): 0.2192057999494216
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A fully quantum reinforcement learning framework is developed that integrates a quantum Markov decision process, dynamic circuit-based qubit reuse, and Grover's algorithm for trajectory optimization. The framework encodes states, actions, rewards, and transitions entirely within the quantum domain, enabling parallel exploration of state-action sequences through superposition and eliminating classical subroutines. Dynamic circuit operations, including mid-circuit measurement and reset, allow reuse of the same physical qubits across multiple agent-environment interactions, reducing qubit requirements from 7*T to 7 for T time steps while preserving logical continuity. Quantum arithmetic computes trajectory returns, and Grover's search is applied to the superposition of these evaluated trajectories to amplify the probability of measuring those with the highest return, thereby accelerating the identification of the optimal policy. Simulations demonstrate that the dynamic-circuit-based implementation preserves trajectory fidelity while reducing qubit usage by 66 percent relative to the static design. Experimental deployment on IBM Heron-class quantum hardware confirms that the framework operates within the constraints of current quantum processors and validates the feasibility of fully quantum multi-step reinforcement learning under noisy intermediate-scale quantum conditions. This framework advances the scalability and practical application of quantum reinforcement learning for large-scale sequential decision-making tasks.
- Abstract(参考訳): 量子マルコフ決定プロセス、動的回路ベースの量子ビット再利用、軌跡最適化のためのグローバーのアルゴリズムを統合する完全量子強化学習フレームワークが開発された。
このフレームワークは状態、行動、報酬、遷移を完全に量子領域内にエンコードし、重ね合わせや古典的なサブルーチンの除去を通じて状態-作用配列の並列探索を可能にする。
中間回路の測定とリセットを含む動的回路操作は、複数のエージェント環境相互作用をまたいだ同じ物理量子ビットの再利用を可能にし、論理的連続性を保ちながら、Tの時間ステップに対して7*Tから7へのキュービット要求を低減させる。
量子算術はトラジェクタリターンを計算し、グロバーの探索はこれらの評価されたトラジェクタの重ね合わせに適用され、最も高いリターンを持つトラジェクタを測定する確率を増幅し、最適ポリシーの同定を加速する。
シミュレーションにより、動的回路に基づく実装は、軌道の忠実さを保ちながら、静的設計と比較して66%のクビット使用量を削減していることが示された。
IBM Heron級量子ハードウェア上での実験的な展開は、このフレームワークが現在の量子プロセッサの制約内で動作していることを確認し、ノイズの多い中間スケール量子条件下での完全量子多段階強化学習の実現可能性を検証する。
このフレームワークは、大規模なシーケンシャルな意思決定タスクに対する量子強化学習のスケーラビリティと実践的応用を推進している。
関連論文リスト
- Hybrid Reward-Driven Reinforcement Learning for Efficient Quantum Circuit Synthesis [0.0]
量子回路の効率的な合成のための強化学習フレームワークが導入された。
このフレームワークは、ターゲット状態に向かってエージェントを誘導する静的なドメインインフォームド報酬と、カスタマイズ可能な動的ペナルティを組み合わせたものだ。
最大7キュービットのグラフ状態準備タスクのベンチマークを行い、アルゴリズムが最小深度回路を常に発見できることを実証した。
論文 参考訳(メタデータ) (2025-07-22T14:39:20Z) - VQC-MLPNet: An Unconventional Hybrid Quantum-Classical Architecture for Scalable and Robust Quantum Machine Learning [60.996803677584424]
変分量子回路(VQC)は、量子機械学習のための新しい経路を提供する。
それらの実用的応用は、制約付き線形表現性、最適化課題、量子ハードウェアノイズに対する鋭敏感といった固有の制限によって妨げられている。
この研究は、これらの障害を克服するために設計されたスケーラブルで堅牢なハイブリッド量子古典アーキテクチャであるVQC-MLPNetを導入している。
論文 参考訳(メタデータ) (2025-06-12T01:38:15Z) - Provably Robust Training of Quantum Circuit Classifiers Against Parameter Noise [49.97673761305336]
ノイズは、信頼できる量子アルゴリズムを達成するための大きな障害である。
本稿では,パラメータ化量子回路分類器のロバスト性を高めるための雑音耐性学習理論とアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-05-24T02:51:34Z) - AC/DC: Automated Compilation for Dynamic Circuits [0.41356970190072423]
本稿では,任意の状態あるいはユニタリ演算子を自動生成する動的量子回路を生成するための新しいフレームワークを提案する。
状態準備のための動的回路の生成,長距離エンタングゲート,回路最適化,および格子シミュレーションへの動的回路の適用を実証する。
論文 参考訳(メタデータ) (2024-12-10T23:14:42Z) - A Quantum-Classical Collaborative Training Architecture Based on Quantum
State Fidelity [50.387179833629254]
我々は,コ・テンク (co-TenQu) と呼ばれる古典量子アーキテクチャを導入する。
Co-TenQuは古典的なディープニューラルネットワークを41.72%まで向上させる。
他の量子ベースの手法よりも1.9倍も優れており、70.59%少ない量子ビットを使用しながら、同様の精度を達成している。
論文 参考訳(メタデータ) (2024-02-23T14:09:41Z) - QuantumSEA: In-Time Sparse Exploration for Noise Adaptive Quantum
Circuits [82.50620782471485]
QuantumSEAはノイズ適応型量子回路のインタイムスパース探索である。
1)トレーニング中の暗黙の回路容量と(2)雑音の頑健さの2つの主要な目標を達成することを目的としている。
提案手法は, 量子ゲート数の半減と回路実行の2倍の時間節約で, 最先端の計算結果を確立する。
論文 参考訳(メタデータ) (2024-01-10T22:33:00Z) - Mapping quantum circuits to shallow-depth measurement patterns based on
graph states [0.0]
我々は,測定に基づく量子コンピューティングのためのハイブリッドシミュレーション手法を開発した。
完全可換作用素の群は完全並列、すなわち非適応的測定を用いて実装可能であることを示す。
量子テレポーテーションを用いることで、そのような回路を一定の量子深さで実装する方法について議論する。
論文 参考訳(メタデータ) (2023-11-27T19:00:00Z) - Dynamic quantum circuit compilation [11.550577505893367]
量子ハードウェアの最近の進歩は、中間回路の測定とリセットを導入し、測定量子ビットの再利用を可能にしている。
本稿では,静的量子回路を動的同値に変換するプロセスである動的量子回路コンパイルの体系的研究について述べる。
論文 参考訳(メタデータ) (2023-10-17T06:26:30Z) - On-the-fly Tailoring towards a Rational Ansatz Design for Digital
Quantum Simulations [0.0]
量子デバイスで物理的に実現可能な低深さ量子回路を開発することが不可欠である。
我々は,最適なアンサッツを動的に調整できるアンサッツ構成プロトコルを開発した。
アンザッツの構成は、エネルギーソートと演算子の可換性事前スクリーニングによって並列量子アーキテクチャで実行される可能性がある。
論文 参考訳(メタデータ) (2023-02-07T11:22:01Z) - Decomposition of Matrix Product States into Shallow Quantum Circuits [62.5210028594015]
テンソルネットワーク(TN)アルゴリズムは、パラメタライズド量子回路(PQC)にマッピングできる
本稿では,現実的な量子回路を用いてTN状態を近似する新しいプロトコルを提案する。
その結果、量子回路の逐次的な成長と最適化を含む1つの特定のプロトコルが、他の全ての手法より優れていることが明らかとなった。
論文 参考訳(メタデータ) (2022-09-01T17:08:41Z) - Synergy Between Quantum Circuits and Tensor Networks: Short-cutting the
Race to Practical Quantum Advantage [43.3054117987806]
本稿では,量子回路の初期化を最適化するために,古典計算資源を利用するスケーラブルな手法を提案する。
本手法は, PQCのトレーニング性, 性能を, 様々な問題において著しく向上させることを示す。
古典的コンピュータを用いて限られた量子資源を増強する手法を実証することにより、量子コンピューティングにおける量子と量子に着想を得たモデル間の相乗効果を実証する。
論文 参考訳(メタデータ) (2022-08-29T15:24:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。