論文の概要: Dissecting Quantum Reinforcement Learning: A Systematic Evaluation of Key Components
- arxiv url: http://arxiv.org/abs/2511.17112v1
- Date: Fri, 21 Nov 2025 10:21:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:18.967342
- Title: Dissecting Quantum Reinforcement Learning: A Systematic Evaluation of Key Components
- Title(参考訳): 分別量子強化学習 : 鍵成分の体系的評価
- Authors: Javier Lazaro, Juan-Ignacio Vazquez, Pablo Garcia-Bringas,
- Abstract要約: 量子強化学習(QRL: Quantum Reinforcement Learning)は、量子コンピューティングと強化学習の交差点において、有望なパラダイムとして登場した。
設計上、PQCはハイブリッド量子古典モデルを作成するが、実用性はまだ不明である。
- 参考スコア(独自算出の注目度): 0.08921166277011346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Parameterised quantum circuit (PQC) based Quantum Reinforcement Learning (QRL) has emerged as a promising paradigm at the intersection of quantum computing and reinforcement learning (RL). By design, PQCs create hybrid quantum-classical models, but their practical applicability remains uncertain due to training instabilities, barren plateaus (BPs), and the difficulty of isolating the contribution of individual pipeline components. In this work, we dissect PQC based QRL architectures through a systematic experimental evaluation of three aspects recurrently identified as critical: (i) data embedding strategies, with Data Reuploading (DR) as an advanced approach; (ii) ansatz design, particularly the role of entanglement; and (iii) post-processing blocks after quantum measurement, with a focus on the underexplored Output Reuse (OR) technique. Using a unified PPO-CartPole framework, we perform controlled comparisons between hybrid and classical agents under identical conditions. Our results show that OR, though purely classical, exhibits distinct behaviour in hybrid pipelines, that DR improves trainability and stability, and that stronger entanglement can degrade optimisation, offsetting classical gains. Together, these findings provide controlled empirical evidence of the interplay between quantum and classical contributions, and establish a reproducible framework for systematic benchmarking and component-wise analysis in QRL.
- Abstract(参考訳): パラメータ化量子回路(PQC)をベースとした量子強化学習(QRL)は,量子コンピューティングと強化学習(RL)の交差において,有望なパラダイムとして登場した。
設計上、PQCはハイブリッド量子古典モデルを作成するが、トレーニングの不安定性、不毛の台地(BP)、個々のパイプラインコンポーネントの寄与を分離することの難しさにより、その実用性は依然として不確実である。
本研究では,PQCをベースとしたQRLアーキテクチャを,3つの側面を同時に重要視する体系的な実験的評価により識別する。
i) データ再ロード(DR)を先進的なアプローチとして、データ埋め込み戦略
(二 アンザッツデザイン、特に絡み合いの役割
三 量子計測後の後処理ブロックであって、未探索の出力再利用(OR)技術に重点を置いているもの。
統合されたPPO-CartPoleフレームワークを用いて、同一条件下でハイブリッドエージェントと古典エージェントの制御された比較を行う。
実験の結果,ORは古典的ではあるが,ハイブリッドパイプラインにおいて異なる挙動を示し,DRは訓練性や安定性を向上し,強い絡み合いは最適化を低下させ,古典的な利得を相殺することを示した。
これらの知見は、量子的コントリビューションと古典的コントリビューションの相互作用の制御された実証的証拠を提供し、QRLにおける系統的ベンチマークとコンポーネントワイド分析のための再現可能なフレームワークを確立する。
関連論文リスト
- Quantum Reinforcement Learning-Guided Diffusion Model for Image Synthesis via Hybrid Quantum-Classical Generative Model Architectures [2.005299372367689]
本稿では,各段階でCFGを動的に調整するQRL(quantum reinforcement learning)コントローラを提案する。
コントローラは、ハイブリッド量子-古典的アクター-批判的アーキテクチャを採用する。
CIFAR-10の実験は、QRLポリシーが知覚品質を改善することを示した。
論文 参考訳(メタデータ) (2025-09-17T16:47:04Z) - Reinforcement Learning for Quantum Network Control with Application-Driven Objectives [53.03367590211247]
動的プログラミングと強化学習は、制御戦略を最適化するための有望なツールを提供する。
非線形で微分可能な目的関数を直接最適化する新しいRLフレームワークを提案する。
我々の研究は、RLを持つ量子ネットワークにおける非線形目的関数最適化への第一歩であり、より高度なユースケースへの道を開く。
論文 参考訳(メタデータ) (2025-09-12T18:41:10Z) - Parametrized Quantum Circuit Learning for Quantum Chemical Applications [6.0891078426115826]
並列量子回路(PQC)は、複雑な機械学習問題に取り組むための有望なハイブリッドフレームワークを提供する。
本研究では,化学的に有意な2つのデータセットに対するPQCの有用性と限界について検討した。
我々は、14のデータ符号化戦略と12の変分アンセットを組み合わせた168個のPQCの包括的集合を構築し、回路上での性能を5と16の量子ビットで評価する。
論文 参考訳(メタデータ) (2025-07-10T21:35:33Z) - VQC-MLPNet: An Unconventional Hybrid Quantum-Classical Architecture for Scalable and Robust Quantum Machine Learning [50.95799256262098]
変分量子回路(VQC)は量子機械学習を約束するが、表現性、訓練性、耐雑音性の課題に直面している。
本稿では,VQCが学習中に古典多層パーセプトロンの第一層重みを生成するハイブリッドアーキテクチャであるVQC-MLPNetを提案する。
論文 参考訳(メタデータ) (2025-06-12T01:38:15Z) - Bayesian Quantum Amplitude Estimation [46.03321798937855]
量子振幅推定のための問題調整およびノイズ認識ベイズアルゴリズムであるBAEを提案する。
耐障害性シナリオでは、BAEはハイゼンベルク限界を飽和させることができ、デバイスノイズが存在する場合、BAEはそれを動的に特徴付け、自己適応することができる。
本稿では,振幅推定アルゴリズムのベンチマークを提案し,他の手法に対してBAEをテストする。
論文 参考訳(メタデータ) (2024-12-05T18:09:41Z) - Differentiable Quantum Architecture Search in Asynchronous Quantum Reinforcement Learning [3.6881738506505988]
トレーニング可能な回路パラメータと構造重み付けを可能にするために、微分可能な量子アーキテクチャ探索(DiffQAS)を提案する。
提案したDiffQAS-QRL手法は,手作業による回路アーキテクチャに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2024-07-25T17:11:00Z) - Pre-training Tensor-Train Networks Facilitates Machine Learning with Variational Quantum Circuits [70.97518416003358]
変分量子回路(VQC)は、ノイズの多い中間スケール量子(NISQ)デバイス上での量子機械学習を約束する。
テンソルトレインネットワーク(TTN)はVQC表現と一般化を向上させることができるが、結果として得られるハイブリッドモデルであるTTN-VQCは、Polyak-Lojasiewicz(PL)条件による最適化の課題に直面している。
この課題を軽減するために,プレトレーニングTTNモデルとVQCを組み合わせたPre+TTN-VQCを導入する。
論文 参考訳(メタデータ) (2023-05-18T03:08:18Z) - Evolutionary Quantum Architecture Search for Parametrized Quantum
Circuits [7.298440208725654]
本稿では,PQCモデルのための進化的量子アーキテクチャ探索フレームワークであるEQAS-PQCを紹介する。
提案手法は,ハイブリッド量子古典モデルの性能を著しく向上させることができることを示す。
論文 参考訳(メタデータ) (2022-08-23T19:47:37Z) - When BERT Meets Quantum Temporal Convolution Learning for Text
Classification in Heterogeneous Computing [75.75419308975746]
本研究は,変分量子回路に基づく垂直連合学習アーキテクチャを提案し,テキスト分類のための量子化事前学習BERTモデルの競争性能を実証する。
目的分類実験により,提案したBERT-QTCモデルにより,SnipsおよびATIS音声言語データセットの競合実験結果が得られた。
論文 参考訳(メタデータ) (2022-02-17T09:55:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。