論文の概要: Hybrid Quantum-Classical Policy Gradient for Adaptive Control of Cyber-Physical Systems: A Comparative Study of VQC vs. MLP
- arxiv url: http://arxiv.org/abs/2510.06010v1
- Date: Tue, 07 Oct 2025 15:09:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.303477
- Title: Hybrid Quantum-Classical Policy Gradient for Adaptive Control of Cyber-Physical Systems: A Comparative Study of VQC vs. MLP
- Title(参考訳): サイバー物理システムの適応制御のためのハイブリッド量子古典政策グラディエント:VQCとMLPの比較研究
- Authors: Aueaphum Aueawatthanaphisut, Nyi Wunna Tun,
- Abstract要約: この研究は、古典的なベースラインとして多層パーセプトロン(MLP)と量子対向としてパラメータ化可変量子回路(VQC)を用いた。
実験の結果、古典的な最適政策収束は498.7 +/- 3.2の平均的なリターンで達成された。
VQCは14.6 +/-4.8のリターンを持つ限られた学習能力を示し、主に回路深度と量子ビット接続に制約された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The comparative evaluation between classical and quantum reinforcement learning (QRL) paradigms was conducted to investigate their convergence behavior, robustness under observational noise, and computational efficiency in a benchmark control environment. The study employed a multilayer perceptron (MLP) agent as a classical baseline and a parameterized variational quantum circuit (VQC) as a quantum counterpart, both trained on the CartPole-v1 environment over 500 episodes. Empirical results demonstrated that the classical MLP achieved near-optimal policy convergence with a mean return of 498.7 +/- 3.2, maintaining stable equilibrium throughout training. In contrast, the VQC exhibited limited learning capability, with an average return of 14.6 +/- 4.8, primarily constrained by circuit depth and qubit connectivity. Noise robustness analysis further revealed that the MLP policy deteriorated gracefully under Gaussian perturbations, while the VQC displayed higher sensitivity at equivalent noise levels. Despite the lower asymptotic performance, the VQC exhibited significantly lower parameter count and marginally increased training time, highlighting its potential scalability for low-resource quantum processors. The results suggest that while classical neural policies remain dominant in current control benchmarks, quantum-enhanced architectures could offer promising efficiency advantages once hardware noise and expressivity limitations are mitigated.
- Abstract(参考訳): 古典的および量子的強化学習(QRL)パラダイムの比較評価を行い,その収束挙動,観測騒音下での堅牢性,およびベンチマーク制御環境における計算効率について検討した。
この研究では、古典的なベースラインとして多層パーセプトロン(MLP)エージェントと、500回以上のCartPole-v1環境下で訓練された量子対向体としてパラメータ化変分量子回路(VQC)を使用した。
実験の結果、古典的MLPは498.7+/-3.2の平均回帰でほぼ最適の政策収束を達成し、訓練を通して安定な平衡を維持した。
対照的に、VQCは14.6 +/-4.8のリターンを持つ限られた学習能力を示し、主に回路深さと量子ビット接続に制約された。
ノイズロバスト性分析により, ガウス摂動下でMLPポリシーは良好に悪化し, VQCは等価雑音レベルにおいて高い感度を示した。
漸近的な性能は低いものの、VQCはパラメータ数を大幅に減少させ、トレーニング時間を極端に増加させ、低リソースの量子プロセッサの潜在的なスケーラビリティを強調した。
その結果、古典的なニューラルポリシーは現在の制御ベンチマークでは支配的だが、量子化アーキテクチャはハードウェアノイズと表現率の制限を緩和すれば、有望な効率性をもたらす可能性があることが示唆された。
関連論文リスト
- Quantum Reinforcement Learning-Guided Diffusion Model for Image Synthesis via Hybrid Quantum-Classical Generative Model Architectures [2.005299372367689]
本稿では,各段階でCFGを動的に調整するQRL(quantum reinforcement learning)コントローラを提案する。
コントローラは、ハイブリッド量子-古典的アクター-批判的アーキテクチャを採用する。
CIFAR-10の実験は、QRLポリシーが知覚品質を改善することを示した。
論文 参考訳(メタデータ) (2025-09-17T16:47:04Z) - Enhancing Gradient Variance and Differential Privacy in Quantum Federated Learning [5.608916223269914]
ローカルモデルとしての量子ニューラルネットワーク(QNN)は最近、注目すべき課題に直面している。
差分プライバシーを組み込んだ新しいQFL手法を提案し,専用ノイズ推定手法を提案する。
提案アルゴリズムは, 効率よく収束のバランスを保ち, 通信コストを低減し, 中間量子雑音の悪影響を軽減する。
論文 参考訳(メタデータ) (2025-09-04T15:29:52Z) - TensoMeta-VQC: A Tensor-Train-Guided Meta-Learning Framework for Robust and Scalable Variational Quantum Computing [60.996803677584424]
TensoMeta-VQCは、VQCの堅牢性とスケーラビリティを大幅に向上させるために設計された、TT誘導型メタラーニングフレームワークである。
我々のフレームワークは、量子回路パラメータの生成を古典的なTTネットワークに完全に委譲し、量子ハードウェアから最適化を効果的に分離する。
論文 参考訳(メタデータ) (2025-08-01T23:37:55Z) - VQC-MLPNet: An Unconventional Hybrid Quantum-Classical Architecture for Scalable and Robust Quantum Machine Learning [60.996803677584424]
変分量子回路(VQC)は、量子機械学習のための新しい経路を提供する。
それらの実用的応用は、制約付き線形表現性、最適化課題、量子ハードウェアノイズに対する鋭敏感といった固有の制限によって妨げられている。
この研究は、これらの障害を克服するために設計されたスケーラブルで堅牢なハイブリッド量子古典アーキテクチャであるVQC-MLPNetを導入している。
論文 参考訳(メタデータ) (2025-06-12T01:38:15Z) - PPO-Q: Proximal Policy Optimization with Parametrized Quantum Policies or Values [5.260281988042923]
PPO-Qは、PPOアルゴリズムのアクターまたは批判部分にハイブリッド量子古典的ネットワークを統合する。
PPO-Qは、訓練パラメータを著しく減らした複雑な環境において、最先端の性能を達成する。
論文 参考訳(メタデータ) (2025-01-13T06:40:40Z) - ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning [46.67828766038463]
本稿では,Q-Learning(ACL-QL)における適応保守レベル(Adaptive Conservative Level in Q-Learning, ACL-QL)を提案する。
ACL-QLは、各状態-作用ペアに対する保守的なレベルの適応的な制御を可能にする。
理論解析により,2つの学習可能な適応重み関数を用いて各遷移の保守レベルを制御する新しいアルゴリズム ACL-QL を提案する。
論文 参考訳(メタデータ) (2024-12-22T04:18:02Z) - Bayesian Quantum Amplitude Estimation [46.03321798937855]
量子振幅推定のための問題調整およびノイズ認識ベイズアルゴリズムであるBAEを提案する。
耐障害性シナリオでは、BAEはハイゼンベルク限界を飽和させることができ、デバイスノイズが存在する場合、BAEはそれを動的に特徴付け、自己適応することができる。
本稿では,振幅推定アルゴリズムのベンチマークを提案し,他の手法に対してBAEをテストする。
論文 参考訳(メタデータ) (2024-12-05T18:09:41Z) - Entanglement-enhanced optimal quantum metrology [0.7373617024876725]
本稿では,係り合いと最適化された結合相互作用を利用したQMのQOCスキームを提案する。
その結果,特定の状況下では,単一粒子のコヒーレント制御を利用したスキームが著しく制限されていることが示唆された。
論文 参考訳(メタデータ) (2024-11-06T16:08:13Z) - Pre-training Tensor-Train Networks Facilitates Machine Learning with Variational Quantum Circuits [70.97518416003358]
変分量子回路(VQC)は、ノイズの多い中間スケール量子(NISQ)デバイス上での量子機械学習を約束する。
テンソルトレインネットワーク(TTN)はVQC表現と一般化を向上させることができるが、結果として得られるハイブリッドモデルであるTTN-VQCは、Polyak-Lojasiewicz(PL)条件による最適化の課題に直面している。
この課題を軽減するために,プレトレーニングTTNモデルとVQCを組み合わせたPre+TTN-VQCを導入する。
論文 参考訳(メタデータ) (2023-05-18T03:08:18Z) - An Empirical Comparison of Optimizers for Quantum Machine Learning with
SPSA-based Gradients [1.2532932830320982]
本研究では,SPSAからの近似勾配と最先端の古典勾配を併用した新しい手法を提案する。
単純な回帰タスクにおいて、収束率と絶対誤差の点で標準SPSAとパラメータシフト則の両方に優れることを示す。
論文 参考訳(メタデータ) (2023-04-27T15:19:49Z) - Quantum circuit architecture search for variational quantum algorithms [88.71725630554758]
本稿では、QAS(Quantum Architecture Search)と呼ばれるリソースと実行時の効率的なスキームを提案する。
QASは、よりノイズの多い量子ゲートを追加することで得られる利点と副作用のバランスをとるために、自動的にほぼ最適アンサッツを求める。
数値シミュレータと実量子ハードウェアの両方に、IBMクラウドを介してQASを実装し、データ分類と量子化学タスクを実現する。
論文 参考訳(メタデータ) (2020-10-20T12:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。