論文の概要: Formal Verification of Noisy Quantum Reinforcement Learning Policies
- arxiv url: http://arxiv.org/abs/2512.01502v1
- Date: Mon, 01 Dec 2025 10:26:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.802123
- Title: Formal Verification of Noisy Quantum Reinforcement Learning Policies
- Title(参考訳): 雑音量子強化学習法の形式的検証
- Authors: Dennis Gross,
- Abstract要約: 量子強化学習(QRL)は、シーケンシャルな意思決定ポリシーを作成するために量子効果を使用することを目的としている。
QRLポリシーは、ビットフリップ、位相フリップ、偏極誤差など、量子測定やハードウェアノイズから不確実性に直面している。
トレーニング済みQRLポリシーの解析に確率論的モデルチェックを適用する形式的検証手法であるQVerifierを導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quantum reinforcement learning (QRL) aims to use quantum effects to create sequential decision-making policies that achieve tasks more effectively than their classical counterparts. However, QRL policies face uncertainty from quantum measurements and hardware noise, such as bit-flip, phase-flip, and depolarizing errors, which can lead to unsafe behavior. Existing work offers no systematic way to verify whether trained QRL policies meet safety requirements under specific noise conditions. We introduce QVerifier, a formal verification method that applies probabilistic model checking to analyze trained QRL policies with and without modeled quantum noise. QVerifier builds a complete model of the policy-environment interaction, incorporates quantum uncertainty directly into the transition probabilities, and then checks safety properties using the Storm model checker. Experiments across multiple QRL environments show that QVerifier precisely measures how different noise models influence safety, revealing both performance degradation and cases where noise can help. By enabling rigorous safety verification before deployment, QVerifier addresses a critical need: because access to quantum hardware is expensive, pre-deployment verification is essential for any safety-critical use of QRL. QVerifier targets a potential classical-quantum sweet spot: trained QRL policies that execute efficiently on quantum hardware, yet remain tractable for classical probabilistic model checking despite being too slow for real-time classical deployment.
- Abstract(参考訳): 量子強化学習(QRL)は、量子効果を使用して、従来のものよりも効率的にタスクを実現するシーケンシャルな意思決定ポリシーを作成することを目的としている。
しかし、QRLポリシーは、ビットフリップ、位相フリップ、非分極誤差など、量子測定やハードウェアノイズから不確実性に直面し、安全でない振る舞いを引き起こす可能性がある。
既存の作業は、訓練済みQRLポリシーが特定の騒音条件下での安全要件を満たすかどうかを検証するための体系的な方法を提供していない。
QVerifierは、確率論的モデルチェックを適用して、トレーニング済みQRLポリシーをモデル化された量子ノイズを伴わずに解析する形式的検証手法である。
QVerifierは、ポリシー-環境相互作用の完全なモデルを構築し、量子不確実性を遷移確率に直接組み込んで、Stormモデルチェッカーを使用して安全性特性をチェックする。
複数のQRL環境での実験では、QVerifierは異なるノイズモデルが安全に与える影響を正確に測定し、性能劣化とノイズが役立つケースの両方を明らかにしている。
QVerifierは、デプロイ前に厳格な安全性検証を可能にすることで、重要なニーズに対処する。量子ハードウェアへのアクセスは高価であるため、QRLの安全クリティカルな使用には、事前デプロイ検証が不可欠である。
トレーニングされたQRLポリシは、量子ハードウェア上で効率的に実行されるが、リアルタイムの古典的デプロイメントには遅すぎるにもかかわらず、古典的確率的モデルチェックには適している。
関連論文リスト
- Differentially Private Federated Quantum Learning via Quantum Noise [9.540961602976965]
量子連合学習(QFL)は、生のデータ交換なしで分散量子デバイス間で量子機械学習(QML)モデルの協調トレーニングを可能にする。
QFLは、情報プライバシを損なうために共有QMLモデルの更新を悪用できる敵攻撃に対して脆弱なままである。
本稿では,QFLプロセス全体の量子モデルを保護するために量子ノイズを利用する新しいDP機構について検討する。
論文 参考訳(メタデータ) (2025-08-27T22:56:16Z) - First Experience with Real-Time Control Using Simulated VQC-Based Quantum Policies [22.395468970799993]
本稿では,量子コンピューティングのオフライン強化学習への統合について検討する。
目標は、現実の産業制御問題に量子アーキテクチャをデプロイする可能性を評価することである。
論文 参考訳(メタデータ) (2025-08-03T09:50:40Z) - VQC-MLPNet: An Unconventional Hybrid Quantum-Classical Architecture for Scalable and Robust Quantum Machine Learning [50.95799256262098]
変分量子回路(VQC)は量子機械学習を約束するが、表現性、訓練性、耐雑音性の課題に直面している。
本稿では,VQCが学習中に古典多層パーセプトロンの第一層重みを生成するハイブリッドアーキテクチャであるVQC-MLPNetを提案する。
論文 参考訳(メタデータ) (2025-06-12T01:38:15Z) - Provably Robust Training of Quantum Circuit Classifiers Against Parameter Noise [49.97673761305336]
ノイズは、信頼できる量子アルゴリズムを達成するための大きな障害である。
本稿では,パラメータ化量子回路分類器のロバスト性を高めるための雑音耐性学習理論とアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-05-24T02:51:34Z) - Bayesian Quantum Amplitude Estimation [46.03321798937855]
量子振幅推定のための問題調整およびノイズ認識ベイズアルゴリズムであるBAEを提案する。
耐障害性シナリオでは、BAEはハイゼンベルク限界を飽和させることができ、デバイスノイズが存在する場合、BAEはそれを動的に特徴付け、自己適応することができる。
本稿では,振幅推定アルゴリズムのベンチマークを提案し,他の手法に対してBAEをテストする。
論文 参考訳(メタデータ) (2024-12-05T18:09:41Z) - QuantumSEA: In-Time Sparse Exploration for Noise Adaptive Quantum
Circuits [82.50620782471485]
QuantumSEAはノイズ適応型量子回路のインタイムスパース探索である。
1)トレーニング中の暗黙の回路容量と(2)雑音の頑健さの2つの主要な目標を達成することを目的としている。
提案手法は, 量子ゲート数の半減と回路実行の2倍の時間節約で, 最先端の計算結果を確立する。
論文 参考訳(メタデータ) (2024-01-10T22:33:00Z) - Instantaneous Quantum Polynomial-Time Sampling and Verifiable Quantum Advantage: Stabilizer Scheme and Classical Security [1.5647673631415648]
安定器方式と呼ばれるIQPサンプリングプロトコルのファミリを導入する。
また,Hydden Structured Code (HSC) 問題を数学的問題として導入する。
論文 参考訳(メタデータ) (2023-08-14T14:03:33Z) - Quantum Conformal Prediction for Reliable Uncertainty Quantification in
Quantum Machine Learning [47.991114317813555]
量子モデルは暗黙の確率予測器を実装し、測定ショットを通じて各入力に対して複数のランダムな決定を生成する。
本稿では、そのようなランダム性を利用して、モデルの不確実性を確実に捉えることができる分類と回帰の両方の予測セットを定義することを提案する。
論文 参考訳(メタデータ) (2023-04-06T22:05:21Z) - Quantum circuit architecture search for variational quantum algorithms [88.71725630554758]
本稿では、QAS(Quantum Architecture Search)と呼ばれるリソースと実行時の効率的なスキームを提案する。
QASは、よりノイズの多い量子ゲートを追加することで得られる利点と副作用のバランスをとるために、自動的にほぼ最適アンサッツを求める。
数値シミュレータと実量子ハードウェアの両方に、IBMクラウドを介してQASを実装し、データ分類と量子化学タスクを実現する。
論文 参考訳(メタデータ) (2020-10-20T12:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。