論文の概要: On Quantum Natural Policy Gradients
- arxiv url: http://arxiv.org/abs/2401.08307v1
- Date: Tue, 16 Jan 2024 12:08:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 14:13:19.064161
- Title: On Quantum Natural Policy Gradients
- Title(参考訳): 量子自然政策勾配について
- Authors: Andr\'e Sequeira and Luis Paulo Santos and Luis Soares Barbosa
- Abstract要約: 本研究は、強化学習エージェントの性能向上におけるFIM(Quantum Fisher Information Matrix)の役割について考察する。
以上の結果から,量子FIMを用いたPQCエージェントは一般に近似誤差が大きくなり,従来のFIMに比べて性能が向上しないことがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: This research delves into the role of the quantum Fisher Information Matrix
(FIM) in enhancing the performance of Parameterized Quantum Circuit (PQC)-based
reinforcement learning agents. While previous studies have highlighted the
effectiveness of PQC-based policies preconditioned with the quantum FIM in
contextual bandits, its impact in broader reinforcement learning contexts, such
as Markov Decision Processes, is less clear. Through a detailed analysis of
L\"owner inequalities between quantum and classical FIMs, this study uncovers
the nuanced distinctions and implications of using each type of FIM. Our
results indicate that a PQC-based agent using the quantum FIM without
additional insights typically incurs a larger approximation error and does not
guarantee improved performance compared to the classical FIM. Empirical
evaluations in classic control benchmarks suggest even though quantum FIM
preconditioning outperforms standard gradient ascent, in general it is not
superior to classical FIM preconditioning.
- Abstract(参考訳): 本研究では,パラメータ化量子回路(pqc)を用いた強化学習エージェントの性能向上における,量子フィッシャー情報行列(fim)の役割について考察する。
これまでの研究では、文脈的帯域における量子FIMと事前条件付きPQCベースのポリシーの有効性を強調してきたが、マルコフ決定プロセスのようなより広範な強化学習コンテキストへの影響は明らかになっていない。
量子的FIMと古典的FIMの「所有者の不等式」を詳細に分析することにより、各種類のFIMを使用することのニュアンスな区別と意味を明らかにする。
以上の結果から,量子FIMを用いたPQCエージェントは一般に近似誤差が大きくなり,従来のFIMに比べて性能が向上しないことがわかった。
古典的制御ベンチマークにおける実証的な評価は、量子FIMプリコンディショニングが標準勾配上昇より優れているにもかかわらず、一般には古典的FIMプリコンディショニングよりも優れていることを示唆している。
関連論文リスト
- Generating Universal Adversarial Perturbations for Quantum Classifiers [0.0]
量子機械学習(QML)は、量子コンピューティングの能力を活用し、既存の機械学習方法論を強化することを目的として、将来的な研究分野として登場した。
近年の研究では、古典的手法と同様に、PQC(Parametrized Quantum Circuits)に基づくQMLモデルも敵の攻撃に対して脆弱であることが示されている。
量子分類器のためのUAP(Universal Adversarial Perturbations)を生成するための新しいフレームワークQuGAPを紹介する。
論文 参考訳(メタデータ) (2024-02-13T18:27:53Z) - Neural Quantum Embedding: Pushing the Limits of Quantum Supervised
Learning [0.46040036610482665]
本稿では,古典的な深層学習技術を活用し,量子埋め込みを効率的に最適化する手法であるNeural Quantum Embedding (NQE)を提案する。
NQEは経験的リスクの低いバウンダリを強化し、分類性能を大幅に改善する。
NQEの有効性を検証するため、画像データ分類のためのIBM量子デバイス上で実験を行い、0.52から0.96までの顕著な精度向上を実現した。
論文 参考訳(メタデータ) (2023-11-19T19:58:33Z) - An Empirical Comparison of Optimizers for Quantum Machine Learning with
SPSA-based Gradients [1.2532932830320982]
本研究では,SPSAからの近似勾配と最先端の古典勾配を併用した新しい手法を提案する。
単純な回帰タスクにおいて、収束率と絶対誤差の点で標準SPSAとパラメータシフト則の両方に優れることを示す。
論文 参考訳(メタデータ) (2023-04-27T15:19:49Z) - Symmetric Pruning in Quantum Neural Networks [111.438286016951]
量子ニューラルネットワーク(QNN)は、現代の量子マシンの力を発揮する。
ハンドクラフト対称アンサーゼを持つQNNは、一般に非対称アンサーゼを持つものよりも訓練性が高い。
本稿では,QNNのグローバル最適収束を定量化するために,実効量子ニューラルネットワークカーネル(EQNTK)を提案する。
論文 参考訳(メタデータ) (2022-08-30T08:17:55Z) - Twenty Years of Auxiliary-Field Quantum Monte Carlo in Quantum
Chemistry: An Overview and Assessment on Main Group Chemistry and
Bond-Breaking [0.6445605125467573]
計算量子化学の観点から,無相補助場量子モンテカルロ法の概要を述べる。
本稿では,1004個の相対エネルギーを持つ主群化学およびボンド破断問題に対する性能の数値評価を行った。
論文 参考訳(メタデータ) (2022-08-02T07:02:44Z) - Theory of Quantum Generative Learning Models with Maximum Mean
Discrepancy [67.02951777522547]
量子回路ボルンマシン(QCBM)と量子生成逆ネットワーク(QGAN)の学習可能性について検討する。
まず、QCBMの一般化能力を解析し、量子デバイスがターゲット分布に直接アクセスできる際の優位性を同定する。
次に、QGANの一般化誤差境界が、採用されるAnsatz、クォーディットの数、入力状態に依存することを示す。
論文 参考訳(メタデータ) (2022-05-10T08:05:59Z) - Tight Mutual Information Estimation With Contrastive Fenchel-Legendre
Optimization [69.07420650261649]
我々はFLOと呼ばれる新しい,シンプルで強力なコントラストMI推定器を提案する。
実証的に、我々のFLO推定器は前者の限界を克服し、より効率的に学習する。
FLOの有効性は、広範囲なベンチマークを用いて検証され、実際のMI推定におけるトレードオフも明らかにされる。
論文 参考訳(メタデータ) (2021-07-02T15:20:41Z) - Permutation Invariant Policy Optimization for Mean-Field Multi-Agent
Reinforcement Learning: A Principled Approach [128.62787284435007]
本稿では,平均場近似ポリシ最適化(MF-PPO)アルゴリズムを提案する。
我々は,MF-PPOが収束のサブ線形速度で世界的最適政策を達成することを証明した。
特に、置換不変ニューラルアーキテクチャによって引き起こされる誘導バイアスは、MF-PPOが既存の競合より優れていることを示す。
論文 参考訳(メタデータ) (2021-05-18T04:35:41Z) - Quantum circuit architecture search for variational quantum algorithms [88.71725630554758]
本稿では、QAS(Quantum Architecture Search)と呼ばれるリソースと実行時の効率的なスキームを提案する。
QASは、よりノイズの多い量子ゲートを追加することで得られる利点と副作用のバランスをとるために、自動的にほぼ最適アンサッツを求める。
数値シミュレータと実量子ハードウェアの両方に、IBMクラウドを介してQASを実装し、データ分類と量子化学タスクを実現する。
論文 参考訳(メタデータ) (2020-10-20T12:06:27Z) - Machine Learning Force Fields [54.48599172620472]
機械学習(ML)は、計算化学の多くの進歩を可能にした。
最も有望な応用の1つは、MLベースの力場(FF)の構築である。
本稿では,ML-FFの応用と,それらから得られる化学的知見について概説する。
論文 参考訳(メタデータ) (2020-10-14T13:14:14Z) - Predicting toxicity by quantum machine learning [11.696069523681178]
本研究では, 定量的構造活性相関に基づく221種類のフェノールの毒性予測のためのQMLモデルを開発した。
その結果、量子エンタングルメントによって強化されたデータエンコーディングは、従来のエンタングルよりも表現力が高いことが示唆された。
論文 参考訳(メタデータ) (2020-08-18T02:59:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。