論文の概要: On Quantum Natural Policy Gradients
- arxiv url: http://arxiv.org/abs/2401.08307v1
- Date: Tue, 16 Jan 2024 12:08:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-01-17 14:13:19.064161
- Title: On Quantum Natural Policy Gradients
- Title(参考訳): 量子自然政策勾配について
- Authors: Andr\'e Sequeira and Luis Paulo Santos and Luis Soares Barbosa
- Abstract要約: 本研究は、強化学習エージェントの性能向上におけるFIM(Quantum Fisher Information Matrix)の役割について考察する。
以上の結果から,量子FIMを用いたPQCエージェントは一般に近似誤差が大きくなり,従来のFIMに比べて性能が向上しないことがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: This research delves into the role of the quantum Fisher Information Matrix
(FIM) in enhancing the performance of Parameterized Quantum Circuit (PQC)-based
reinforcement learning agents. While previous studies have highlighted the
effectiveness of PQC-based policies preconditioned with the quantum FIM in
contextual bandits, its impact in broader reinforcement learning contexts, such
as Markov Decision Processes, is less clear. Through a detailed analysis of
L\"owner inequalities between quantum and classical FIMs, this study uncovers
the nuanced distinctions and implications of using each type of FIM. Our
results indicate that a PQC-based agent using the quantum FIM without
additional insights typically incurs a larger approximation error and does not
guarantee improved performance compared to the classical FIM. Empirical
evaluations in classic control benchmarks suggest even though quantum FIM
preconditioning outperforms standard gradient ascent, in general it is not
superior to classical FIM preconditioning.
- Abstract(参考訳): 本研究では,パラメータ化量子回路(pqc)を用いた強化学習エージェントの性能向上における,量子フィッシャー情報行列(fim)の役割について考察する。
これまでの研究では、文脈的帯域における量子FIMと事前条件付きPQCベースのポリシーの有効性を強調してきたが、マルコフ決定プロセスのようなより広範な強化学習コンテキストへの影響は明らかになっていない。
量子的FIMと古典的FIMの「所有者の不等式」を詳細に分析することにより、各種類のFIMを使用することのニュアンスな区別と意味を明らかにする。
以上の結果から,量子FIMを用いたPQCエージェントは一般に近似誤差が大きくなり,従来のFIMに比べて性能が向上しないことがわかった。
古典的制御ベンチマークにおける実証的な評価は、量子FIMプリコンディショニングが標準勾配上昇より優れているにもかかわらず、一般には古典的FIMプリコンディショニングよりも優れていることを示唆している。
関連論文リスト
- Error-mitigation aware benchmarking strategy for quantum optimization problems [3.026585988755882]
エントロピーベンチマークは有限ショット効果や量子エラーの緩和を考慮しない。
有限ショット統計とQEMによるリソースオーバーヘッドを明示的に組み込んだベンチマークフレームワークを開発した。
我々の枠組みは、推定エネルギーが既知の古典的上界と下界で定義された間隔内にあるという自信を通して量子的優位性を定量化する。
論文 参考訳(メタデータ) (2026-01-26T16:55:47Z) - Continual Quantum Architecture Search with Tensor-Train Encoding: Theory and Applications to Signal Processing [68.35481158940401]
CL-QASは連続的な量子アーキテクチャ検索フレームワークである。
振幅のエンコードと変分量子回路の忘れを犠牲にすることの課題を緩和する。
制御可能なロバスト性表現性、サンプル効率の一般化、およびバレンプラトーを使わずに滑らかな収束を実現する。
論文 参考訳(メタデータ) (2026-01-10T02:36:03Z) - Dissecting Quantum Reinforcement Learning: A Systematic Evaluation of Key Components [0.08921166277011346]
量子強化学習(QRL: Quantum Reinforcement Learning)は、量子コンピューティングと強化学習の交差点において、有望なパラダイムとして登場した。
設計上、PQCはハイブリッド量子古典モデルを作成するが、実用性はまだ不明である。
論文 参考訳(メタデータ) (2025-11-21T10:21:39Z) - Hybrid Quantum-Classical Policy Gradient for Adaptive Control of Cyber-Physical Systems: A Comparative Study of VQC vs. MLP [0.0]
この研究は、古典的なベースラインとして多層パーセプトロン(MLP)と量子対向としてパラメータ化可変量子回路(VQC)を用いた。
実験の結果、古典的な最適政策収束は498.7 +/- 3.2の平均的なリターンで達成された。
VQCは14.6 +/-4.8のリターンを持つ限られた学習能力を示し、主に回路深度と量子ビット接続に制約された。
論文 参考訳(メタデータ) (2025-10-07T15:09:29Z) - Conditional Advantage Estimation for Reinforcement Learning in Large Reasoning Models [50.84995206660551]
本研究では,条件付きアドバンテージ・エスティマティオン(CANON)を導入し,その方向を推定せずに目標距離の影響を増幅する。
エントロピーに基づくCANONは、数学推論と高複雑性論理タスクの両方において、従来手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2025-09-28T16:33:07Z) - Quantum Reinforcement Learning-Guided Diffusion Model for Image Synthesis via Hybrid Quantum-Classical Generative Model Architectures [2.005299372367689]
本稿では,各段階でCFGを動的に調整するQRL(quantum reinforcement learning)コントローラを提案する。
コントローラは、ハイブリッド量子-古典的アクター-批判的アーキテクチャを採用する。
CIFAR-10の実験は、QRLポリシーが知覚品質を改善することを示した。
論文 参考訳(メタデータ) (2025-09-17T16:47:04Z) - Reinforcement Learning for Quantum Network Control with Application-Driven Objectives [53.03367590211247]
動的プログラミングと強化学習は、制御戦略を最適化するための有望なツールを提供する。
非線形で微分可能な目的関数を直接最適化する新しいRLフレームワークを提案する。
我々の研究は、RLを持つ量子ネットワークにおける非線形目的関数最適化への第一歩であり、より高度なユースケースへの道を開く。
論文 参考訳(メタデータ) (2025-09-12T18:41:10Z) - TensoMeta-VQC: A Tensor-Train-Guided Meta-Learning Framework for Robust and Scalable Variational Quantum Computing [60.996803677584424]
TensoMeta-VQCは、VQCの堅牢性とスケーラビリティを大幅に向上させるために設計された、TT誘導型メタラーニングフレームワークである。
我々のフレームワークは、量子回路パラメータの生成を古典的なTTネットワークに完全に委譲し、量子ハードウェアから最適化を効果的に分離する。
論文 参考訳(メタデータ) (2025-08-01T23:37:55Z) - Quantum-Accelerated Neural Imputation with Large Language Models (LLMs) [0.0]
本稿では、浅い量子回路をLLMベースの計算アーキテクチャに統合する新しいフレームワークであるQuantum-UnIMPを紹介する。
ベンチマーク混合型データセットを用いた実験により, 数値特徴量(RMSE)の計算誤差を最大15.2%削減し, カテゴリー的特徴量(F1-Score)の分類精度を, 最先端の古典的手法とLLMベースの手法と比較して8.7%向上した。
論文 参考訳(メタデータ) (2025-07-11T02:00:06Z) - Q2SAR: A Quantum Multiple Kernel Learning Approach for Drug Discovery [39.58317527488534]
本研究は、QSAR分類を強化するために、量子多重カーネル学習フレームワークを成功させたことを実証する。
本手法をDYRK1Aキナーゼ阻害剤を同定するためのデータセットに適用する。
古典的なグラディエントブースティングモデルに対してQMKL-SVMをベンチマークすることにより、量子化アプローチがより優れたAUCスコアを達成することを示す。
論文 参考訳(メタデータ) (2025-06-17T19:00:47Z) - Evaluating Effects of Augmented SELFIES for Molecular Understanding Using QK-LSTM [2.348041867134616]
副作用を含む分子特性の同定は、薬物開発において決定的だが時間を要するステップである。
Simplified Molecular Line-Entry System (SMILES) の強化による古典的領域における最近の進歩
本研究は, 分子特性予測と副作用同定の促進に向けた新たな知見を提示する。
論文 参考訳(メタデータ) (2025-04-29T14:03:31Z) - Leveraging Pre-Trained Neural Networks to Enhance Machine Learning with Variational Quantum Circuits [48.33631905972908]
我々は、事前学習されたニューラルネットワークを用いて変分量子回路(VQC)を強化する革新的なアプローチを導入する。
この手法は近似誤差をキュービット数から効果的に分離し、制約条件の必要性を除去する。
我々の結果はヒトゲノム解析などの応用にまで拡張され、我々のアプローチの幅広い適用性を示している。
論文 参考訳(メタデータ) (2024-11-13T12:03:39Z) - Understanding Generalization in Quantum Machine Learning with Margins [0.46040036610482665]
本稿では,QMLモデルに対するマージンベース一般化について述べる。
このマージンに基づく計量を量子情報理論に結合することにより、QMLの一般化性能を向上する方法を実証する。
論文 参考訳(メタデータ) (2024-11-11T12:22:18Z) - Entanglement-enhanced optimal quantum metrology [0.7373617024876725]
本稿では,係り合いと最適化された結合相互作用を利用したQMのQOCスキームを提案する。
その結果,特定の状況下では,単一粒子のコヒーレント制御を利用したスキームが著しく制限されていることが示唆された。
論文 参考訳(メタデータ) (2024-11-06T16:08:13Z) - Benchmarking quantum machine learning kernel training for classification tasks [0.0]
本研究は、分類タスクの文脈における量子カーネル法に焦点を当てる。
量子カーネル推定(QKE)と量子カーネル訓練(QKT)の性能を2つの量子特徴写像と関連づけて検討する。
実験結果から、量子法は異なるデータセット間で様々な性能を示すことが明らかとなった。
論文 参考訳(メタデータ) (2024-08-17T10:53:06Z) - Quantum Markov Decision Processes: General Theory, Approximations, and Classes of Policies [1.8775413720750924]
本稿では,新しいフレームワーク,アルゴリズム,今後の研究手法を導入することを目的とした,新しい量子MDPモデルを提案する。
われわれのアプローチは、離散時間量子制御における新しい研究方向の道を開くことを願っている。
論文 参考訳(メタデータ) (2024-02-22T15:59:09Z) - Generating Universal Adversarial Perturbations for Quantum Classifiers [0.0]
量子機械学習(QML)は、量子コンピューティングの能力を活用し、既存の機械学習方法論を強化することを目的として、将来的な研究分野として登場した。
近年の研究では、古典的手法と同様に、PQC(Parametrized Quantum Circuits)に基づくQMLモデルも敵の攻撃に対して脆弱であることが示されている。
量子分類器のためのUAP(Universal Adversarial Perturbations)を生成するための新しいフレームワークQuGAPを紹介する。
論文 参考訳(メタデータ) (2024-02-13T18:27:53Z) - Symmetric Pruning in Quantum Neural Networks [111.438286016951]
量子ニューラルネットワーク(QNN)は、現代の量子マシンの力を発揮する。
ハンドクラフト対称アンサーゼを持つQNNは、一般に非対称アンサーゼを持つものよりも訓練性が高い。
本稿では,QNNのグローバル最適収束を定量化するために,実効量子ニューラルネットワークカーネル(EQNTK)を提案する。
論文 参考訳(メタデータ) (2022-08-30T08:17:55Z) - Twenty Years of Auxiliary-Field Quantum Monte Carlo in Quantum
Chemistry: An Overview and Assessment on Main Group Chemistry and
Bond-Breaking [0.6445605125467573]
計算量子化学の観点から,無相補助場量子モンテカルロ法の概要を述べる。
本稿では,1004個の相対エネルギーを持つ主群化学およびボンド破断問題に対する性能の数値評価を行った。
論文 参考訳(メタデータ) (2022-08-02T07:02:44Z) - Theory of Quantum Generative Learning Models with Maximum Mean
Discrepancy [67.02951777522547]
量子回路ボルンマシン(QCBM)と量子生成逆ネットワーク(QGAN)の学習可能性について検討する。
まず、QCBMの一般化能力を解析し、量子デバイスがターゲット分布に直接アクセスできる際の優位性を同定する。
次に、QGANの一般化誤差境界が、採用されるAnsatz、クォーディットの数、入力状態に依存することを示す。
論文 参考訳(メタデータ) (2022-05-10T08:05:59Z) - Tight Mutual Information Estimation With Contrastive Fenchel-Legendre
Optimization [69.07420650261649]
我々はFLOと呼ばれる新しい,シンプルで強力なコントラストMI推定器を提案する。
実証的に、我々のFLO推定器は前者の限界を克服し、より効率的に学習する。
FLOの有効性は、広範囲なベンチマークを用いて検証され、実際のMI推定におけるトレードオフも明らかにされる。
論文 参考訳(メタデータ) (2021-07-02T15:20:41Z) - Quantum circuit architecture search for variational quantum algorithms [88.71725630554758]
本稿では、QAS(Quantum Architecture Search)と呼ばれるリソースと実行時の効率的なスキームを提案する。
QASは、よりノイズの多い量子ゲートを追加することで得られる利点と副作用のバランスをとるために、自動的にほぼ最適アンサッツを求める。
数値シミュレータと実量子ハードウェアの両方に、IBMクラウドを介してQASを実装し、データ分類と量子化学タスクを実現する。
論文 参考訳(メタデータ) (2020-10-20T12:06:27Z) - Machine Learning Force Fields [54.48599172620472]
機械学習(ML)は、計算化学の多くの進歩を可能にした。
最も有望な応用の1つは、MLベースの力場(FF)の構築である。
本稿では,ML-FFの応用と,それらから得られる化学的知見について概説する。
論文 参考訳(メタデータ) (2020-10-14T13:14:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。