論文の概要: Quantum Hierarchical Reinforcement Learning via Variational Quantum Circuits
- arxiv url: http://arxiv.org/abs/2605.03434v1
- Date: Tue, 05 May 2026 07:14:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.813126
- Title: Quantum Hierarchical Reinforcement Learning via Variational Quantum Circuits
- Title(参考訳): 変分量子回路による量子階層強化学習
- Authors: Yu-Ting Lee, Samuel Yen-Chi Chen, Fu-Chieh Chang,
- Abstract要約: 選択肢批判型アーキテクチャに基づくハイブリッド階層型エージェントを開発した。
このハイブリッドエージェントは、古典的成分を、特徴抽出器、オプション値関数、終端関数、およびオプション内ポリシーのために変分量子回路で置換する。
- 参考スコア(独自算出の注目度): 14.345235373434242
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reinforcement learning is one of the most challenging learning paradigms where efficacy and efficiency gains are extremely valuable. Hierarchical reinforcement learning is a variant that leverages temporal abstraction to structure decision-making. While parametrized quantum computations have shown success in non-hierarchical reinforcement learning, whether these advantages adapt to hierarchical decision-making remains a critical open question. In this work, we develop a hybrid hierarchical agent based on the option-critic architecture. This hybrid agent substitutes classical components with variational quantum circuits for feature extractors, option-value functions, termination functions, and intra-option policies. Evaluated on standard benchmarking environments, results show that a hybrid agent utilizing a quantum feature extractor can outperform classical baselines while saving up to 66\% trainable parameters. We also identify an architectural bottleneck that quantum option-value estimation severely degrades performance. Further ablation studies reveal how architectural choices of the quantum circuits affect performance. Our work establishes design principles for parameter-efficient hybrid hierarchical agents.
- Abstract(参考訳): 強化学習は、有効性と効率性が極めて価値のある、最も困難な学習パラダイムの1つである。
階層的強化学習(Hierarchical reinforcement learning)は、時間的抽象化を構造的意思決定に活用する変種である。
パラメトリフィケーション量子計算は非階層的強化学習の成功を示しているが、これらの利点が階層的決定に適応するかどうかは依然として重要な問題である。
本研究では,オプションクリティカルアーキテクチャに基づくハイブリッド階層型エージェントの開発を行う。
このハイブリッドエージェントは、古典的成分を、特徴抽出器、オプション値関数、終端関数、およびオプション内ポリシーのために変分量子回路で置換する。
標準的なベンチマーク環境で評価した結果,量子特徴抽出器を用いたハイブリッドエージェントは,最大66\%のトレーニング可能なパラメータを節約しながら,古典的ベースラインを上回り得ることがわかった。
また、量子オプション値の推定が性能を著しく低下させるというアーキテクチャ上のボトルネックも確認する。
さらなるアブレーション研究は、量子回路のアーキテクチャ的選択がパフォーマンスにどのように影響するかを明らかにしている。
本研究は,パラメータ効率のよいハイブリッド階層型エージェントの設計原理を確立する。
関連論文リスト
- Quantum LEGO Learning: A Modular Design Principle for Hybrid Artificial Intelligence [63.39968536637762]
古典的および量子的コンポーネントを再利用可能で構成可能な学習ブロックとして扱う学習フレームワークであるQuantum LEGO Learningを紹介します。
このフレームワーク内では、トレーニング済みの古典的ニューラルネットワークがフリーズ機能ブロックとして機能し、VQCはトレーニング可能な適応モジュールとして機能する。
我々は,学習誤差を近似と推定成分に分解するブロックワイズ一般化理論を開発した。
論文 参考訳(メタデータ) (2026-01-29T14:29:21Z) - Hybrid action Reinforcement Learning for quantum architecture search [22.797945771013037]
HyRLQASは、離散ゲート配置と連続パラメータ生成を統合する統合フレームワークである。
我々はHyRLQASが低エネルギー誤差とよりコンパクトな回路構造を一貫して達成していることを示す。
これらの結果は、ハイブリッドアクション強化学習が、自動およびハードウェア効率の量子回路設計への原則的な経路を提供することを示唆している。
論文 参考訳(メタデータ) (2025-11-07T04:00:24Z) - Reinforcement Learning for Quantum Network Control with Application-Driven Objectives [53.03367590211247]
動的プログラミングと強化学習は、制御戦略を最適化するための有望なツールを提供する。
非線形で微分可能な目的関数を直接最適化する新しいRLフレームワークを提案する。
我々の研究は、RLを持つ量子ネットワークにおける非線形目的関数最適化への第一歩であり、より高度なユースケースへの道を開く。
論文 参考訳(メタデータ) (2025-09-12T18:41:10Z) - On the Importance of Fundamental Properties in Quantum-Classical Machine Learning Models [0.0]
本稿では、量子回路設計が因果分類タスクにおけるハイブリッド量子古典ニューラルネットワークの性能にどのように影響するかを体系的に研究する。
このアーキテクチャは、古典的な特徴抽出のための畳み込みニューラルネットワークと、量子層として機能するパラメータ化量子回路を組み合わせる。
その結果、アンザッツ繰り返しの増加は一般化と訓練の安定性を向上させるが、利点は一定の深さを超える傾向にあることが示された。
複数軸のパウリ回転を持つエンコーディングだけが学習を成功させる一方で、より単純なマップはクラス分離性の不足や損失につながる。
論文 参考訳(メタデータ) (2025-07-14T11:18:53Z) - Provably Robust Training of Quantum Circuit Classifiers Against Parameter Noise [49.97673761305336]
ノイズは、信頼できる量子アルゴリズムを達成するための大きな障害である。
本稿では,パラメータ化量子回路分類器のロバスト性を高めるための雑音耐性学習理論とアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-05-24T02:51:34Z) - Untrained Filtering with Trained Focusing for Superior Quantum Architecture Search [14.288836269941207]
量子アーキテクチャサーチ(QAS)は、量子機械学習における根本的な課題である。
探索過程を粗大かつきめ細かい知識学習の動的交互フェーズに分解する。
QUEST-Aは,多段階の知識伝達を促進するために,知識蓄積と再利用を伴う進化的メカニズムを開発する。
論文 参考訳(メタデータ) (2024-10-31T01:57:14Z) - Bayesian Parameterized Quantum Circuit Optimization (BPQCO): A task and hardware-dependent approach [49.89480853499917]
変分量子アルゴリズム(VQA)は、最適化と機械学習問題を解決するための有望な量子代替手段として登場した。
本稿では,回路設計が2つの分類問題に対して得られる性能に与える影響を実験的に示す。
また、実量子コンピュータのシミュレーションにおいて、ノイズの存在下で得られた回路の劣化について検討する。
論文 参考訳(メタデータ) (2024-04-17T11:00:12Z) - Quantum Advantage Actor-Critic for Reinforcement Learning [5.579028648465784]
本稿では,Advantage Actor-Criticアルゴリズムと変分量子回路を組み合わせた新しい量子強化学習手法を提案する。
複数の量子アドバンテージ・アクター・クリティカル構成をよく知られたカートポール環境で実証的にテストし、連続的な状態空間を持つ制御タスクにおける我々のアプローチを評価する。
論文 参考訳(メタデータ) (2024-01-13T11:08:45Z) - Pre-training Tensor-Train Networks Facilitates Machine Learning with Variational Quantum Circuits [70.97518416003358]
変分量子回路(VQC)は、ノイズの多い中間スケール量子(NISQ)デバイス上での量子機械学習を約束する。
テンソルトレインネットワーク(TTN)はVQC表現と一般化を向上させることができるが、結果として得られるハイブリッドモデルであるTTN-VQCは、Polyak-Lojasiewicz(PL)条件による最適化の課題に直面している。
この課題を軽減するために,プレトレーニングTTNモデルとVQCを組み合わせたPre+TTN-VQCを導入する。
論文 参考訳(メタデータ) (2023-05-18T03:08:18Z) - Quantum circuit architecture search for variational quantum algorithms [88.71725630554758]
本稿では、QAS(Quantum Architecture Search)と呼ばれるリソースと実行時の効率的なスキームを提案する。
QASは、よりノイズの多い量子ゲートを追加することで得られる利点と副作用のバランスをとるために、自動的にほぼ最適アンサッツを求める。
数値シミュレータと実量子ハードウェアの両方に、IBMクラウドを介してQASを実装し、データ分類と量子化学タスクを実現する。
論文 参考訳(メタデータ) (2020-10-20T12:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。