論文の概要: Variational Quantum Rainbow Deep Q-Network for Optimizing Resource Allocation Problem
- arxiv url: http://arxiv.org/abs/2512.05946v1
- Date: Fri, 05 Dec 2025 18:43:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-13 22:40:57.141148
- Title: Variational Quantum Rainbow Deep Q-Network for Optimizing Resource Allocation Problem
- Title(参考訳): 資源配分問題の最適化のための変分量子レインボー深部Q-Network
- Authors: Truong Thanh Hung Nguyen, Truong Thinh Nguyen, Hung Cao,
- Abstract要約: 本研究では,リングトポロジー変動量子回路とレインボーDQNを統合し,量子重畳と絡み合いを利用する変分量子レインボーDQN(VQR-DQN)を提案する。
4つのHRAPベンチマークでは、VQR-DQNは26.8%の正規化されたメースパン削減とランダムなベースラインを達成した。
これらの利得は、回路表現性、絡み合い、およびポリシー品質の間の理論的接続と一致し、大規模リソース割り当てのための量子強化DRLの可能性を示す。
- 参考スコア(独自算出の注目度): 1.4312099612976772
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Resource allocation remains NP-hard due to combinatorial complexity. While deep reinforcement learning (DRL) methods, such as the Rainbow Deep Q-Network (DQN), improve scalability through prioritized replay and distributional heads, classical function approximators limit their representational power. We introduce Variational Quantum Rainbow DQN (VQR-DQN), which integrates ring-topology variational quantum circuits with Rainbow DQN to leverage quantum superposition and entanglement. We frame the human resource allocation problem (HRAP) as a Markov decision process (MDP) with combinatorial action spaces based on officer capabilities, event schedules, and transition times. On four HRAP benchmarks, VQR-DQN achieves 26.8% normalized makespan reduction versus random baselines and outperforms Double DQN and classical Rainbow DQN by 4.9-13.4%. These gains align with theoretical connections between circuit expressibility, entanglement, and policy quality, demonstrating the potential of quantum-enhanced DRL for large-scale resource allocation. Our implementation is available at: https://github.com/Analytics-Everywhere-Lab/qtrl/.
- Abstract(参考訳): 資源割り当ては組合せ複雑性のためNPハードのままである。
Rainbow Deep Q-Network(DQN)のような深層強化学習(DRL)手法は、優先順位付けされたリプレイと分散ヘッドによってスケーラビリティを向上させるが、古典関数近似器は表現力を制限する。
本研究では,リングトポロジー変動量子回路とレインボーDQNを統合し,量子重畳と絡み合いを利用する変分量子レインボーDQN(VQR-DQN)を提案する。
我々は,人的資源配分問題(HRAP)を,役員機能,イベントスケジュール,遷移時間に基づく組合せ行動空間を備えたマルコフ決定プロセス(MDP)として構成する。
4つのHRAPベンチマークで、VQR-DQNは26.8%の正規化されたメースパン削減とランダムベースラインを達成し、ダブルDQNとクラシックレインボーDQNを4.9-13.4%上回る。
これらの利得は、回路表現性、絡み合い、およびポリシー品質の間の理論的接続と一致し、大規模リソース割り当てのための量子強化DRLの可能性を示す。
私たちの実装は、https://github.com/Analytics-Everywhere-Lab/qtrl/.comで利用可能です。
関連論文リスト
- Quantum Circuit Structure Optimization for Quantum Reinforcement Learning [9.913187216180424]
強化学習により、エージェントは環境相互作用を通じて最適な政策を学ぶことができる。
量子強化学習(QRL)は、量子コンピューティングにおける重ね合わせと絡み合いを利用してこの問題に対処する。
本稿では、QRL内のPQC構造を最適化するために量子ニューラルネットワーク探索(QNAS)を統合するQRL-NASアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-07-01T09:16:58Z) - Training Hybrid Deep Quantum Neural Network for Efficient Reinforcement Learning [3.753031740069576]
量子回路は、次元が指数関数的に増加するヒルベルト空間にデータを埋め込む。
量子回路を局所的に近似する有接サロゲートqtDNNを導入する。
我々は、連続制御強化学習のためのハイブリッドディープ量子ニューラルネットワークhDQNN-TD3を設計する。
論文 参考訳(メタデータ) (2025-03-12T07:12:02Z) - SPARQ: Efficient Entanglement Distribution and Routing in Space-Air-Ground Quantum Networks [50.91365514137301]
宇宙空間量子(SPARQ)ネットワークは、シームレスなオンデマンドの絡み合い分布を提供する手段として開発された。
SPARQの複数のグラフ上でディープQネットワーク(DQN)を用いて深層強化学習フレームワークを提案し,訓練した。
通信相手間の絡み合いを確立するために,サードパーティの絡み合い分散政策を提案する。
論文 参考訳(メタデータ) (2024-09-19T16:31:37Z) - SF-DQN: Provable Knowledge Transfer using Successor Feature for Deep Reinforcement Learning [89.04776523010409]
本稿では、複数のRL問題が異なる報酬関数を持つが、基礎となる遷移力学を共有する転写強化学習(RL)問題を考察する。
この設定では、各RL問題(タスク)のQ-関数を後継特徴(SF)と報酬マッピングに分解することができる。
GPIを用いたSF-DQNの証明可能な一般化保証を用いた最初の収束解析を確立する。
論文 参考訳(メタデータ) (2024-05-24T20:30:14Z) - Quantum Imitation Learning [74.15588381240795]
本稿では、量子優位性を利用してILを高速化する量子模倣学習(QIL)を提案する。
量子行動クローニング(Q-BC)と量子生成逆模倣学習(Q-GAIL)という2つのQILアルゴリズムを開発した。
実験結果から,Q-BCとQ-GAILの両者が,従来のものと同等の性能を達成できることが判明した。
論文 参考訳(メタデータ) (2023-04-04T12:47:35Z) - QuantumNAS: Noise-Adaptive Search for Robust Quantum Circuits [26.130594925642143]
ノイズノイズは、NISQ(Noisy Intermediate-Scale Quantum)コンピュータにおける鍵となる課題である。
可変回路と量子ビットマッピングのノイズ適応型共同研究のための,最初の包括的なフレームワークであるQuantumNASを提案し,実験的に実装した。
QMLタスクでは、QuantumNASは95%以上の2クラス、85%の4クラス、実際の量子コンピュータ上での10クラスの分類精度を初めて証明した。
論文 参考訳(メタデータ) (2021-07-22T17:58:13Z) - Accelerating variational quantum algorithms with multiple quantum
processors [78.36566711543476]
変分量子アルゴリズム(VQA)は、特定の計算上の利点を得るために、短期量子マシンを利用する可能性がある。
現代のVQAは、巨大なデータを扱うために単独の量子プロセッサを使用するという伝統によって妨げられている、計算上のオーバーヘッドに悩まされている。
ここでは、この問題に対処するため、効率的な分散最適化手法であるQUDIOを考案する。
論文 参考訳(メタデータ) (2021-06-24T08:18:42Z) - Quantum agents in the Gym: a variational quantum algorithm for deep
Q-learning [0.0]
本稿では、離散的かつ連続的な状態空間に対するRLタスクを解くために使用できるパラメタライズド量子回路(PQC)のトレーニング手法を提案する。
量子Q学習エージェントのどのアーキテクチャ選択が、特定の種類の環境をうまく解決するのに最も重要であるかを検討する。
論文 参考訳(メタデータ) (2021-03-28T08:57:22Z) - SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep
Reinforcement Learning [102.78958681141577]
SUNRISEは単純な統一アンサンブル法であり、様々な非政治的な深層強化学習アルゴリズムと互換性がある。
SUNRISEは, (a) アンサンブルに基づく重み付きベルマンバックアップと, (b) 最上位の自信境界を用いて行動を選択する推論手法を統合し, 効率的な探索を行う。
論文 参考訳(メタデータ) (2020-07-09T17:08:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。