論文の概要: Hybrid Quantum Reinforcement Learning with QAOA for Improved Vehicle Routing Optimization
- arxiv url: http://arxiv.org/abs/2605.01574v1
- Date: Sat, 02 May 2026 18:55:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.836945
- Title: Hybrid Quantum Reinforcement Learning with QAOA for Improved Vehicle Routing Optimization
- Title(参考訳): 車両ルーティング最適化のためのQAOAを用いたハイブリッド量子強化学習
- Authors: T. Satyanarayana Murthy, B. Swathi Sowmya, Santhosh Voruganti, Sai Varshini Giridi, Chaitanyya Pratap Agarwal, Vanteddu Akshitha,
- Abstract要約: 本稿では,Quantum Approximate Algorithm Optimization (QAOA) とQuantum Reinforcement Learning (QRL) を併用した新しいハイブリッド手法を提案する。
この拡張により、エージェントは学習ポリシーにおける問題固有の特定の量子相関を利用でき、ルーティングソリューション空間のよりリッチな探索が可能になる。
- 参考スコア(独自算出の注目度): 0.5131152350448099
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vehicle Routing Problem (VRP) is one of the most complex NP-hard combinatorial optimization problem in transportation and logistics that requires a dynamic solution approach. In this paper we present a new hybrid approach that combines the Quantum Approximate Optimization Algorithm (QAOA) into the QRL policy network, instead of the usual variational layers, QAOA mixing and cost Hamiltonian layers. This enhancement enables the agent to exploit problem specific particular quantum correlations when learning policies, and so richer exploration of the routing solution space. The QAOA-augmented QRL framework shows quicker convergence in training and can tackle larger VRP instances that are beyond the reach of Grover's Adaptive Search (GAS) and Quantum Reinforcement Learning (QRL) approaches. Experiments on standard VRP instances demonstrate better solutions, fewer episodes to converge and good memory usage on near term quantum hardware simulators. These findings demonstrate QAOA- integrated QRL as a viable approach to scalable, high quality quantum-assisted combinatorial optimization.
- Abstract(参考訳): 車両ルーティング問題(VRP)は、動的解法を必要とする輸送・物流において最も複雑なNPハード組合せ最適化問題の1つである。
本稿では,量子近似最適化アルゴリズム(QAOA)をQRLポリシネットワークに組み合わせた新しいハイブリッド手法を提案する。
この拡張により、エージェントは学習ポリシーにおける問題固有の特定の量子相関を利用でき、ルーティングソリューション空間のよりリッチな探索が可能になる。
QAOAで強化されたQRLフレームワークは、トレーニングにおけるより迅速な収束を示し、GroverのAdaptive Search(GAS)とQuantum Reinforcement Learning(QRL)アプローチの範囲を超えて、より大きなVRPインスタンスに取り組むことができる。
標準的なVRPインスタンスの実験では、より良いソリューション、収束するエピソードの少ないこと、短期的な量子ハードウェアシミュレータでのメモリ使用率の向上が示されている。
これらの結果から,QAOA統合QRLは,スケーラブルで高品質な量子アシスト型組合せ最適化のための有効なアプローチであることが示された。
関連論文リスト
- Hardware-Efficient Quantum Optimization for Transportation Networks via Compressed Adiabatic Evolution [1.409283414986451]
都市物流、車両のルーティング、インフラ計画といった交通システムは、複雑な制約の下で大規模な最適化問題を解く必要がある。
我々は,AQC(Approximate Quantum Compilation)を用いて,デジタル化されたアディベート進化の初期セグメントを浅部回路に圧縮するハードウェア基底型ハイブリッド量子最適化フレームワークを開発した。
その結果、中程度のプレフィックス圧縮は、特にルーティング問題に対して、実現可能な解を維持したり改善したりしながら、2ビットゲート深さを減少させることがわかった。
論文 参考訳(メタデータ) (2026-04-28T23:45:54Z) - MADQRL: Distributed Quantum Reinforcement Learning Framework for Multi-Agent Environments [25.155719953156723]
強化学習(Reinforcement Learning, RL)は、実生活のユースケースから学ぶための最も実践的な方法の1つである。
本稿では,複数のエージェントが独立して学習するQRLのための分散フレームワークを提案する。
動作と観測空間が不連続な環境でも有効であるが,妥当な近似で他のシステムにも拡張できる。
論文 参考訳(メタデータ) (2026-04-13T07:44:23Z) - Quantum Approaches to Urban Logistics: From Core QAOA to Clustered Scalability [0.0]
トラベリングセールスマン問題(TSP)は、物流や輸送に広く適用される最適化の基本的な課題である。
伝統的なアルゴリズムは、しばしば妥当な時間枠内で高品質なソリューションを作成するのに苦労する。
本研究では,ハイブリッド量子古典法である量子近似最適化アルゴリズム(QAOA)の可能性について検討する。
論文 参考訳(メタデータ) (2025-12-11T17:00:24Z) - Hybrid Learning and Optimization methods for solving Capacitated Vehicle Routing Problem [3.652509571098291]
CVRP(Capacitated Vehicle Routing Problem)は、ロジスティクスにおける基本的なNPハード問題である。
本稿では,古典的(RL-C-ALM)と量子拡張的(RL-Q-ALM)の両方のALMソルバ内でのペナルティパラメータの選択を自動化するために,深層強化学習(RL)を統合したハイブリッド最適化手法を提案する。
論文 参考訳(メタデータ) (2025-09-18T08:38:29Z) - RhoDARTS: Differentiable Quantum Architecture Search with Density Matrix Simulations [44.13836547616739]
変分量子アルゴリズム(VQA)は、ノイズ中間スケール量子(NISQ)コンピュータを活用するための有望なアプローチである。
与えられたVQA問題を効率的に解く最適な量子回路を選択することは、非自明な作業である。
量子アーキテクチャ探索(QAS)アルゴリズムは、与えられた問題に合わせた量子回路の自動生成を可能にする。
論文 参考訳(メタデータ) (2025-06-04T08:30:35Z) - Solving Large-Scale QUBO with Transferred Parameters from Multilevel QAOA of low depth [2.1215729831364887]
本稿では,QAOAパラメータを用いた高速ハイブリッドマルチレベルアルゴリズムの提案と遺伝的アルゴリズムによる強化について述べる。
その結果、短期量子デバイス上での最適化のためのスケーラブルな方法として、マルチレベルQAOAの実用可能性を強調した。
論文 参考訳(メタデータ) (2025-05-16T17:18:36Z) - Reinforcement Learning Quantum Local Search [0.0]
我々は、量子局所探索(QLS)におけるサブプロブレム選択の改善のためのエージェントを訓練するための強化学習(RL)に基づくアプローチを提案する。
提案手法は,完全連結ランダムイジング問題に対するQLSの平均近似比を効果的に向上することを示した。
論文 参考訳(メタデータ) (2023-04-13T13:07:19Z) - A Copositive Framework for Analysis of Hybrid Ising-Classical Algorithms [18.075115172621096]
本稿では,Isingソルバを用いた混合二項二次プログラムの解法におけるハイブリッドアルゴリズムの形式解析について述べる。
本稿では,ハイブリッド量子古典的切削平面アルゴリズムを用いてこの問題を解決することを提案する。
論文 参考訳(メタデータ) (2022-07-27T16:47:32Z) - Scaling Quantum Approximate Optimization on Near-term Hardware [49.94954584453379]
我々は、様々なレベルの接続性を持つハードウェアアーキテクチャのための最適化回路により、期待されるリソース要求のスケーリングを定量化する。
問題の大きさと問題グラフの次数で指数関数的に増大する。
これらの問題は、ハードウェア接続性の向上や、より少ない回路層で高い性能を達成するQAOAの変更によって緩和される可能性がある。
論文 参考訳(メタデータ) (2022-01-06T21:02:30Z) - Accelerating Quadratic Optimization with Reinforcement Learning [39.64039435793601]
強化学習は、収束を加速するためにパラメータをチューニングするためのポリシーを学ぶことができるかを示す。
我々のポリシーであるRLQPは最先端のQPソルバを最大3倍に上回ります。
RLQPは、異なるアプリケーションから異なる次元と構造を持つ以前に見られなかった問題に驚くほどよく一般化する。
論文 参考訳(メタデータ) (2021-07-22T17:59:10Z) - Sample-Efficient Automated Deep Reinforcement Learning [33.53903358611521]
本稿では、任意のオフポリティックなRLアルゴリズムをメタ最適化する、人口ベース自動RLフレームワークを提案する。
集団全体で収集した経験を共有することで,メタ最適化のサンプル効率を大幅に向上させる。
我々は,MuJoCoベンチマークスイートで人気のTD3アルゴリズムを用いたケーススタディにおいて,サンプル効率のよいAutoRLアプローチの能力を実証した。
論文 参考訳(メタデータ) (2020-09-03T10:04:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。